SEEK

SEEK: Segmented Embedding of Knowledge Graphs

ACL 2020

虽然目前对于KGE的研究已经很多了,但是目前的方法都存在一个问题,简单的方法模型的表达能力不够;复杂的方法参数多,复杂性高,难以应用与实际的大规模的知识图谱。

本文就考虑如何在不增加复杂度的情况下增加模型的表达能力:

  • 增加特征之间的交互
  • 保存关系的属性——对称性与不对称性
  • 设计有效的得分函数

核心方法是将实体和关系的embedding拆分为k个segment。

模型方法:

首先将实体和关系的embedding拆分为k个segment。

直接看最后的得分函数

\[ f_4(h,r,t)= \sum_{0\leq x,y< k} s_{x,y} \cdot \left \langle r_x, h_y, t_{w_{x,y}} \right \rangle \\ \]

\[ w_{x,y} = \begin{cases} y, & \mbox{if }x\mbox{ is even}, \\ (x+y)\%k, & \mbox{if }x\mbox{ is odd} \end{cases} \]

\[ s_{x,y} = \begin{cases} -1, & \mbox{if }x\mbox{ is odd and } x+y\geq k, \\ 1, & otherwise \end{cases} \\ \] 分析上面的方法,引入\(s_{x,y}\)可以建模关系的对称和不对称性,将\(h\)\(t\)互换的情况下,\(f_4(h,r,t)\)不一样。

引入\(w_{x,y}\)限制了\(t_{w_{x,y}}\),不再是所有分段的全体组合。

最终实验在FB15K,DB100K,YAGO37三个数据集下进行了实验。