SEEK

发表于 2021-04-16 更新于 2022-09-02 分类于 Paper ， KGE 阅读次数：本文字数： 719 阅读时长 ≈ 1 分钟

SEEK: Segmented Embedding of Knowledge Graphs

ACL 2020

虽然目前对于KGE的研究已经很多了，但是目前的方法都存在一个问题，简单的方法模型的表达能力不够；复杂的方法参数多，复杂性高，难以应用与实际的大规模的知识图谱。

本文就考虑如何在不增加复杂度的情况下增加模型的表达能力：

增加特征之间的交互
保存关系的属性——对称性与不对称性
设计有效的得分函数

核心方法是将实体和关系的embedding拆分为k个segment。

模型方法：

首先将实体和关系的embedding拆分为k个segment。

直接看最后的得分函数

\[ f_4(h,r,t)= \sum_{0\leq x,y< k} s_{x,y} \cdot \left \langle r_x, h_y, t_{w_{x,y}} \right \rangle \\ \]

\[ w_{x,y} = \begin{cases} y, & \mbox{if }x\mbox{ is even}, \\ (x+y)\%k, & \mbox{if }x\mbox{ is odd} \end{cases} \]

\[ s_{x,y} = \begin{cases} -1, & \mbox{if }x\mbox{ is odd and } x+y\geq k, \\ 1, & otherwise \end{cases} \\ \] 分析上面的方法，引入\(s_{x,y}\)可以建模关系的对称和不对称性，将\(h\)和\(t\)互换的情况下，\(f_4(h,r,t)\)不一样。

引入\(w_{x,y}\)限制了\(t_{w_{x,y}}\)，不再是所有分段的全体组合。

最终实验在FB15K，DB100K，YAGO37三个数据集下进行了实验。