Entity Linking のバックアップの現在との差分(No.1)


概要


Entity Linking (EL) とは、自然言語文等に記された事物に対し、該当する知識ベース (knowledge base : KB) 中のエンティティを推定する手法である。

Entity Linking (EL) とは、自然言語文等に記された語句に対し、該当する知識ベース (knowledge base : KB) 中のエンティティを推定する手法である。

パイプライン

  • Mention Detection
  • Entity Disambiguation
    • Candidate Selection
    • Linking Decision
      • -

        エンティティ・リンキング (EL) は、文章中からエンティティとして認識すべき語句を抽出する段階 (Mention Detection) と、知識ベース中から該当するエンティティを探して曖昧さを解消する段階 (Entity Disambiguation) の2段階で行う。

Mention Detection


Entity Recognition (ER) ともいう。

文書中から、エンティティとして認識すべき語句を抽出する。

Entity Disambiguation

曖昧性解消 (Entity Disambiguation) は、知識ベース中の数多あるエンティティの中から、語句に適するエンティティを見つける段階である。


知識ベース中のエンティティは膨大であるため、語句とエンティティの組み合わせも膨大となる。これを直接計算するのは困難であるため、以下の2つの段階に分けてエンティティを決定する。
  1. Candidate Selection:知識ベース中から候補となるエンティティを選出
  2. Linking Decision:候補エンティティ集合から、語句に該当するべきエンティティを決定する。

機械学習を用いた Linking Decision

機械学習を用いた Linking Decision は以下の3つの機能っから成るモデルが多い。

  1. Context-mention Encoding:ER段階で認識されたフレーズに対し、文脈ベクトルを生成する
  2. Entity Encoding:知識ベースのエンティティをベクトル化する
  3. Entity Ranking:文脈ベクトルとエンティティベクトルから、エンティティを可能性が高い順にランク付けする。このとき、該当するエンティティが1つもない場合を取り扱う手法もある。

参考