Entity Linking のバックアップ(No.4)


概要

Entity Linking (EL) とは、自然言語文等に記された事物に対し、該当する知識ベース (knowledge base : KB) 中のエンティティを推定する手法である。

パイプライン

  • Mention Detection
  • Entity Disambiguation
    • Candidate Selection
    • Linking Decision

エンティティ・リンキング (EL) は、文章中からエンティティとして認識すべき語句を抽出する段階 (Mention Detection) と、知識ベース中から該当するエンティティを探して曖昧さを解消する段階 (Entity Disambiguation) の2段階で行う。

Mention Detection

Entity Recognition (ER) ともいう。
文書中から、エンティティとして認識すべき語句を抽出する。

Entity Disambiguation

曖昧性解消 (Entity Disambiguation) は、知識ベース中の数多あるエンティティの中から、語句に適するエンティティを見つける段階である。
知識ベース中のエンティティは膨大であるため、語句とエンティティの組み合わせも膨大となる。これを直接計算するのは困難であるため、以下の2つの段階に分けてエンティティを決定する。

  1. Candidate Selection:知識ベース中から候補となるエンティティを選出
  2. Linking Decision:候補エンティティ集合から、語句に該当するべきエンティティを決定する。

機械学習を用いた Linking Decision

機械学習を用いた Linking Decision は以下の3つの機能っから成るモデルが多い。

  1. Context-mention Encoding:ER段階で認識されたフレーズに対し、文脈ベクトルを生成する
  2. Entity Encoding:知識ベースのエンティティをベクトル化する
  3. Entity Ranking:文脈ベクトルとエンティティベクトルから、エンティティを可能性が高い順にランク付けする。このとき、該当するエンティティが1つもない場合を取り扱う手法もある。

参考