Entity Linking のバックアップの現在との差分(No.1)
CONTENTS
概要
Entity Linking (EL) とは、自然言語文等に記された事物に対し、該当する知識ベース (knowledge base : KB) 中のエンティティを推定する手法である。
Entity Linking (EL) とは、自然言語文等に記された語句に対し、該当する知識ベース (knowledge base : KB) 中のエンティティを推定する手法である。
パイプライン
- Mention Detection
- Entity Disambiguation
- Candidate Selection
- Linking Decision
- -
エンティティ・リンキング (EL) は、文章中からエンティティとして認識すべき語句を抽出する段階 (Mention Detection) と、知識ベース中から該当するエンティティを探して曖昧さを解消する段階 (Entity Disambiguation) の2段階で行う。
- -
Mention Detection
Entity Recognition (ER) ともいう。
文書中から、エンティティとして認識すべき語句を抽出する。
Entity Disambiguation
曖昧性解消 (Entity Disambiguation) は、知識ベース中の数多あるエンティティの中から、語句に適するエンティティを見つける段階である。
知識ベース中のエンティティは膨大であるため、語句とエンティティの組み合わせも膨大となる。これを直接計算するのは困難であるため、以下の2つの段階に分けてエンティティを決定する。
- Candidate Selection:知識ベース中から候補となるエンティティを選出
- Linking Decision:候補エンティティ集合から、語句に該当するべきエンティティを決定する。
機械学習を用いた Linking Decision
機械学習を用いた Linking Decision は以下の3つの機能っから成るモデルが多い。
- Context-mention Encoding:ER段階で認識されたフレーズに対し、文脈ベクトルを生成する
- Entity Encoding:知識ベースのエンティティをベクトル化する
- Entity Ranking:文脈ベクトルとエンティティベクトルから、エンティティを可能性が高い順にランク付けする。このとき、該当するエンティティが1つもない場合を取り扱う手法もある。
参考
- 長城沙樹, 北川博之, "時系列文書に対する効率的なエンティティリンキング", 日本データベース学会和文論文誌 , Vol.17-J, Article No.2, 2019年3月.
- Neural Entity Linking: A Survey of Models Based on Deep Learning
Ozge Sevgili, Artem Shelmanov, Mikhail Arkhipov, Alexander Panchenko, Chris Biemann, Submitted on 31 May 2020 (v1), last revised 29 Jan 2021 (this version, v2)