Entity Linking のバックアップの現在との差分(No.1)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
#CONTENTS

**概要 [#Overview]
Entity Linking (EL) とは、自然言語文等に記された事物に対し、該当する知識ベース (knowledge base : KB) 中のエンティティを推定する手法である。
~Entity Linking (EL) とは、自然言語文等に記された語句に対し、該当する知識ベース ([[knowledge base]] : KB) 中のエンティティを推定する手法である。
**パイプライン [#r5d4f28f]
-Mention Detection
-Entity Disambiguation
--Candidate Selection
--Linking Decision
----
~エンティティ・リンキング (EL) は、文章中からエンティティとして認識すべき語句を抽出する段階 (Mention Detection) と、知識ベース中から該当するエンティティを探して曖昧さを解消する段階 (Entity Disambiguation) の2段階で行う。
***Mention Detection [#z67a7ca9]
Entity Recognition (ER) ともいう。
文書中から、エンティティとして認識すべき語句を抽出する。
***Entity Disambiguation [#q0f00de8]
~曖昧性解消 (Entity Disambiguation) は、知識ベース中の数多あるエンティティの中から、語句に適するエンティティを見つける段階である。
知識ベース中のエンティティは膨大であるため、語句とエンティティの組み合わせも膨大となる。これを直接計算するのは困難であるため、以下の2つの段階に分けてエンティティを決定する。

+Candidate Selection:知識ベース中から候補となるエンティティを選出
+Linking Decision:候補エンティティ集合から、語句に該当するべきエンティティを決定する。
**機械学習を用いた Linking Decision [#l39750b0]
~機械学習を用いた Linking Decision は以下の3つの機能っから成るモデルが多い。
+Context-mention Encoding:ER段階で認識されたフレーズに対し、文脈ベクトルを生成する
+Entity Encoding:知識ベースのエンティティをベクトル化する
+Entity Ranking:文脈ベクトルとエンティティベクトルから、エンティティを可能性が高い順にランク付けする。このとき、該当するエンティティが1つもない場合を取り扱う手法もある。
**参考 [#af15e025]
-[[長城沙樹, 北川博之, "時系列文書に対する効率的なエンティティリンキング", 日本データベース学会和文論文誌 , Vol.17-J, Article No.2, 2019年3月.:https://dbsj.org/journal/dbsj_journal_j/dbsj_journal_vol_17_02/]]
-[[Neural Entity Linking: A Survey of Models Based on Deep Learning&BR;Ozge Sevgili, Artem Shelmanov, Mikhail Arkhipov, Alexander Panchenko, Chris Biemann, Submitted on 31 May 2020 (v1), last revised 29 Jan 2021 (this version, v2):https://arxiv.org/abs/2006.00575]]