knowledge base のバックアップの現在との差分(No.11)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
CENTER:|>|BGCOLOR(#ACFA58):CENTER:''knowledge base'' (KB)&BR;知識ベース|
|BGCOLOR(#E0F2F7):CENTER:カテゴリ|[[Category/Info]]|




#CONTENTS



**おもな知識ベース [#k7383538]
-Wikipedia
-知識グラフ
--YAGO
--DBpedia
--BabelNet
--NELL
--Wikidata
**知識グラフ (Knowledge Graph) [#r04e8bd9]
~知識ベースの有力な方式は知識グラフ (knowledge graph) である。これは、物事と物事を関係を表す線でつないで、ネットワークとして表現することで、知識を表現する。それぞれの「関係」は''主語・述語・目的語''のような形で表現される。
~知識ベースの有力な方式は知識グラフ (knowledge graph) である。これは、「事実」を物事と物事をつなぐ「関係」で表す。多くの物事が「関係」でつながれるため、ネットワーク状になる。それぞれの「事実」は''主語・述語・目的語''のような形で表現される。
例えば、
【Japan】―(包含地域)―【Tokyo】
のような形であり、これをトリプルと呼ぶ。

~主語 (Subject)・述語 (Object)にあたるものはエンティティ (entity) と呼ばれる。DBpedia、yago等の知識ベースでは、エンティティはURIまたはリテラル(数値・文字列等)にあたる。
知識グラフにはトリプルが多く含まれており、これらがつながることでグラフを形成する。

~エンティティ (entity) のなかでも、エンティティを分類するためのエンティティであるクラス (Class) がある。'''subClassOf'''といった述語で上下関係を示す。また、クラス分類の末端は、通常のエンティティであるインスタンス (instance) である。
//図:知識グラフの例
#twitter_embed(1386994211396886533)

~主語 (Subject)・述語 (Object)にあたるものはエンティティ (entity) あるいは頂点 (vertex) ・ノード(node)と呼ばれる。DBpedia、yago等の知識ベースでは、エンティティはURIで指し示されるリソースと、リテラル(数値・文字列等)がある。

~述語 (predicate) は関係 (relation) ・プロパティ (property)とも呼ばれ、エンティティ同士をつないでその関係を示す。

~事実 (Fact) は2つのエンティティとそれらをつなぐ関係 (relation) で成り立つ。

~このとき知識グラフ全体は、エンティティの集合&mathjax{V};、関係の集合&mathjax{R};、事実の集合&mathjax{F};からなる。

~エンティティ (entity) のなかでも、エンティティを分類するためのエンティティであるクラス (Class) がある。'''rdfs:subClassOf'''といった述語で上下関係を示す。また、クラス分類の末端は、通常のエンティティであるインスタンス (instance) である。クラスとインスタンスは'''rdf:type'''で接続される。
**知識グラフの問題 [#tda410c7]
知識グラフには、構築、補完、追加修正、利用の問題がある。

***知識グラフの補完 [#w1169fc8]
***知識グラフ補完 (Knowledge Graph Completion) [#v7ad441b]
~知識グラフは不完全であることが多いため、他の関係から類推して補完する必要がある。これを知識グラフ補完 (Knowledge Graph Completion) という。
例えば、
-「長野市が日本に属している。」
-「長野市が長野県の県庁所在地である。」
-「長野県が日本に属している。」
-「水戸市が日本に属している。」
-「水戸市が茨城県の県庁所在地である。」
という5つの事実から、
-「茨城県が日本に属している。」
という事実を推測する問題である。

***知識グラフの追加修正 [#c90d483f]
日々情報は増えていくため、知識グラフを追加修正する需要がある。このとき、以下の複数の問題が発生する。
-新たな事実を追加する(ある関係でエンティティ同士を結ぶ)
-新たなエンティティを追加する
--エンティティの重複を確認する
-新たな関係を追加する
-新たなクラスを追加する

***知識ベース応答 (Knowledge Base Question Answering) [#s1ab24f8]
知識ベースは人間には読みにくく膨大であるため、利用のためには人間の発する質問に対して応答を返す機構が必要となる。


**不確実知識ベース uncertain KGs (or UKGs) [#p6f3f9d6]
これまで説明した知識グラフは、ある事実(トリプル)について、「存在する」か「存在しない」の2つの値しか持てなかった。しかし、トリプルに対して、信用スコアを付与する手法も提案されている。
これにより、トリプル同士が競合を起こしたとき、より信用度の高いトリプルを採用する等のことが可能となる。


-[[Probabilistic Box Embeddings for Uncertain Knowledge Graph Reasoning&BR;author={Xuelu Chen and Michael Boratko and Muhao Chen and Shib Sankar Dasgupta and Xiang Lorraine Li and Andrew McCallum},&BR;year={2021}:https://arxiv.org/abs/2104.04597]]
**リンク [#ExternalLink]
-[[Knowledge Graph とはなにか&BR;Qiita|@MeguruMokkeが2019年06月27日に更新:https://qiita.com/MeguruMokke/items/e707d231d75db8057f96]]
-[[Hypergraph based Partitioning on a Distributed RDF System&BR;Xu Ming-qin, LE HieuHanh, H. Yokota|Published 2020:https://www.semanticscholar.org/paper/Hypergraph-based-Partitioning-on-a-Distributed-RDF-Ming-qin-HieuHanh/c3b966842d50eb413f2379cc9ad76d4745c35184]]
-[[YAGO 4: A Reason-able Knowledge Base&BR;Thomas Pellissier TanonEmail, Gerhard Weikum, Fabian Suchanek:https://link.springer.com/chapter/10.1007/978-3-030-49461-2_34]]
-[[自然言語文からの関係知識ベースの構築&BR;高瀬 翔, 岡崎 直観:https://www.jstage.jst.go.jp/article/jsoft/29/2/29_55/_article/-char/ja/]]
-[[Pykg2vec&BR;pypi.org:https://pypi.org/project/pykg2vec/]]
-[[英語版ウィキペディアオントロジーの構築とYAGOおよびDBpediaとの比較評価&BR;川上 時生, 森田 武史, 山口 高平, 英語版ウィキペディアオントロジーの構築とYAGOおよびDBpediaとの比較評価, 人工知能学会論文誌, 2020, 35 巻, 4 号, p. C-J32_1-14, 公開日 2020/07/01, Online ISSN 1346-8030, Print ISSN 1346-0714, https://doi.org/10.1527/tjsai.C-J32, https://www.jstage.jst.go.jp/article/tjsai/35/4/35_C-J32/_article/-char/ja, :https://www.jstage.jst.go.jp/article/tjsai/35/4/35_C-J32/_article/-char/ja/]]
-[[英語版ウィキペディアからプロパティ公理を備えたオントロジーの構築と評価&BR;川上時生,  森田武史,  山口高平|2020年:https://jglobal.jst.go.jp/detail?JGLOBAL_ID=202002246852711305]]
-[[知識グラフの要素技術とアプリケーション&BR;Fintan|2020/09/16:https://fintan.jp/?p=5873]]