Papers/A Text Extraction-Based Smart Knowledge Graph Composition for Integrating Lessons Learned During the Microchip Design のバックアップ(No.5)


目的

マイクロチップに関する膨大な文書をKB化し、失敗事例の検索性を向上する。

手法

構築

  • tf-idfによって文書をベクトル化
  • 1~3-gramを含む文書間関係
    • 同じ人・業者が作成した文書パターンの検出
    • tf-idfで作成したKBにノードを足す役割
      • Linking Nodesと呼ぶ
  • Linking Nodes (LN)
    • N-gramから作成されたノード
    • Nが大きいほど大きい重みがある
    • リンクノードで接続されたノード間の類似性を示す

検索

  1. 検索入力
  2. ノード検索
  3. 検索ノードから距離1のノードを base nodes とする