Attention Mechanism のバックアップ(No.11)

Attention Mechanism
カテゴリ	Category/Info
状態	執筆中

概要
モデル（大まかな機構）
Q,V,Kなどの対象の状態・関係からの分類
正規化の方法の分類
類似度の方法の分類
リンク
巻末
- 履歴
- コメント

概要

　Attention Mechanism （注意機構）は、データのどこに注目するかを利用した機械学習のモデル。RNNには、離れた位置の情報が反映されにくいという弱点があり、これを解決するためにRNNに付け加えられる形で登場した。

　注意点を示すという性質から、自然言語処理だけでなく画像処理などにも使われる。また、RNNを利用せず、Attention Mechanism を主とした機械学習モデル (Transformer) が発明され、高性能な自然言語処理(BEAT等)の基礎となった。

モデル（大まかな機構）

文脈: \( \displaystyle \mathbf{c}_\tau= \sum_t a_{\tau t} \mathbf{v}_t = \mathbf{a}_\tau^\top V \)
つまり \( \displaystyle C= A^\top V \)
正規化: \( \displaystyle \mathbf{a}_\tau^\top = f_{norm}(\mathbf{e}_\tau^\top) \)
つまり\( \displaystyle A^\top = f_{norm}(\mathscr{E}^\top) \)
または \( \displaystyle a_{\tau t}^\top = f_{norm}(e_{\tau t}^\top) \)
類似度: \( \displaystyle \mathbf{e}_\tau^\top = f_{norm}(\mathbf{q_\tau},K) \)
つまり \( \displaystyle \mathscr{E}^\top = f_{sim}(Q,K) \)

このとき、

\( t \): \( V,K \)の縦ベクトルの番号。自然言語では単語数にあたることがある。
\( \tau \): \( Q \)の縦ベクトルの番号。
\( Q \): 分析の対象(query)。縦ベクトル\( \mathbf{q}_\tau \) を並べたものと考えてもいい。
\( V \): value。これに重み付き係数を掛けると取得すべき文脈\( c \)となる。
自然言語処理においては、入力文の個々の単語（とRNN等）から作られた縦ベクトル\( \mathbf{v}_t \)を並べたもの。
出力(output)と呼ばれることもあるが、これをそのまま出力するわけではない。
\( K \): key。これを使って分析の対象\( Q \)との関係を算出する。翻訳器ならば、\( K \)が原文から作った縦ベクトルを並べたもの、\( Q \)が今訳すべき部分の状態である。
\( V=K \)の場合が多い。
また、\( V=K=Q \)の場合はSelf-Attentionと呼ばれる。
\( \mathbf{c}_\tau \): \( \mathbf{q}_\tau \)に対する文脈。これが次のモジュールに渡される。
\( \mathbf{a}_\tau \): 重みベクトル。要素\( {a}_{\tau t} \)は\( \mathbf{v}_t \)対して定まる。

以上より、Attention のモデルは以下3つの観点から分類できる。

\( Q,V,K \)などの分析対象・状態・関係
正規化\( f_{norm} \)の方法
類似度\( f_{sim} \)の方法

Q,V,Kなどの対象の状態・関係からの分類

Source-Target Attention: \( Q \neq V=K \)の場合。

Self-Attention: \( Q=V=K \)の場合。
自然言語処理ならば、各単語間の関係の強さを取得したいときに使う。

Multi-Head Attention: 複数のAttentionを用意する。同じ単語でも位置によって関係性が異なる場合などに使う。

広告

Attention Mechanism のバックアップ(No.11)

CONTENTS

概要

モデル（大まかな機構）

Q,V,Kなどの対象の状態・関係からの分類

正規化の方法の分類

類似度の方法の分類

リンク

巻末

履歴

コメント

pcomment

広告

サイドメニュー

アクセスカウンター

掲示板

カテゴリ

recent

最新の20件

管理用

freeze

広告

CONTENTS

概要

モデル（大まかな機構）

Q,V,Kなどの対象の状態・関係からの分類

正規化の方法の分類

類似度の方法の分類

リンク

巻末

履歴

コメント

pcomment

広告

サイドメニュー

検索

アクセスカウンター

掲示板

カテゴリ

recent

最新の20件

管理用

freeze