第8回　🔍 ChatGPTが文脈を読み取る力の正体「注意機構（Self-Attention）」とは？

ChatGPTが「意味の通った文章」を作れる秘密の一つが、この“注意機構（Self-Attention）”です。今回は、この少し難しそうな言葉を、たとえ話や図解的なイメージでわかりやすくご紹介します！

従来のAIは「単語の順番」を重視するだけでしたが、Self-Attentionでは、

「この単語は、他のどの単語と強く関係しているか？」 をすべての単語同士で計算します。

📝 例：「彼は昨日、公園で犬と遊んだ。」 →「犬」は「遊んだ」に強く関係していると判断され、重みづけされる。

各単語が、他の単語にどれだけ注意を向けるかは「重み（attention weight）」として数値化されます。

📊 例（”犬”に注目したとき）：

このように、文の中で意味的に重要な単語に「より注意を向ける」ように設計されているのがSelf-Attentionです。

Self-Attentionでは、

というプロセスを**何層にもわたって繰り返します。

だからこそ、ChatGPTは：

前回紹介した「分散表現」は、単語に“初期の意味ベクトル”を与える技術でした。

🧬 Self-Attentionは、そのベクトルを文脈に応じて動的に変化させる仕組みです。

これにより、同じ単語でも：

注意機構（Self-Attention）とは： 文中の単語同士の関係性をすべて計算し、“文脈に合った意味”を動的に構築する仕組み。

ChatGPTの「文脈を理解したような出力」は、この仕組みがあってこそ成り立っています。

次回は、この注意機構を支える「位置エンコーディング」について、わかりやすく解説します！