FE EXAM

大規模言語モデル(LLM)

膨大なテキストで学習し、人間のような文章を生成する大規模なAIモデル

DIAGRAM
トークン化埋め込み自己注意出力
Transformer による文章生成の流れ入力テキスト「私は猫が」① トークン化単語や記号の小さな単位に分割[私][は][猫][が]② 埋め込み各トークンを数値ベクトル化[0.2, -1.3, 0.8 …]③ 自己注意機構単語同士の関係に注目し意味を理解(Self-Attention を多層で繰り返す)④ 次のトークンを確率で予測好き 0.62 / 嫌い 0.10 / いる 0.08最も確率の高い「好き」を選んで出力生成された続き「私は猫が好き」1語ずつ繰り返し生成出力を入力に戻して次の語を予測(自己回帰)自己注意機構(Self-Attention)の概念「それ」が文中のどの単語を指すかを、関連の強さ(注意の重み)で判断する見て「それ」強い注意 → 「猫」を指すと判断※ 全単語の組み合わせで関連度を計算し、文脈を捉える
解説

📌
LLMとは

大量のテキスト本・Web・記事事前学習LLM数千億の自然な文章「次の単語」を予測する力を膨大に積み上げる

大規模言語モデル(LLM=Large Language Model)とは、膨大な量のテキストで学習し、人間のような自然な文章を生成できる大規模なAIモデルのことです。LLM はテキストを生成する生成AIの一種で、ChatGPT や Claude などの対話サービスの中核を担っています。

「大規模」という言葉には2つの意味があります。
学習データが大規模:書籍・Webページ・記事など、膨大なテキストを読み込む
モデルが大規模:内部の調整つまみ(パラメータ=学習で決まる数値)が数十億〜数千億にもなる

LLM の根本的な働きは、意外にもシンプルで「文章の続きとして、次に来る単語を予測する」ことです。身近な例で言うと、スマホの予測変換を桁違いに賢くしたものと考えると分かりやすいです。「私は猫が」と入力すると「好き」を高い確率で予測する──これを1語ずつ繰り返すことで、長い文章を自然に生成します。上の図の流れがまさにこの仕組みです。

📌
Transformer・自己注意機構

ほとんどの LLM は Transformer(トランスフォーマー)という内部構造をベースにしています。その心臓部が自己注意機構(Self-Attention)です。文章を処理する大まかな流れは次の通りです。

処理の4ステップ:
① トークン化:文章を「トークン」という小さな単位(単語や記号)に分割する
② 埋め込み(Embedding):各トークンを意味を表す数値の並び(ベクトル)に変換する
③ 自己注意機構:文中の単語同士がどれだけ関係するかを計算し、文脈を理解する
④ 出力:次に来るトークンを確率で予測し、最も確からしいものを選ぶ

自己注意機構の役割を身近な例で言うと、長文を読むときに「この『それ』は何を指している?」と前の単語を見返す作業に似ています。「猫は魚を見て、それを食べた」という文で、「それ」が「魚」を指すと判断できるのは、人間が文中の単語の関係に注目しているからです。自己注意機構はすべての単語の組み合わせについて関連の強さ(注意の重み)を計算し、文脈を捉えます。

Transformer が画期的だったのは、従来の手法と違い文章を最初から順番に1語ずつ処理する必要がなく、まとめて並列に処理できる点です。これにより大量データの学習が現実的になり、LLM の急速な進化につながりました。「Transformer」「自己注意(アテンション)」「事前学習」がLLMを理解するうえでのキーワードです。

📌
代表的なモデル

LLM には、開発元ごとに代表的なモデルがあります。多くは「事前学習+微調整」という2段階で作られます。
事前学習:膨大なテキストで「言葉の一般的な使い方」を広く学ぶ
微調整(ファインチューニング):特定の目的(対話・指示への応答など)に合わせて追加学習する

モデル / サービス開発元特徴
GPT / ChatGPTOpenAI対話型サービスを世界的に普及させた
ClaudeAnthropic長文の扱い・安全性を重視
GeminiGoogle画像なども扱うマルチモーダル対応
LlamaMeta公開モデルで研究・自社利用しやすい

これらのモデルはマルチモーダル化(文章だけでなく画像・音声も扱う)が進んでいます。また、外部の最新情報を検索して回答に反映する RAG(検索拡張生成)という仕組みと組み合わせて使われることも増えています。

注意点として、LLM は事実でない内容をもっともらしく出力する「ハルシネーション」を起こすことがあります。あくまで「次の単語を確率で予測している」だけで、内容の正しさを保証しているわけではないためです。出力は人間が必ず確認・検証する運用が前提となります。

関連コンテンツ