大規模言語モデルとは？

AIツールは今やどこにでもあります。まったくの初心者にとって、最初の反応はよく「どこから始めればいいの？」です。この章では、まず大規模言語モデル（LLM）とは何かを説明し、次にその使い方について説明します。

AIとは何か？

最近、友達の会話を聞いていると、10のうち8つは「AI」についてかもしれません。でも、知っていましたか？今みんなが話しているAIは、数年前のAIとは同じではありません。

現在インターネットを席巻しているAIには、専門的な名前があります：生成AI（Generative AI）です。

それはどういう意味でしょうか？簡単に言うと：あなたが文を与えると、記事を生成してくれます；アイデアを与えると、画像を生成してくれます；要件を与えると、コードを書いてくれます。

それは信じられないほど賢いアシスタントのようなものです。「退職届を書いて」と言うと、実際に書いてくれます。「スーツを着た猫を描いて」と言うと、実際に描いてくれます。この「無からコンテンツを生み出す」能力が「生成的」の核心です。

私たちがよく耳にするChatGPT、Claude、DeepSeekはすべてこのカテゴリに属します。その本質は**大規模言語モデル（LLM）**であり、膨大なテキストデータを学習することで人間の言語を理解し生成することを学びます。

しかし、ここで重要な秘密があります：

AIは実際にはあなたの言っていることを「理解」しているのではなく、単に「確率を計算」しているだけです。

これは直感に反するかもしれませんが、説明しましょう：

AIに「空は何色ですか？」と尋ねると、実際に空を見上げるわけでもなく、「空」や「色」の概念を本当に理解しているわけでもありません。仕組みはこうです：

それが読んだ何億もの記事に基づいて、前のテキストが「空は何色ですか」の場合、次の単語が「青」である確率は82％、「灰色」は10％、「赤」は5％…そして最も確率の高い単語を選びます。

もっとわかりやすい例：

あなたが尋ねる：「1+1は？」

AIは「計算」しているのではなく、これまで見たすべてのテキストの中で、「1+1は」の後に「2」が続く確率が99.9％であることを見つけます。
だから「2」と答えます。

あなたが尋ねる：「良い映画を勧めて。」

AIは実際に映画を見たわけではありません。学習したテキストの中で、「良い映画」の後には「The Shawshank Redemption」、「Titanic」などの単語がよく続くことを分析します。
確率の高いものを勧めます。

それは、世界中のすべての本を読んだ超優秀な学生のようなものですが：

彼は「パリはフランスの首都です」と教えてくれます（本にそう書いてあるから）。
しかし、彼はパリに行ったことがなく、「首都」が何を意味するのかも知りません。
彼はただ、「パリは」と言ったときに最も頻繁に続くのが「フランスの首都です」であることを覚えているだけです。

そのため、AIには奇妙な問題が発生することがあります：

時々「自信満々にでたらめを言う」（存在しない事実を作り出す）。
簡単な計算問題を間違えることがある（実際に計算しているわけではないので）。
矛盾した答えを返すことがある（確率計算に一貫性がない）。

この「自信満々にでたらめを言う」現象には専門用語があります：ハルシネーション（幻覚）。人間が夢を見るように、AIは存在しないものを「夢見て」、それを自信満々に言います。

推論でハルシネーションを解決する方法

AIがこれほど間違いやすいなら、どうすればいいのでしょうか？科学者たちは解決策を考え出しました：AIに答える前に「考えさせる」ことです。

この技術は「思考」または「思考連鎖（Chain of Thought）」と呼ばれます。

従来のAIの仕組み：

質問をする → AIが即座に答えを吐き出す。
問題を見て、計算用紙に書かずに答えを口にする学生のようなもの。

推論するAI：

質問をする → AIがまず「計算用紙」で計算し考えて → それから答えを出す。
まず手順を書き出し、確認してから最終的な答えを書く学生のようなもの。

実用的な例：

あなたが尋ねる：「Xiao Mingは15個のリンゴを持っています。彼はXiao Hongに3個あげて、さらに8個買いました。今何個持っていますか？」

従来のAIは：

数字「15、3、8」を見る。
確率に基づいて、足し算すべきだと考える。
答え：「26」（間違い！）

推論するAIは：

まず分析：「Xiao Mingは最初に15個持っている。」
「Xiao Hongに3個あげたので、15-3=12。」
「さらに8個買ったので、12+8=20。」
最終的に答え：「20」（正解！）

推論の利点：

ハルシネーションを減らす - AIが自分の考えを「チェック」するため、でたらめを言う可能性が低くなる。
より厳密な論理 - ステップを飛ばさずに段階的に導き出す。
説明可能 - AIがどのように考えているかを見ることができる（ただし、ほとんどの場合この思考プロセスは隠されている）。
複雑な問題を処理 - 複数ステップの推論が必要な問題で精度が大幅に向上する。

しかし、推論にはコストもあります：

速度が遅い（「考える」必要があるため）。
コストが高い（より多くの計算が必要）。
すべての問題に推論が必要なわけではない（例えば「こんにちは」に半日考える必要はない）。

現在、ほとんどのAIにはこの推論能力が追加されています。例えば、ChatGPTの思考モデル、DeepSeekの深層思考モードなど。

簡単なまとめ：

通常のAI = すぐに答えを口にする学生（間違っている可能性あり）。
推論AI = 計算用紙で慎重に作業する学生（精度が高い）。

これはAIが本当に「考えられる」という意味ではなく、確率計算の前にいくつかの検証ステップを追加するだけです。しかし効果は明らかで、ハルシネーションが減り、より信頼性の高い回答が得られます。

最も適切な例えを使うと：生成AIは、無数の本を読み、世界を見てきた「超優秀な文系学生」のようなものです。 何でも質問でき、チャットしてくれたり、文章を書くのを手伝ってくれたりします。しかし、知識を本当に理解するのではなく、「問題集を暗記」して答えています。新しいバージョンでは「計算用紙を使う」ことを学び始めています。

実は、AIの家族は巨大です

多くの人はAIはChatGPTだけだと思っていますが、そうではありません。AIの家族には多くのメンバーがいます：

1. 認識AI - はっきりと見るもの

顔認識（スマホのロック解除、顔認証決済）
画像認識（写真で花を識別、テキスト認識）
音声認識（Siri、小愛があなたの音声を理解）
これらのAIは「認識」に特化しており、「創造」ではありません。

2. 推薦AI - あなたの心を最もよく知るもの

抖音（Douyin/TikTok）が動画を推薦する。
淘宝（Taobao）が商品を推薦する。
網易雲音楽（NetEase Cloud Music）が曲を推薦する。
これらは「あなたの好みを推測する」のが得意ですが、新しいコンテンツは生成しません。

3. 決定AI - チェスやゲームが得意なもの

AlphaGo（囲碁をプレイ）
ゲームAI（スタークラフトのコンピュータ対戦相手など）
これらは「意思決定」に焦点を当てており、特定の領域で人間を超えています。

4. 生成AI - 現在のホットな波

テキスト生成：ChatGPT、Claude、DeepSeek
画像生成：Midjourney、Stable Diffusion、DALL-E
動画生成：Sora、Runway
音楽生成：Suno、Udio

まとめ

簡単なまとめ：AIを道具箱に例えると、認識AIは「虫眼鏡」、推薦AIは「コンパス」、決定AIは「棋譜」、そして生成AIは「魔法の杖」です—あなたが欲しいものを呼び出すことができます。

しかし、この「魔法の杖」は実際には「確率計算機」です。強力ですが、全能ではありません。そしてこのチュートリアルは、主にこの「魔法の杖」をうまく使う方法についてです。