RL RanceLee Tutorials
← Tutorialsへ戻る

大規模言語モデルとは?

AIツールは今やどこにでもあります。まったくの初心者にとって、最初の反応はよく「どこから始めればいいの?」です。この章では、まず大規模言語モデル(LLM)とは何かを説明し、次にその使い方について説明します。

AIとは何か?

最近、友達の会話を聞いていると、10のうち8つは「AI」についてかもしれません。でも、知っていましたか?今みんなが話しているAIは、数年前のAIとは同じではありません。

現在インターネットを席巻しているAIには、専門的な名前があります:生成AI(Generative AI)です。

それはどういう意味でしょうか?簡単に言うと:あなたが文を与えると、記事を生成してくれます;アイデアを与えると、画像を生成してくれます;要件を与えると、コードを書いてくれます。

それは信じられないほど賢いアシスタントのようなものです。「退職届を書いて」と言うと、実際に書いてくれます。「スーツを着た猫を描いて」と言うと、実際に描いてくれます。この「無からコンテンツを生み出す」能力が「生成的」の核心です。

私たちがよく耳にするChatGPT、Claude、DeepSeekはすべてこのカテゴリに属します。その本質は**大規模言語モデル(LLM)**であり、膨大なテキストデータを学習することで人間の言語を理解し生成することを学びます。

しかし、ここで重要な秘密があります:

AIは実際にはあなたの言っていることを「理解」しているのではなく、単に「確率を計算」しているだけです。

これは直感に反するかもしれませんが、説明しましょう:

AIに「空は何色ですか?」と尋ねると、実際に空を見上げるわけでもなく、「空」や「色」の概念を本当に理解しているわけでもありません。仕組みはこうです:

それが読んだ何億もの記事に基づいて、前のテキストが「空は何色ですか」の場合、次の単語が「青」である確率は82%、「灰色」は10%、「赤」は5%…そして最も確率の高い単語を選びます。

もっとわかりやすい例:

あなたが尋ねる:「1+1は?」

  • AIは「計算」しているのではなく、これまで見たすべてのテキストの中で、「1+1は」の後に「2」が続く確率が99.9%であることを見つけます。
  • だから「2」と答えます。

あなたが尋ねる:「良い映画を勧めて。」

  • AIは実際に映画を見たわけではありません。学習したテキストの中で、「良い映画」の後には「The Shawshank Redemption」、「Titanic」などの単語がよく続くことを分析します。
  • 確率の高いものを勧めます。

それは、世界中のすべての本を読んだ超優秀な学生のようなものですが:

  • 彼は「パリはフランスの首都です」と教えてくれます(本にそう書いてあるから)。
  • しかし、彼はパリに行ったことがなく、「首都」が何を意味するのかも知りません。
  • 彼はただ、「パリは」と言ったときに最も頻繁に続くのが「フランスの首都です」であることを覚えているだけです。

そのため、AIには奇妙な問題が発生することがあります:

  • 時々「自信満々にでたらめを言う」(存在しない事実を作り出す)。
  • 簡単な計算問題を間違えることがある(実際に計算しているわけではないので)。
  • 矛盾した答えを返すことがある(確率計算に一貫性がない)。

この「自信満々にでたらめを言う」現象には専門用語があります:ハルシネーション(幻覚)。人間が夢を見るように、AIは存在しないものを「夢見て」、それを自信満々に言います。

推論でハルシネーションを解決する方法

AIがこれほど間違いやすいなら、どうすればいいのでしょうか?科学者たちは解決策を考え出しました:AIに答える前に「考えさせる」ことです。

この技術は「思考」または「思考連鎖(Chain of Thought)」と呼ばれます。

従来のAIの仕組み:

  • 質問をする → AIが即座に答えを吐き出す。
  • 問題を見て、計算用紙に書かずに答えを口にする学生のようなもの。

推論するAI:

  • 質問をする → AIがまず「計算用紙」で計算し考えて → それから答えを出す。
  • まず手順を書き出し、確認してから最終的な答えを書く学生のようなもの。

実用的な例:

あなたが尋ねる:「Xiao Mingは15個のリンゴを持っています。彼はXiao Hongに3個あげて、さらに8個買いました。今何個持っていますか?」

従来のAIは:

  • 数字「15、3、8」を見る。
  • 確率に基づいて、足し算すべきだと考える。
  • 答え:「26」(間違い!)

推論するAIは:

  • まず分析:「Xiao Mingは最初に15個持っている。」
  • 「Xiao Hongに3個あげたので、15-3=12。」
  • 「さらに8個買ったので、12+8=20。」
  • 最終的に答え:「20」(正解!)

推論の利点:

  1. ハルシネーションを減らす - AIが自分の考えを「チェック」するため、でたらめを言う可能性が低くなる。
  2. より厳密な論理 - ステップを飛ばさずに段階的に導き出す。
  3. 説明可能 - AIがどのように考えているかを見ることができる(ただし、ほとんどの場合この思考プロセスは隠されている)。
  4. 複雑な問題を処理 - 複数ステップの推論が必要な問題で精度が大幅に向上する。

しかし、推論にはコストもあります:

  • 速度が遅い(「考える」必要があるため)。
  • コストが高い(より多くの計算が必要)。
  • すべての問題に推論が必要なわけではない(例えば「こんにちは」に半日考える必要はない)。

現在、ほとんどのAIにはこの推論能力が追加されています。例えば、ChatGPTの思考モデル、DeepSeekの深層思考モードなど。

簡単なまとめ:

  • 通常のAI = すぐに答えを口にする学生(間違っている可能性あり)。
  • 推論AI = 計算用紙で慎重に作業する学生(精度が高い)。

これはAIが本当に「考えられる」という意味ではなく、確率計算の前にいくつかの検証ステップを追加するだけです。しかし効果は明らかで、ハルシネーションが減り、より信頼性の高い回答が得られます。

最も適切な例えを使うと:生成AIは、無数の本を読み、世界を見てきた「超優秀な文系学生」のようなものです。 何でも質問でき、チャットしてくれたり、文章を書くのを手伝ってくれたりします。しかし、知識を本当に理解するのではなく、「問題集を暗記」して答えています。新しいバージョンでは「計算用紙を使う」ことを学び始めています。


実は、AIの家族は巨大です

多くの人はAIはChatGPTだけだと思っていますが、そうではありません。AIの家族には多くのメンバーがいます:

1. 認識AI - はっきりと見るもの

  • 顔認識(スマホのロック解除、顔認証決済)
  • 画像認識(写真で花を識別、テキスト認識)
  • 音声認識(Siri、小愛があなたの音声を理解)
  • これらのAIは「認識」に特化しており、「創造」ではありません。

2. 推薦AI - あなたの心を最もよく知るもの

  • 抖音(Douyin/TikTok)が動画を推薦する。
  • 淘宝(Taobao)が商品を推薦する。
  • 網易雲音楽(NetEase Cloud Music)が曲を推薦する。
  • これらは「あなたの好みを推測する」のが得意ですが、新しいコンテンツは生成しません。

3. 決定AI - チェスやゲームが得意なもの

  • AlphaGo(囲碁をプレイ)
  • ゲームAI(スタークラフトのコンピュータ対戦相手など)
  • これらは「意思決定」に焦点を当てており、特定の領域で人間を超えています。

4. 生成AI - 現在のホットな波

  • テキスト生成:ChatGPT、Claude、DeepSeek
  • 画像生成:Midjourney、Stable Diffusion、DALL-E
  • 動画生成:Sora、Runway
  • 音楽生成:Suno、Udio

まとめ

簡単なまとめ:AIを道具箱に例えると、認識AIは「虫眼鏡」、推薦AIは「コンパス」、決定AIは「棋譜」、そして生成AIは「魔法の杖」です—あなたが欲しいものを呼び出すことができます。

しかし、この「魔法の杖」は実際には「確率計算機」です。強力ですが、全能ではありません。そしてこのチュートリアルは、主にこの「魔法の杖」をうまく使う方法についてです。