AIツールは今やどこにでもあります。まったくの初心者にとって、最初の反応はよく「どこから始めればいいの?」です。この章では、まず大規模言語モデル(LLM)とは何かを説明し、次にその使い方について説明します。
AIとは何か?
最近、友達の会話を聞いていると、10のうち8つは「AI」についてかもしれません。でも、知っていましたか?今みんなが話しているAIは、数年前のAIとは同じではありません。
現在インターネットを席巻しているAIには、専門的な名前があります:生成AI(Generative AI)です。
それはどういう意味でしょうか?簡単に言うと:あなたが文を与えると、記事を生成してくれます;アイデアを与えると、画像を生成してくれます;要件を与えると、コードを書いてくれます。
それは信じられないほど賢いアシスタントのようなものです。「退職届を書いて」と言うと、実際に書いてくれます。「スーツを着た猫を描いて」と言うと、実際に描いてくれます。この「無からコンテンツを生み出す」能力が「生成的」の核心です。
私たちがよく耳にするChatGPT、Claude、DeepSeekはすべてこのカテゴリに属します。その本質は**大規模言語モデル(LLM)**であり、膨大なテキストデータを学習することで人間の言語を理解し生成することを学びます。
しかし、ここで重要な秘密があります:
AIは実際にはあなたの言っていることを「理解」しているのではなく、単に「確率を計算」しているだけです。
これは直感に反するかもしれませんが、説明しましょう:
AIに「空は何色ですか?」と尋ねると、実際に空を見上げるわけでもなく、「空」や「色」の概念を本当に理解しているわけでもありません。仕組みはこうです:
それが読んだ何億もの記事に基づいて、前のテキストが「空は何色ですか」の場合、次の単語が「青」である確率は82%、「灰色」は10%、「赤」は5%…そして最も確率の高い単語を選びます。
もっとわかりやすい例:
あなたが尋ねる:「1+1は?」
- AIは「計算」しているのではなく、これまで見たすべてのテキストの中で、「1+1は」の後に「2」が続く確率が99.9%であることを見つけます。
- だから「2」と答えます。
あなたが尋ねる:「良い映画を勧めて。」
- AIは実際に映画を見たわけではありません。学習したテキストの中で、「良い映画」の後には「The Shawshank Redemption」、「Titanic」などの単語がよく続くことを分析します。
- 確率の高いものを勧めます。
それは、世界中のすべての本を読んだ超優秀な学生のようなものですが:
- 彼は「パリはフランスの首都です」と教えてくれます(本にそう書いてあるから)。
- しかし、彼はパリに行ったことがなく、「首都」が何を意味するのかも知りません。
- 彼はただ、「パリは」と言ったときに最も頻繁に続くのが「フランスの首都です」であることを覚えているだけです。
そのため、AIには奇妙な問題が発生することがあります:
- 時々「自信満々にでたらめを言う」(存在しない事実を作り出す)。
- 簡単な計算問題を間違えることがある(実際に計算しているわけではないので)。
- 矛盾した答えを返すことがある(確率計算に一貫性がない)。
この「自信満々にでたらめを言う」現象には専門用語があります:ハルシネーション(幻覚)。人間が夢を見るように、AIは存在しないものを「夢見て」、それを自信満々に言います。
推論でハルシネーションを解決する方法
AIがこれほど間違いやすいなら、どうすればいいのでしょうか?科学者たちは解決策を考え出しました:AIに答える前に「考えさせる」ことです。
この技術は「思考」または「思考連鎖(Chain of Thought)」と呼ばれます。
従来のAIの仕組み:
- 質問をする → AIが即座に答えを吐き出す。
- 問題を見て、計算用紙に書かずに答えを口にする学生のようなもの。
推論するAI:
- 質問をする → AIがまず「計算用紙」で計算し考えて → それから答えを出す。
- まず手順を書き出し、確認してから最終的な答えを書く学生のようなもの。
実用的な例:
あなたが尋ねる:「Xiao Mingは15個のリンゴを持っています。彼はXiao Hongに3個あげて、さらに8個買いました。今何個持っていますか?」
従来のAIは:
- 数字「15、3、8」を見る。
- 確率に基づいて、足し算すべきだと考える。
- 答え:「26」(間違い!)
推論するAIは:
- まず分析:「Xiao Mingは最初に15個持っている。」
- 「Xiao Hongに3個あげたので、15-3=12。」
- 「さらに8個買ったので、12+8=20。」
- 最終的に答え:「20」(正解!)
推論の利点:
- ハルシネーションを減らす - AIが自分の考えを「チェック」するため、でたらめを言う可能性が低くなる。
- より厳密な論理 - ステップを飛ばさずに段階的に導き出す。
- 説明可能 - AIがどのように考えているかを見ることができる(ただし、ほとんどの場合この思考プロセスは隠されている)。
- 複雑な問題を処理 - 複数ステップの推論が必要な問題で精度が大幅に向上する。
しかし、推論にはコストもあります:
- 速度が遅い(「考える」必要があるため)。
- コストが高い(より多くの計算が必要)。
- すべての問題に推論が必要なわけではない(例えば「こんにちは」に半日考える必要はない)。
現在、ほとんどのAIにはこの推論能力が追加されています。例えば、ChatGPTの思考モデル、DeepSeekの深層思考モードなど。
簡単なまとめ:
- 通常のAI = すぐに答えを口にする学生(間違っている可能性あり)。
- 推論AI = 計算用紙で慎重に作業する学生(精度が高い)。
これはAIが本当に「考えられる」という意味ではなく、確率計算の前にいくつかの検証ステップを追加するだけです。しかし効果は明らかで、ハルシネーションが減り、より信頼性の高い回答が得られます。
最も適切な例えを使うと:生成AIは、無数の本を読み、世界を見てきた「超優秀な文系学生」のようなものです。 何でも質問でき、チャットしてくれたり、文章を書くのを手伝ってくれたりします。しかし、知識を本当に理解するのではなく、「問題集を暗記」して答えています。新しいバージョンでは「計算用紙を使う」ことを学び始めています。
実は、AIの家族は巨大です
多くの人はAIはChatGPTだけだと思っていますが、そうではありません。AIの家族には多くのメンバーがいます:
1. 認識AI - はっきりと見るもの
- 顔認識(スマホのロック解除、顔認証決済)
- 画像認識(写真で花を識別、テキスト認識)
- 音声認識(Siri、小愛があなたの音声を理解)
- これらのAIは「認識」に特化しており、「創造」ではありません。
2. 推薦AI - あなたの心を最もよく知るもの
- 抖音(Douyin/TikTok)が動画を推薦する。
- 淘宝(Taobao)が商品を推薦する。
- 網易雲音楽(NetEase Cloud Music)が曲を推薦する。
- これらは「あなたの好みを推測する」のが得意ですが、新しいコンテンツは生成しません。
3. 決定AI - チェスやゲームが得意なもの
- AlphaGo(囲碁をプレイ)
- ゲームAI(スタークラフトのコンピュータ対戦相手など)
- これらは「意思決定」に焦点を当てており、特定の領域で人間を超えています。
4. 生成AI - 現在のホットな波
- テキスト生成:ChatGPT、Claude、DeepSeek
- 画像生成:Midjourney、Stable Diffusion、DALL-E
- 動画生成:Sora、Runway
- 音楽生成:Suno、Udio
まとめ
簡単なまとめ:AIを道具箱に例えると、認識AIは「虫眼鏡」、推薦AIは「コンパス」、決定AIは「棋譜」、そして生成AIは「魔法の杖」です—あなたが欲しいものを呼び出すことができます。
しかし、この「魔法の杖」は実際には「確率計算機」です。強力ですが、全能ではありません。そしてこのチュートリアルは、主にこの「魔法の杖」をうまく使う方法についてです。