Rance的AI新手教程01:什么是AI大模型?

前言

最近一直在学习和使用AI,也加了一些群和朋友们学习交流。发现有不少朋友想入门但是完全不知道如何入门,所以打算写一个AI教程给有需要的朋友。

我们废话不多说,直接进入正题。

我们说的AI,到底是什么?

如果你最近听朋友聊天,十句话里可能有八句都在说"AI"。但你知道吗?大家现在说的AI,和几年前说的AI,其实不是一回事。

现在火爆全网的AI,有个专业名字叫"生成式AI"。

什么意思呢?简单来说就是:你给它一句话,它能给你生成一篇文章;你给它一个想法,它能给你生成一张图片;你给它一个需求,它能给你写一段代码。

就像一个特别聪明的助手,你说"帮我写封辞职信",它真的能写出来;你说"画一只穿着西装的猫",它真的能画出来。这种"从无到有创造内容"的能力,就是"生成式"的核心。

我们常听到的ChatGPT、Claude、DeepSeek,都属于这一类。它们的本质是大语言模型(Large Language Model,简称LLM),通过学习海量的文本数据,学会了理解和生成人类语言。

但是,这里有个重要的秘密

AI其实并不"懂"你在说什么,它只是在"算概率"。

这话听起来有点颠覆,让我解释一下:

当你问AI"天空是什么颜色",它不是真的抬头看了天空,也不是真的理解"天空"和"颜色"的概念。它的工作原理是这样的:

根据它读过的几亿篇文章,当前面出现"天空是什么"这几个字时,后面接"蓝色"的概率是82%,接"灰色"的概率是10%,接"红色"的概率是5%……然后它选概率最高的那个词。

再举个更形象的例子:

你问:“1+1等于?”

  • AI不是在"算数",而是发现在它见过的所有文本里,“1+1等于"后面99.9%都接着"2”
  • 所以它回答"2"

你问:“推荐一部好看的电影”

  • AI不是真的看过电影,而是分析:在它学过的文本里,“好看的电影"后面经常出现"肖申克的救赎”、“泰坦尼克号"这些词
  • 概率高的,它就推荐给你

这就像一个超级学霸,读了全世界的书,但是:

  • 他能告诉你"巴黎是法国首都”(因为书里这么写)
  • 但他从没去过巴黎,甚至不知道"首都"是什么意思
  • 他只是记住了:当你说"巴黎是"的时候,后面接"法国首都"出现的次数最多

所以AI会出现一些奇怪的问题:

  • 有时候会"一本正经地胡说八道"(编造不存在的事实)
  • 简单的数学题可能算错(因为它不是真的在计算)
  • 可能给出自相矛盾的回答(前后概率计算不一致)

这个"一本正经地胡说八道"的现象,有个专业术语叫**“幻觉”(Hallucination)**。就像人做梦一样,AI会"梦"出一些不存在的东西,而且说得特别自信。

如何用推理解决幻觉

既然AI这么容易出错,怎么办呢?科学家们想了个办法:让AI先"思考"再回答。

这个技术叫"推理"(Thinking)或者"思维链"(Chain of Thought)。

传统AI的工作方式:

  • 你问问题 → AI立刻蹦出答案
  • 就像学生看到题目,不打草稿直接说答案

带推理的AI:

  • 你问问题 → AI先在"草稿纸"上算一算、想一想 → 再给你答案
  • 就像学生先列步骤、检查一遍,再写最终答案

举个实际例子:

你问:“小明有15个苹果,给了小红3个,又买了8个,现在有多少个?”

传统AI可能这样:

  • 看到"15、3、8"这些数字
  • 根据概率,觉得应该加起来
  • 回答:“26个”(错了!)

带推理的AI会这样:

  • 先分析:“小明最初有15个”
  • “给了小红3个,那就是15-3=12个”
  • “又买了8个,那就是12+8=20个”
  • 最后回答:“20个”(对了!)

推理功能的好处:

  1. 减少幻觉 - 因为AI会"检查"自己的想法,不容易胡说八道
  2. 逻辑更严密 - 一步步推导,不会跳步
  3. 可以解释 - 你能看到AI是怎么想的(虽然大部分时候这个思考过程是隐藏的)
  4. 处理复杂问题 - 需要多步骤推理的问题,准确率大大提高

但推理也有代价:

  • 速度更慢(因为要"思考")
  • 成本更高(计算量更大)
  • 不是所有问题都需要推理(比如"你好"不需要思考半天)

现在大部分AI都加入了这种推理能力。比如ChatGPT的thinking模型,DeepSeek的深度思考模式

简单总结一下:

  • 普通AI = 快速抢答的学生(可能答错)
  • 推理AI = 认真打草稿的学生(准确率更高)

这不是说AI真的"会思考"了,它只是在概率计算前多加了几步验证。但效果确实明显——幻觉少了,答案更靠谱了。

举个最贴切的比喻:生成式AI就像一个读过无数书、见过无数世面的"超级文科生",你问它什么,它都能跟你聊两句,还能帮你写点东西。只不过,它是靠"背题库"来答题的,而不是真的理解了知识。现在的新版本,开始学会"打草稿"了。


其实AI家族很庞大

很多人以为AI就是ChatGPT,其实不是。AI这个大家族里,成员可多了:

1. 识别类AI - 眼睛特别尖的那种

  • 人脸识别(手机解锁、刷脸支付)
  • 图像识别(拍照识花、识别文字)
  • 语音识别(Siri、小爱同学听懂你说话)
  • 这类AI的特长是"认出来",而不是"创造"

2. 推荐类AI - 最懂你心思的那种

  • 抖音给你推视频
  • 淘宝给你推商品
  • 网易云给你推歌
  • 它们擅长"猜你喜欢",但不会生成新内容

3. 决策类AI - 下棋打游戏特别厉害的那种

  • AlphaGo(下围棋)
  • 游戏AI(像《星际争霸》的电脑对手)
  • 它们专注于"做决策",在特定领域超越人类

4. 生成类AI - 现在最火的这一波

  • 文本生成:ChatGPT、Claude、DeepSeek
  • 图像生成:Midjourney、Stable Diffusion、DALL-E
  • 视频生成:Sora、Runway
  • 音乐生成:Suno、Udio

总结

简单总结一下:如果把AI比作工具箱,识别类AI是"放大镜",推荐类AI是"指南针",决策类AI是"棋谱",而生成式AI就是"魔法棒"——它能变出你想要的东西来。

只不过这根"魔法棒",其实是个"概率计算器"。它很强大,但不是万能的。而我们这个系列教程,主要就是教你怎么用好这根"魔法棒"。

使用 Hugo 构建
主题 StackJimmy 设计