前言
最近一直在学习和使用AI,也加了一些群和朋友们学习交流。发现有不少朋友想入门但是完全不知道如何入门,所以打算写一个AI教程给有需要的朋友。
我们废话不多说,直接进入正题。
我们说的AI,到底是什么?
如果你最近听朋友聊天,十句话里可能有八句都在说"AI"。但你知道吗?大家现在说的AI,和几年前说的AI,其实不是一回事。
现在火爆全网的AI,有个专业名字叫"生成式AI"。
什么意思呢?简单来说就是:你给它一句话,它能给你生成一篇文章;你给它一个想法,它能给你生成一张图片;你给它一个需求,它能给你写一段代码。
就像一个特别聪明的助手,你说"帮我写封辞职信",它真的能写出来;你说"画一只穿着西装的猫",它真的能画出来。这种"从无到有创造内容"的能力,就是"生成式"的核心。
我们常听到的ChatGPT、Claude、DeepSeek,都属于这一类。它们的本质是大语言模型(Large Language Model,简称LLM),通过学习海量的文本数据,学会了理解和生成人类语言。
但是,这里有个重要的秘密
AI其实并不"懂"你在说什么,它只是在"算概率"。
这话听起来有点颠覆,让我解释一下:
当你问AI"天空是什么颜色",它不是真的抬头看了天空,也不是真的理解"天空"和"颜色"的概念。它的工作原理是这样的:
根据它读过的几亿篇文章,当前面出现"天空是什么"这几个字时,后面接"蓝色"的概率是82%,接"灰色"的概率是10%,接"红色"的概率是5%……然后它选概率最高的那个词。
再举个更形象的例子:
你问:“1+1等于?”
- AI不是在"算数",而是发现在它见过的所有文本里,“1+1等于"后面99.9%都接着"2”
- 所以它回答"2"
你问:“推荐一部好看的电影”
- AI不是真的看过电影,而是分析:在它学过的文本里,“好看的电影"后面经常出现"肖申克的救赎”、“泰坦尼克号"这些词
- 概率高的,它就推荐给你
这就像一个超级学霸,读了全世界的书,但是:
- 他能告诉你"巴黎是法国首都”(因为书里这么写)
- 但他从没去过巴黎,甚至不知道"首都"是什么意思
- 他只是记住了:当你说"巴黎是"的时候,后面接"法国首都"出现的次数最多
所以AI会出现一些奇怪的问题:
- 有时候会"一本正经地胡说八道"(编造不存在的事实)
- 简单的数学题可能算错(因为它不是真的在计算)
- 可能给出自相矛盾的回答(前后概率计算不一致)
这个"一本正经地胡说八道"的现象,有个专业术语叫**“幻觉”(Hallucination)**。就像人做梦一样,AI会"梦"出一些不存在的东西,而且说得特别自信。
如何用推理解决幻觉
既然AI这么容易出错,怎么办呢?科学家们想了个办法:让AI先"思考"再回答。
这个技术叫"推理"(Thinking)或者"思维链"(Chain of Thought)。
传统AI的工作方式:
- 你问问题 → AI立刻蹦出答案
- 就像学生看到题目,不打草稿直接说答案
带推理的AI:
- 你问问题 → AI先在"草稿纸"上算一算、想一想 → 再给你答案
- 就像学生先列步骤、检查一遍,再写最终答案
举个实际例子:
你问:“小明有15个苹果,给了小红3个,又买了8个,现在有多少个?”
传统AI可能这样:
- 看到"15、3、8"这些数字
- 根据概率,觉得应该加起来
- 回答:“26个”(错了!)
带推理的AI会这样:
- 先分析:“小明最初有15个”
- “给了小红3个,那就是15-3=12个”
- “又买了8个,那就是12+8=20个”
- 最后回答:“20个”(对了!)
推理功能的好处:
- 减少幻觉 - 因为AI会"检查"自己的想法,不容易胡说八道
- 逻辑更严密 - 一步步推导,不会跳步
- 可以解释 - 你能看到AI是怎么想的(虽然大部分时候这个思考过程是隐藏的)
- 处理复杂问题 - 需要多步骤推理的问题,准确率大大提高
但推理也有代价:
- 速度更慢(因为要"思考")
- 成本更高(计算量更大)
- 不是所有问题都需要推理(比如"你好"不需要思考半天)
现在大部分AI都加入了这种推理能力。比如ChatGPT的thinking模型,DeepSeek的深度思考模式
简单总结一下:
- 普通AI = 快速抢答的学生(可能答错)
- 推理AI = 认真打草稿的学生(准确率更高)
这不是说AI真的"会思考"了,它只是在概率计算前多加了几步验证。但效果确实明显——幻觉少了,答案更靠谱了。
举个最贴切的比喻:生成式AI就像一个读过无数书、见过无数世面的"超级文科生",你问它什么,它都能跟你聊两句,还能帮你写点东西。只不过,它是靠"背题库"来答题的,而不是真的理解了知识。现在的新版本,开始学会"打草稿"了。
其实AI家族很庞大
很多人以为AI就是ChatGPT,其实不是。AI这个大家族里,成员可多了:
1. 识别类AI - 眼睛特别尖的那种
- 人脸识别(手机解锁、刷脸支付)
- 图像识别(拍照识花、识别文字)
- 语音识别(Siri、小爱同学听懂你说话)
- 这类AI的特长是"认出来",而不是"创造"
2. 推荐类AI - 最懂你心思的那种
- 抖音给你推视频
- 淘宝给你推商品
- 网易云给你推歌
- 它们擅长"猜你喜欢",但不会生成新内容
3. 决策类AI - 下棋打游戏特别厉害的那种
- AlphaGo(下围棋)
- 游戏AI(像《星际争霸》的电脑对手)
- 它们专注于"做决策",在特定领域超越人类
4. 生成类AI - 现在最火的这一波
- 文本生成:ChatGPT、Claude、DeepSeek
- 图像生成:Midjourney、Stable Diffusion、DALL-E
- 视频生成:Sora、Runway
- 音乐生成:Suno、Udio
总结
简单总结一下:如果把AI比作工具箱,识别类AI是"放大镜",推荐类AI是"指南针",决策类AI是"棋谱",而生成式AI就是"魔法棒"——它能变出你想要的东西来。
只不过这根"魔法棒",其实是个"概率计算器"。它很强大,但不是万能的。而我们这个系列教程,主要就是教你怎么用好这根"魔法棒"。