RL RanceLee的博客
← 返回主页
● AI

30图测试Image-2的能力,平面设计行业要完了

为了测试新的Image 2模型的能力,我让Opus4.7指挥它一次性画 30 张图,并且给出自己的评论。

覆盖写实摄影、蜡笔绘本、复古海报、赛博朋克东京、CRT 老电视、塞尔达游戏截图、文艺复兴油画、像素游戏、信息饼图、四格漫画、中国水墨、anime 美少女、三十六计长图、做旧报纸……能想到的极端场景都试了一遍。

最终效果比想象中强太多。

连之前大模型做不好的中文也表现完美:白雪公主 5 个场景的中文标题全对、印刷体小学数学试卷全对、冰箱黄色便利贴的手写体中文全对、连三十六计长图里 36 个计名一个不差全部写对,最夸张的是一张做旧《民聲日報》报纸图,整版主标题/副标题/4 个版块小标题完全没错别字,连密集小字正文都是真汉字结构。

下面是 30 张图按编号排,每张只列主题、风格、测试点,效果请各位自己观察图片。


测试 1:白雪公主故事长图(蜡笔儿童插画)

  • 主题:白雪公主童话浓缩成 5 个场景的纵向叙事长图(魔镜→七矮人→毒苹果→沉睡→王子之吻),每场景配中文标题
  • 风格:儿童蜡笔插画(hand-drawn waxy crayon strokes, naive children’s storybook art, soft pastel colors, paper texture)
  • 测试点:多场景叙事拼接 / 中文文字渲染 / 蜡笔手绘质感


测试 2:复古科幻电影海报

  • 主题:80 年代《银翼杀手》风格的复古科幻电影海报,虚构片名 “NEON HORIZON”,演员名片底
  • 风格:retro 80s sci-fi movie poster, painted illustration, neon palette, grain texture
  • 测试点:海报构图 / 英文标题排版 / 复古电影质感


测试 3:写实人像摄影

  • 主题:一位 25 岁亚洲女性的专业头像,自然光,浅景深
  • 风格:photorealistic portrait photography, natural window light, 85mm lens, shallow DOF
  • 测试点:写实人脸细节 / 摄影质感 / 真实感


测试 4:儿童绘本插画

  • 主题:一只小狐狸坐在蘑菇旁喝下午茶,森林背景,温馨童话
  • 风格:children’s storybook watercolor illustration, soft edges, whimsical, gentle palette
  • 测试点:绘本风格水彩 / 拟人动物 / 童话氛围


测试 5:iOS 天气 App UI 截图

  • 主题:iPhone 锁屏上的天气 App 界面(北京 22°C 多云转晴,未来 5 天预报)
  • 风格:iOS 18 weather app mockup, glassmorphism, clean typography
  • 测试点:UI 细节还原 / 数字与英文文字渲染 / 屏幕样机


测试 6:赛博朋克东京夜景

  • 主题:雨夜东京涉谷街道,霓虹招牌(含日文/英文),赛博朋克氛围
  • 风格:cyberpunk Tokyo, neon signs, rainy reflective streets, blade runner aesthetic
  • 测试点:复杂场景多元素 / 日文与英文招牌渲染 / 反射与光效


测试 7:朋友合影

  • 主题:4 个不同种族的年轻人在咖啡厅笑着合影
  • 风格:candid casual photography, warm cafe lighting, lifestyle photo
  • 测试点:多人脸 / 表情自然度 / 群像构图


测试 8:小学数学试卷扫描件

  • 主题:一份小学三年级数学试卷,包含填空题与计算题,含部分手写答案
  • 风格:scanned exam paper, white paper texture, printed Chinese math problems with handwritten pencil answers
  • 测试点:结构化文字 / 中文+数字+公式混合渲染 / 试卷版式


测试 9:90 年代 CRT 电视新闻播报

  • 主题:复古 90 年代 CRT 电视机,屏幕显示新闻主播播报画面,有扫描线和雪花
  • 风格:90s CRT TV showing a news broadcast, scanline overlay, slight CRT distortion
  • 测试点:复合元素(电视外壳+屏幕画面)/ 怀旧质感 / 屏中屏


测试 10:塞尔达风格游戏截图

  • 主题:塞尔达开放世界风格的游戏截图,海拉鲁草原,远方雪山,绿衣剑士背影
  • 风格:Zelda Breath of the Wild style game screenshot, cel-shaded, open world, painterly
  • 测试点:3D 游戏画面 / 已有 IP 风格还原 / 游戏 HUD


  • 主题:一个名为 “BREW LAB” 的精品咖啡品牌主 Logo
  • 风格:minimal vector logo, coffee bean motif, modern serif typeface, monochrome
  • 测试点:Logo 设计 / 短英文文字渲染 / 商业平面设计


测试 12:上海外滩夜景

  • 主题:上海外滩夜景全景,黄浦江、东方明珠、陆家嘴天际线
  • 风格:cinematic city night photography, long exposure, vibrant lights
  • 测试点:知名地标识别 / 城市夜景摄影 / 光线流动感


测试 13:3D 渲染运动鞋产品图

  • 主题:一双白色运动鞋悬浮在空中,工作室照明,干净背景
  • 风格:3D rendered product shot, octane render, studio lighting, floating composition
  • 测试点:3D 产品图 / 商业摄影 / 鞋类细节


测试 14:文艺复兴肖像油画

  • 主题:一位 17 世纪贵族女士的文艺复兴风格半身油画肖像
  • 风格:Italian Renaissance oil painting portrait, chiaroscuro lighting, classical
  • 测试点:古典油画仿古 / 历史服饰 / 光影戏剧化


测试 15:16-bit 像素艺术 RPG 角色

  • 主题:复古 RPG 风格的勇士角色立绘,剑、盾、披风
  • 风格:16-bit pixel art RPG character sprite, limited palette, crisp pixels
  • 测试点:像素艺术规整度 / 角色设计 / 复古游戏风


测试 16:震惊猫表情包

  • 主题:一只橘猫瞪大眼睛震惊表情,meme 风格,下方加大字 “WHAT?”
  • 风格:cat reaction meme format, bold impact font caption, internet meme aesthetic
  • 测试点:表情包风格 / 短英文大字渲染 / Meme 文化感


测试 17:极简扁平 App 图标组

  • 主题:5 个极简扁平风格的 App 图标排成一行(天气/日历/笔记/相机/音乐)
  • 风格:minimal flat app icons, rounded squares, limited palette, iOS style
  • 测试点:批量小元素一致性 / 极简设计 / 图标识别度


测试 18:科技产品发布会舞台照

  • 主题:一台未来感手机在发布会舞台中央,戏剧化追光,背景巨幅屏幕
  • 风格:tech keynote stage photography, dramatic spot light, dark stage
  • 测试点:戏剧化打光 / 科技产品渲染 / 大场景透视


测试 19:日式拉面俯拍

  • 主题:俯拍一碗日式豚骨拉面,溏心蛋、叉烧、海苔、葱花
  • 风格:top-down food photography, natural light, wooden table, appetizing
  • 测试点:食物摄影 / 俯视构图 / 食材细节质感


测试 20:未来城市概念艺术

  • 主题:飞行汽车穿梭的未来都市,黄昏色调,宏大透视
  • 风格:futuristic city concept art, golden hour, sci-fi cinematic, matte painting
  • 测试点:宏大场景概念艺术 / 飞行载具 / 黄昏氛围


测试 21:水彩玫瑰花园

  • 主题:盛开的红玫瑰花园,传统手绘水彩风
  • 风格:traditional watercolor painting, soft brushstrokes, paper texture, botanical art
  • 测试点:传统水彩 / 植物绘画 / 颜料晕染感


测试 22:中国水墨山水画

  • 主题:宋代山水风格,远山近水、孤舟渔翁、留白构图,配中文题诗"山水有清音"和印章
  • 风格:traditional Chinese ink wash, monochrome, rice paper texture, Song Dynasty style
  • 测试点:中国传统艺术风格 / 中文书法竖排渲染 / 留白构图意境


测试 23:二次元动漫美少女

  • 主题:典型 anime 风格少女,粉色长发蓝眼睛,水手服,樱花飘落
  • 风格:modern Japanese anime/manga, cel-shaded, Makoto Shinkai inspired, pastel palette
  • 测试点:二次元 anime 风格还原 / cel shading / 萌系角色塑造


测试 24:冰箱便条手写中文 todo

  • 主题:黄色便利贴磁吸在冰箱门上,黑色圆珠笔手写中文 todo list 5 项,部分有勾
  • 风格:close-up photograph, casual handwriting, kitchen morning light
  • 测试点:手写中文渲染(跟测试 8 印刷中文形成对比)/ 实物质感


测试 25:信息图饼图(含数据标签)

  • 主题:2024 全球手机市场份额饼图,5 个色块带百分比标签和品牌名图例
  • 风格:clean corporate infographic, flat colors, minimal business presentation slide
  • 测试点:数据可视化(图表+数字+标签综合)/ 实用商业图能力


测试 26:4 格漫画(猫的日常)

  • 主题:2x2 四格漫画讲一只胖橘猫的日常,每格英文标题(早起→要饭→推杯子→睡一天)
  • 风格:newspaper comic strip style, thick outlines, flat colors, Garfield-inspired
  • 测试点:分格叙事(跟测试 1 长图叙事对比)/ 喜剧节奏 / 一致角色


测试 27:PVZ 向日葵 IP 转译写实照片

  • 主题:把《植物大战僵尸》里卡通造型的向日葵转译成"现实中真存在的一种植物"的真实摄影
  • 风格:photorealistic botanical photography, natural lighting, shallow DOF
  • 测试点:已有卡通 IP → 写实风转换 / 单物体写实植物摄影 / 角色保留度


测试 28:三十六计中国风信息长图(极限难度)

  • 主题:仿照"孙子兵法 36 计长图"的中国风综合信息长图,主题改成《三十六计》(六套:胜/敌/攻/混/并/败 各 6 计共 36 个计名),含标题、简介、6x6 计名网格、配图、印章
  • 风格:traditional Chinese ink-wash infographic poster, aged rice paper, brush calligraphy, scroll aesthetic
  • 测试点:⚠️ 三重叠加极限测试 —— ① 海量中文文字(36 个计名 + 简介段落)② 复杂版式(多区域 + 6x6 网格)③ 9:16 长图比例


测试 29:复古做旧报纸(大段中文版面)

  • 主题:一张做旧的复古中文报纸照片,名为《民聲日報》,主标题"旧档案曝光:世上确有神仙与天外来客",含 4 个版块小标题、3 张配图(山中异象/UFO/老文件)、密集正文小字段落
  • 风格:weathered vintage Chinese newspaper photograph, sepia tone, aged yellowed paper, dim atmospheric lighting
  • 测试点:⚠️ 大段中文版面终极测试 —— 正好补足"超大段中文段落"这个之前没测过的维度


测试 30:马斯克抖音直播卖 SpaceX 火箭(网络梗图)

  • 主题:仿造抖音直播 UI 截图,马斯克穿 SpaceX 衣服在直播间卖猎鹰9号火箭,¥9999万起,5 条带等级头像的弹幕评论
  • 风格:完整移动端竖屏抖音直播间界面(顶部状态栏+主播信息+商品卡+弹幕+底部购物车)
  • 测试点:⚠️ 完整中文 UI 截图模仿 —— UI 元素密度+营销文案准确度+评论弹幕一致性,比前面任何一张图都综合
  • 来源:网络流传梗图(右下水印 @myimmortal_moon),不是我们的工具生成的,作为 image-gen 模型能力的对比基准放进来


结论

30 张测试只 1 张轻微不达标(测试 15 像素艺术不够"像素"),其他都接近或达到能直接用的水平。

我不是平面设计行业从业人员,我只能说出我的暴论:这个行业要迎来失业潮了

有人说有独特审美的人能留下,但是真正有多少人能凭借自己的审美能力战胜AI呢?

并且我相信AI的审美也在快速提高


彩蛋1:朋友的随手拍 → 电商详情页

如果你还不信,看看我朋友的随手拍,是不是颠覆了你的想象?

第一步:朋友随手拍了一张铝合金手机支架(光线一般、桌面杂乱)

第二步:把这张图发给 ChatGPT,就一句话「这是一个手机支架,你帮我生成一张电商宣传图」

第三步:ChatGPT 直接吐出来的电商详情页(完整版)

主标题"稳固支撑 解放双手"、4 个特性图标(稳固防滑/多角度调节/铝合金材质/广泛兼容)、“贴心设计 细节出众” 4 个细节展示、底部"广泛兼容"5 种设备图标(iPhone/华为/小米/iPad/游戏设备/电子书阅读器)—— 这是原本要找电商美工排版几个小时的工作。

零设计师参与,一句话生成。这就是为什么我说"平面设计行业要完了"。

彩蛋2:甚至能直接生成二维码

这个二维码你还可以扫!