AIGC产品测评TOP25丨谁能抢到下个十年的船票

Tech星球(微信ID:tech618

何煦阳 

策划杨晓鹤

封面来源图虫创意

 

2016年,李彦宏站在百度联盟峰会的讲台上,向所有人宣布:互联网的下一幕是人工智能。同年,Google 旗下 Deep Mind 开发的 Alpha Go 战胜围棋选手李世石,直接推高市场对AI的想象,一批AI公司崛起,有人把这一年称作“AI元年”。 

七年后,李彦宏的预言成真了。这七年里,人们发现“AI赋能千行百业”的愿景,是个美丽的“误会”。商业化困境剥落了AI企业在实验室中的光芒,让其面对最粗糙的波折。

直到2022年末,ChatGPT3.0 横空出世。七年前 Alpha Go 战胜李世石,更多被当作一则惊爆的新闻或奇观,而这一次,人们开始相信AGI(通用人工智能)时代正在到来。上线后仅一个月,ChatGPT全球用户便破亿。前世界首富、PC时代浪潮最大获利者比尔·盖茨惊呼,ChatGPT的出现,不亚于PC或者互联网的诞生。

而由GPT引发的AIGC浪潮,更是让科技生产力实现跃迁。无数新的应用将基于大模型来开发,如同十几年前各种基于Android 、iOS 的应用大量涌现一样,AIGC(人工智能生成内容)相关产品也正在喷涌而出 。更振奋人心的是,AI时代的创业团队将更小、更快,Open AI 只有300人,顶流AI绘画软件 Midjoureny,团队只有11人。

应用层的机会属于每一个有野心、有想象力的人。在被 ChatGPT 点燃的各地“黑客松”比赛中,有人通过 ChatGPT 生成教学视频,用ChatGPT搞投资,折现现金流分析教学;有团队意图利用文生图的能力,帮助每个人画出自己的梦;有产品能识别用户面部情绪,让ChatGPT更恰当地回复……无数冲浪者在屏幕面前敲击键盘,如同即将踏足月球的阿姆斯特朗,或者刚刚分开海水的摩西。

浪潮来临之际,很多“海边的人”会首先受到波及。高盛集团发布了一份报告,警告称,未来五年内,全球将有3亿人因为AIGC而失去饭碗。Stability AI 的 CTO(首席技术官)Tom Mason也提到AIGC影响不只是10 亿人,但这是他们当前的目标。

面对如此大的时代浪潮,AIGC 应用层会有哪些新挑战、机遇?AIGC会给内容生产和职场关系带来什么样的改变,普通人又该如何应对?为了解答上面的问题,Tech星球《产品挖掘机》栏目特别推出“AIGC应用测评Top25”专题,挖掘了国内上百款 AIGC 产品,制作了一份AIGC产品推荐表单。

以“国内可以无障碍使用、AI驱动的产品化、适合不同角色的推荐”为衡量标准,该表单将国内市场的AIGC 产品分成“AI对话、AI数字人、AI办公助手、AI绘画、AI影像制作”五大类,每一类从四个维度进行测评,根据评分分别得出前五名。

该推荐表单致力于发掘国内最好的AIGC产品,帮助用户甄别产品实力,以及明晰哪款产品对自己或公司业务更适合匹配。

同时,Tech星球还访谈了AIGC赛道多位CEO、专家与投资人对未来趋势的洞察,AIGC 降临后,各行各业将会如何重构与洗牌,以及将会如何塑造AI时代的未来。

 

2022年11月30日,ChatGPT上线,仅一周就获得百万注册用户,被视为具备成为下一代互联网入口,甚至开启第四次技术的潜力。此后,ChatGPT的发展就一路“狂飙”:母公司被投数十亿美元、与微软打造新版搜索引擎产品Bing、推出插件系统……就在几天前,ChatGPT已推出移动端App,仅半天就登顶App Store。

一个问题浮现出来:为什么人工智能发展这么多年,国内没有能预见到大模型的“涌现”能力?

在访谈调研中,Tech星球向多位受访者提出了这个问题。APUS CEO 李涛告诉Tech星球,他不认为有任何人可以预料到,哪怕是OpenAI 的投资人埃隆马斯克和其CEO Sam Altman。2019年,李涛在硅谷游学时,就曾与 Sam Altman交流 。据李涛讲述,当时 GPT-2 还集中在游戏方向,没引起多少重视。”所谓的‘智能涌现’,是事后总结出来的结果。现在看来,过了100亿参数(涌现)就会发生。”

小冰公司CEO李笛表达了相同的看法,他将OpenAI的成功概括为“工匠精神”。据美国《时代》杂志报道,OpenAI在训练ChatGPT时,在肯尼亚雇佣了大量员工进行数据标注,但李笛告诉Tech星球,当时业内已很少再用人工标注,这是一个没有人愿意尝试的方案。“就像有一个铁杵,你把它磨成针。如果效果不好,那就是功夫没下够。”

但不管如何,一场不入局就会被淘汰的竞赛已经开始。

像在中国科技圈点了一把烈火,国内各大厂、机构争先推出自己的大模型及在此基础上的AI对话产品。而随着国内大模型“百舸争流”,各种测评标准也被陆续提出,如真格基金的Z-Bench v1.0,以及中文通用大模型评测基准SuperCLUE等。社会讨论热度呈指数级激增。

更聚焦大模型产品化的Tech星球测评结果显示,文心一言与讯飞星火表现不相上下。当然,讯飞星火正陷于市场质疑其是“套壳GPT”之争,而百度目前已基于文心一言大模型推出搜索产品“百度AI对话”(又名“搜索AI伙伴”),可进行联网搜索、语音输入,并设有众多垂直场景入口,因此处于领跑阶段。综合测评中,阿里旗下的“通义千问”在数学、编程能力稍逊一筹,其他方面表现良好。“商量”与“天工”则在实测中均出现等待时间较长、作答卡顿的现象,产品化还有很长的路要走。