商业头条No.65|文心一言两周年,不发一言

商业头条No.65|文心一言两周年,不发一言

2025-03-14 动态更新

界面新闻记者 | 伍洋宇 崔鹏

界面新闻编辑 | 文姝琪

3月16日将是文心一言大模型发布两周年,半个月前,它预告会在这一天上线文心4.5版本。

目前百度还没有官宣任何发布会的相关计划。甚至它在预告中强调的“原生多模态”和“深度思考”能力,可能也难以带来太多惊喜。

文心一言就如这场看上去不那么受重视的发布一样,正在离开舞台中央。但一个被逐渐忘却的事实是,它是中国最早的一批大模型产品,在发布之后近半年的时间里,都是国内大模型行业聚光灯下的绝对主角。

2022年底,在ChatGPT发布后不久,百度秘密组建起一个开发团队,由CTO王海峰牵头,调入AIG(AI Group)多个项目的人才,在公司内部某个封闭区域加班加点连续工作。

这支团队在公司内部系统上看不到任何信息,参与成员姓名也被严格保密。它的任务只有一个,那就是确保百度成为国内首个推出对标ChatGPT产品的公司。

紧锣密鼓备战两个月后,百度公开预告“文心一言”将成为国内最早上线的通用大语言模型。消息一出,百度股价被迅速拉升,单日上涨超过15%,盘中触达166.3港元的一年新高。

但想在短期追赶Open AI的技术进度并不现实。文心一言仓促推出后,也收到了外界不少批评。而当年,随着大模型六小虎和其他互联网大厂的基座模型相继发布,行业陷入百模大战。

大概半年时间,文心一言的风头开始被其他公司盖过。阿里的通义千问、月之暗面的Kimi、字节跳动的豆包,都是后来行业关注度和市场影响力更高的产品。

进入2025年,局面对百度更为不利。先是DeepSeek全球爆火之后,外界开始怀疑坚持走闭源路线的百度还有多大前景。甚至连李彦宏对于开源和闭源模型的态度都因此来了180度大转弯,百度也随即宣布将全面开源。

之后,原本可以为百度带来认可和美誉度的苹果合作,也被阿里通义抢去了风头。百度在这个新故事上再次踏空。 

但大模型又是百度必须赢下的一场战争。这是李彦宏过去十几年最重要的机会。不仅如此,大模型所代表的AI冲击,也是百度未来十年成败与否的关键。 

图片来源:视觉中国

现在的百度比以往任何时候都需要一条第二增长曲线。此前百度官方盖戳的三大核心业务模块中,何俊杰所领导的移动生态(MEG)正在面临大模型应用的挑战,沈抖领导的百度智能云(ACG)被阿里和腾讯云压制,而智能驾驶(IDG)在换帅之后还未完全挣脱商业化困境。

考虑到百度近年来对AI的大量资金投入,大模型对公司主营业务又有潜在的颠覆风险,如果在这里落后于人,百度将很难再翻身。

想要在人工智能时代继续跻身前列,文心一言几乎是百度最后的稻草。

失去先发优势

2023年初GPT3.5横空出世之后,李彦宏在内部对王海峰表达了不满,质疑他作为CTO却未能预见大模型能做到这种能力。

实际上在此之前的几年里,百度一直采取跟随谷歌的策略。它在AI领域的研究方向基本集中于NLP(自然语言处理)、CV(计算机视觉)和语音识别等领域,主要用于满足自动驾驶业务的需要,这也是李彦宏和管理层指定的方向。

做传统NLP(谷歌路线)和CV,跟做GPT差别很大。”一位百度智能云的高级工程师表示。

内部不少人认为,公司此前在AI领域的技术积累与当下主流的大语言模型(即AIGC)有较大区别,百度需要调转船头,重新走Open AI的路线。 

据界面新闻了解,2023年3月百度召开声势浩大的文心一言发布会之前,内部存在不小的分歧:王海峰希望多些时间打磨文心一言,不建议直接向公众开放,但李彦宏认为百度必须做中国第一家发布类ChatGPT产品的公司。

内部很多员工尤其是技术团队的观点与王海峰类似,但这并未改变管理层意志,最终百度还是抢先发布了不甚成熟的文心一言。

后来李彦宏在公开场合解释称,百度着急推出文心一言,是因为合作伙伴和客户有巨大的需求,都希望百度能尽快推出大模型产品。

但绝大多数接受采访的(前)员工都认为,管理层从GPT3.5的演示中,感受到搜索引擎(广告)这个核心业务的危机感,需要及时拿出自己的产品,稳住二级市场情绪,避免股价大幅波动。

从结果看,这确实稳定甚至抬升了百度的股价,但安逸的局面没有持续太久。因为国内的大模型赛道随后迅速涌入大量玩家,整个行业进入“百模大战”的混乱局面。 

在一众竞品的包围之中,抢到国内首发的百度声势渐弱,逐渐有泯然众人矣的趋势。

大量竞争者都盯住了国内大模型第一梯队的位置。其中不仅包括阿里、腾讯、百度和字节等头部公司,也包括智谱、MiniMax、月之暗面、百川智能、阶跃星辰、零一万物等知名创业公司。

“新模型一定要配个第一。”似乎已经成为一种游戏规则。同一时期的不同榜单上,前三名呈“滚动式”出现,几乎每个模型都成为过某个单项评测的第一。 

被认为相对公平科学的OpenCompass旗下大语言模型榜单,除GPT系列模型长期占领榜首外,智谱AI的GLM、阿里的通义千问以及字节跳动的豆包,都曾占领第二、第三,而文心一言在2024年上半年的最好成绩是第四。

“其实那时候国内几家头部产品的差距并不大。”一位从事大模型创业的开发者告诉界面新闻,文心一言的先发优势,显然没有转化为持续领先的技术和市场地位。 

这名开发者2023年从百度离职,跳槽到大模型领域的一家明星初创公司,他发现行业内的其它公司更倾向于瞄准GPT当参照物。 

即便是同行竞争,“大家一般也不拿百度当竞品,(国内)看通义千问比较多。” 

与此同时,在苹果App Store效率软件排行榜上,作为后来者的豆包、Kimi,开始逐步超越文心一言成为大语言模型类对话App的第一。此外,大模型领域随后出现的长文本和价格战等竞争,百度也只是跟进者,不再成为市场喧嚣的焦点。

落地进展缓慢

在大模型技术没有迎来明显突破的时候,竞争一定会转向应用层,比拼各家的落地能力,也就是产品力和商业化层面的竞争。

但由于历史原因,相比其他大厂,百度在应用和开发者端都没有太靠前的优势。

从近十年的市场竞争结果看,百度在C端(用户端)除了搜索业务之外,几乎没有新的超级平台。

没有超级入口,这意味着与竞品相比,文心大模型在调用量上已经失去了最直接的天然优势。

去年4月,在百度AI开发者大会上,李彦宏宣布文心一言和文心大模型的API日均调用量突破2亿。

这说明不了什么,百度搜索很多问题第一条回答就是文心一言。”一位个人智能体(AI Agent)开发者告诉界面新闻,“这种都是被动调用,又不全是(用户的)主动调用。”它意味着用户并不知道自己使用了大模型。

即便如此,由于移动互联网入口产品使用量的劣势,文心一言的调用量也称不上领先行业。一个月后腾讯元宝App发布时,腾讯云副总裁刘煜宏若有所指的透露称,混元大模型仅在腾讯内部的日均调用量就早已超过2亿。这就意味着,如果加入外部调用数据,混元的日均调用量早就超过了文心一言。

而在2023年底,李彦宏还在演讲中声称,“文心大模型一家的调用量比(国内)这200多家大模型调用量加起来还要多。”

百度明明手握先发优势,为何总会被竞品反超?这是很多人的疑问,也包括内部团队。 

多位接受界面新闻采访的百度在职与离职员工都认为,李彦宏自信于百度拥有国内最优秀的AI人才储备。

2018年百度研究院在硅谷召开全员大会时,设立的五大实验室里,就有王海峰、徐伟、李平、杨睿刚,Kenneth Ward Church、浣军和熊辉等人工智能领域的世界级科学家。

更不用说那些前后加入百度后震惊行业的张亚勤、陆奇和吴恩达等知名人物,都曾经吸引了大量技术人才慕名进入这家公司。所以即便是当下,百度内部也有很多技术人员相信,百度拥有最强的技术。

为啥外面感受不到呢?”前述百度云的高级工程师对界面新闻表达了不解。“我们觉得很委屈。”这大概是很多百度人的真实心理状态。

从历史上看,百度并非技术实力不足,而是将技术产品化的能力很弱。

百度没有产品基因。”多位长期任职于百度的资深员工都持有相同看法,虽然百度的技术基因很强,但产品能力太差,不是一家以用户(客户)体验为导向的公司。

在搜索之后,百度确实一直缺乏让其重回互联网时代“BAT”地位的C端产品。曾经高调介入短视频业务的好看视频无疾而终,根本无力挑战字节跳动的抖音,负责人宋健在2024年初离职。

豪掷36亿美元收购YY直播的协议历经三年波折,最终在今年2月作价21亿美元完成收购,而当时百度更强调的是超110亿回笼资金将用于AI研发,对收购案本身已不作更多解读。 

曾经领先的百度地图如今也被阿里旗下的高德地图反超。QuestMobile数据显示,两款App数据均稳定过亿,但在节假日期间,例如去年五一,高德地图DAU接近2亿,百度地图只有1亿出头。

B端(企业端),百度云仍然缺乏成熟的云服务产品矩阵,一度只能case by case(单个案例式)的争取阿里和腾讯剩下的客户,“做最苦的活,赚最少的钱。”

Canalys最新数据显示,2024年第三季度,中国前三大云服务供应商的位置保持不变,阿里云(36%)、华为云(19%)和腾讯云(15%)继续占据领先地位,共同占据70%的市场份额。而百度云则早已被归在了剩下的“其他”里。

考虑到很多采购大模型产品的客户,都需要采购云端算力,所以通常都会选择同一家大厂的云服务,反之亦然。B端产品力的缺失,无疑增加了客户选择百度MaaS(模型即服务)产品的难度,拖慢了文心一言的落地进度。 

一名百度智能云销售对这种境况感受真切。文心一言出现后的那一年,为大模型业务拓客在某种程度上成为了百度云销售部门的“软性KPI”,一个典型场景是部门会一起回顾大模型专项拓客进展。当然,这也是他们的一种主动选择。 

面对阿里、腾讯更综合全面的产品体系,他必须找出差异化的竞争点,而华为云和火山引擎有时候则是在价格上更凶猛难缠。在寻找差异点的路径上,跟客户聊大模型是一个不错的选项。毕竟在内部看来,文心一言是百度云为数不多有竞争优势的亮点,相较其他大厂有更完整的全栈能力。

“不仅是我,所有人都会拿文心当话题。”他说,“只是客户对文心的兴奋程度在下降。”这一方面是因为市场有更多选择,另外一方面则是源于行业通病,当大模型对客户业务的增益场景不完全明朗,文心一言对云服务营收会有带动作用,但不会是决定性的。

争夺大模型客户对云厂商无疑是有利的。AI大模型兴起两年之后,中国云厂商开始迎来一个重回增长提速的市场环境。

Canalys数据显示,2024年第三季度,中国大陆云基础设施服务支出达到102亿美元,同比增长11%,重回两位数增长。而在2023年下半年,这一数字曾放缓至9.5%。该机构称,“AI正逐渐成为云计算采用的重要驱动力。”

与此同时,大模型与云厂商的绑定关系正在加深。 

李彦宏曾在财报会上提到,文心一言或者大语言模型的出现对于云计算来说是一个game changer,它会改变云计算的游戏规则。他指出,传统云计算主要依靠卖算力、存储、运算速度等基础能力。但大模型时代来临后,开发者以大模型开发替代芯片层和框架层开发,可以提升效率并降低成本。

那么以后当人们在购买云计算服务的时候,他会看你的模型好不好,而不是你底层的算力怎么样,存储怎么样。”李彦宏在后来的一次采访中说到,“所以,AI大模型会颠覆整个云计算市场。 

大模型落地需要对应用场景有足够的了解与积累。相较于百度,阿里和腾讯拥有更多的产品,业务覆盖领域也更全面,大模型在对外开放前,已经在内部大量场景中得到磨炼与适配,解决了竞品无法察觉的问题。

在与阿里和腾讯这类大厂竞争时,落后的云服务份额以及垂直业务场景的缺失,让百度显得有些势单力薄。

不是做错,而是几乎没有做对

如果说文心一言出现第一年,百度仍在被讨论的核心范围中,那么到第二年它几乎再没什么高光时刻。 

从2024年3月开始,Kimi Chat因为长文本标签爆火出圈,其身后的月之暗面以及创始人杨植麟成为焦点。5月,从“云雀”更名的豆包大模型正式发布,成为字节跳动加码AI的标志性节点。随即,因为Kimi和豆包均启动大力投放,双双成为用户感知更为强烈的AI产品。 

QuestMobile数据显示,2024年12月,豆包、Kimi、文小言为国内月活规模前三AIGC产品,分别为7523万、2101万、1224万。这一年,外界对于创业公司的关注集中在AI六小虎,谈论大厂也大都以阿里、字节为主要对象。

这原本是一个“还可以”的位置,直到DeepSeek出现,国内大模型的市场格局发生了惊天扭转。百度不单在市场影响力上再度被波及,甚至就此变革了自己在技术策略上的坚持。

跨年期间,曾挑起第一场“大模型价格战”的DeepSeek发布新一代MoE模型V3以及推理模型R1,迅速引爆海内外,成为一家现象级科技公司。其C端产品仅用20天就超过了占据榜首数月的豆包,遑论其它。

一名AI大模型领域投资人对界面新闻记者表示,“百度的问题不是做错了什么,而是好像没有做对任何事。” 

例如,李彦宏对于降本重要性的判断没有错。在他的逻辑中,成本是决定商业化效率的核心,这的确是后来DeepSeek-V3惊艳西方世界的最大亮点。

但在执行层面,百度迟迟没有把降本做到行业中的突出地位。去年那场轰轰烈烈的价格战中,字节和阿里都对旗下最高性能的大模型产品进行了直接降价,而百度只对两款入门模型进行了免费,性能最高的ERNIE4并未调整价格,根本原因在于降本能力还不够。

我们降价就是赚个吆喝。”前述百度云高级工程师表示,主要的竞品都在降价,百度也得做个表态。不过他同时透露,文心一言内部一直在做大幅度的成本优化,最主要目的就是降低企业应用的门槛。 

再比如,文心一言学习OpenAI的商业模式,成为国内第一家向C端收费的大模型AI产品,从商业化考量上来说也没有错。

但它的订阅服务吸引力并没那么强。其付费模型仅涉及ERNIE 4.0及4.0 Turbo,没有GPT-4o、o1这样性能更强的多模态和推理模型助阵;增值服务也只包括超长文档处理、深度文本写作、丰富搜索信息来源,或是提高用户的输入和输出上限等提升“量”的权益,而没有DeepReaserch这类以“质”取胜的应用压场。

相比几乎集体免费的其他C端产品,文心一言的“会员尊享”显得“可以但没有必要”。

但在DeepSeek冲击之下,百度转变想法了。2月13日,百度宣布文心一言将于4月1日起全面免费,所有PC端和APP端用户均可体验文心系列最新模型。

技术层面,百度坚持闭源路线也无可厚非。去年初,李彦宏公开炮轰开源模型,劝说同行放弃卷大模型这条路,选择加入文心一言,成为百度需要的应用开发者。这年4月百度AI开发者大会上,他再度直言,“开源模型会越来越落后”。

这句话在当时曾引起巨大争议。不过他的逻辑是,只有产品落地应用才能反哺开发者生态,才会不断提升已有模型的能力。从这个角度考虑商业化效率,开源做不过闭源。

事实上,这也不是一个完全的非共识。彼时,一名AI六小虎高管曾就该问题对界面新闻记者表示,即便是在技术上,只要不是中途出现“掀桌子的人”,开源模型大概率很难超过闭源。 

但DeepSeek爆火不到两个月,百度又改变了心意。DeepSeek的巨大影响力内涵中有很大比例在于开源技术精神。Meta首席人工智能科学家杨立昆(Yann LeCun)也在这场舆论中发声表示,对于DeepSeek表现的正确想法应该是,“开源模型正在超越闭源模型。”

于是“开源冲击闭源”一同成为百度这场大模型历程中一个戏剧化节点。2月14日,百度宣布将在未来几个月中陆续推出文心大模型4.5系列,6月30日起正式开源。

因为闭源,百度难以大幅度公开自己的创新成果以塑造更大技术影响力;在降本和用户体验上,百度也始终没能与国内其它几家头部大厂拉开差距。这进一步导致在应用落地层面,李彦宏亲自下场拉拢开发者的努力成效甚微。

截至目前,飞桨文心开发者数量达1808万,服务了43万家企业,创建超过100万个模型——但外界对这组数据的感知稀薄,它们更多只被视为统计口径上的单纯数字,并没有产生与数字相匹配的影响力。

与此同时,百度的主要竞争对手们都取得了长足进步。比如阿里的通义千问不断刷新开源模型的性能榜单,在撒钱“买断”整条大模型赛道的过程中为自己的云服务夺得了更多市场。 

在很长一段时间看似“佛系”的腾讯,实则内部绝大部分业务已经接入混元大模型,同时在各个环节提升混元性能、降低接入成本。其C端产品“元宝”还在年初果断接入DeepSeek-R1,并凭借这一波热度成为又一个“出圈”的AI产品,一度超越DeepSeek登上了在苹果iOS免费第一。

大模型是一场马拉松

2023年5月的中关村论坛上,百度因为刚发布的文心一言而备受瞩目。 

李彦宏在演讲中乐观表示,大模型改变了人工智能,大模型即将改变全世界,10年后全世界50%的工作将是提示词工程。 

他甚至发出豪言壮语:“百度要做第一个把全部产品重做一遍的公司。不是整合,不是接入,是重做,重构!” 

李彦宏的愿望也许很美好,但市场通常很现实,而现实则更加残酷。

两年之后,百度已鲜少提及重做所有产品的巨大野心。去年5月,李彦宏披露百度搜索服务有11%由AI完成,三个月后这个数字提升7个百分点至18%。今年2月,最新财报信息显示百度搜索中仅有22%结果页面包含AI生成。

这意味着,过去半年时间内,百度搜索AI生成占比增速比从前更为缓慢。相较于此,百度文库、百度网盘取而代之,成为百度在财报会议上更大力强调的“AI重构业务”。 

在不少百度(前)员工看来,这就好像竞争对手都在主动进攻,大胆探索大模型时代的搜索产品形态,甚至是颠覆搜索引擎的产品,而百度只是在被动防守。

我不相信Robin有勇气放弃现在的搜索(广告),全面转向GPT这种模式。”前述做大模型创业的开发者对界面新闻表示:“重做产品就是革自己的命,你看谷歌都不愿意放弃。”

图片来源:界面图库

这往往是巨头们遇到的典型困境。在《创新者的窘境》一书中,作者克莱顿·克里斯滕森指出,即使是管理得最好的公司,也可能因为过分关注现有客户的需求而错过破坏性技术的机遇。

他认为,对于高科技企业来说,仅仅跟上快速的技术变革是不够的。企业必须从价值网的全局考虑,综合考虑用户、组织、产品和市场等多种要素,才能理解颠覆性创新的本质,也才能防范其他企业利用破坏性技术对本企业的颠覆。

对百度而言,其主营业务的健康增长程度也令人担忧。

百度承担营收主力的移动生态仍在面临转型阵痛。李彦宏去年一季度财报电话会上表示,百度目前仍然处于使用文心重构百度搜索的早期阶段。相比那时,目前其搜索服务AI占比翻倍,但AI贡献的广告增量目前还不明显。去年四季度,百度核心在线营销收入179亿元,同比下滑7%‌。

同时,小红书和搜一搜等新兴平台正在分流百度内容搜索生态的用户时间,存量的广告主在转移到获客效率和价值更高的平台,比如抖音和视频号。

更要命的是大模型产品出现以后,首先颠覆掉的可能就是传统搜索引擎,Chatbot等场景已经有了苗头。无论是自然语言的交互、推理模型的深度思考,还是对于答案的整合生成,Chatbot已经在搜索各个环节提升用户的体验。

专攻AI搜索引擎的创业新贵也在受到市场的拥簇。据The Information,去年12月,Perplexity在发起的最新一轮融资中估值90亿美元,一年翻了近18倍,已超过百度美股市值的四分之一。该公司预计到2025年年化收入将翻倍增至1.27亿美元。

如今,在垂直领域中未能成为国内市场前三的百度智能云,开始成为背负更大财报期望的业务线。去年四季度,百度非在线营销营收为98亿元,同比增长18%,主要由智能云业务推动。财报显示,智能云业务营收同比增长26%,2024年,智能云AI相关收入同比增长近3倍。

需要指出的是,虽然AI驱动的智能云业务增长,但AI收入在云收入占比增长相对缓慢。这一数字从2023年四季度的5%提升至2024年一季度的6.9%,同年三季度继续增长至超11%——以平均每季度两个百分点的增量在扩大。 

图片来源:界面图库

不过,尽管文心一言已经失去先发优势,但大模型还未到分出胜负之时。

在模型技术层面,预训练大模型仍有半代到一代的提升空间。后训练方面,DeepSeek-R1的起势为国内所有大模型验证了o1类推理模型这一路线的正确,连同百度在内的所有厂商都在向此进发。 

在应用层,3月初“通用AI Agent”产品Manus在国内形成的影响不可忽视,它意味着基座模型性能已经足以支撑多步智能体的初步成型。在度过2024年AI应用元年之后,多方观点认为2025年行业必将迎来AI应用的爆发。

这其中仍有百度的机会。在前述“AI重构业务”百度文库和百度网盘上,它的确有亮眼表现。去年四季度,百度文库订阅收入同比增长21%,12月AI MAU达9400万,约为上季度两倍。百度网盘于1月披露,其AI DAU同比增长90%,AI功能带来的收入年增长率为120%。

在资金层面,相较于绝大部分依赖融资输血的创业公司,百度目前并没有太大的压力。有持续的现金流,百度就能继续投入技术研发并参与市场竞争。2024年,百度自由现金流为131亿元人民币,这不包括爱奇艺的自由现金流111亿元人民币。

李彦宏自身也表示,2025年可能会成为AI智能体爆发的元年。大模型技术进入变革阶段,李彦宏明确了两个步骤:首先将通过技术创新,不断降低大模型和人工智能的成本;其次将大力推动人工智能的规模化应用。

两年多过去,时间似乎已经证明当初王海峰判断的正确:大模型的竞争更像一场马拉松比赛——抢跑几分钟,并不能让你赢得最终的胜利。

转载请注明来自研顺网,本文标题:《商业头条No.65|文心一言两周年,不发一言》

每一天,每一秒,你所做的决定都会改变你的人生!
Top