
智东西
本年6月,罗永浩的数字东谈主登上百度电商直播间,取悦6小时不远隔“带货”,一边嘲谑、一边拎着可乐、喝着奶茶,与助播朱萧木的数字东谈主一唱一和,激发1300万东谈主次围不雅。这场直播最终收尾GMV(商品往复总数)5500万元,刷新了数字东谈主带货记载。
▲罗永浩的数字东谈主直播
现时,开动这场直播的“AI总导演”,站上了世界互联网大会乌镇峰会的领奖台。
在11月6日至9日举行的2025年世界互联网大会乌镇峰会上,百度“脚本开动多模协同的高拟真数字东谈主工夫”荣获最初科技奖,收尾取悦三年获奖。

▲百度CTO王海峰在西宾高拟真数字东谈主工夫
从罗永浩的数字分身到世界互联网大会的领奖舞台,咱们看到数字东谈主好像跟前几年咱们印象中的不相通了,一个问题随之暴露:
让数字东谈主越过“形似”的低级阶段,投入“神形兼备”的全新意境,百度是怎样作念的?
一、乌镇大会上的AI新风向:数字东谈主成大模子经典落地场景世界互联网大会“最初科技奖”是群众互联网科技发展的一个风向标。
在本年的世界互联网大会乌镇峰会上,评审委员会从34个国度和地区搜集了424项科技效果,经海表里行家评审,最终彩选出17项年度最初效果。
其中,算作交融了大语言模子与多模态工夫的翻新哄骗,百度“脚本开动多模协同的高拟真数字东谈主工夫”收效入选。一同入选的还有中国科学院计较工夫询查所、中国科学院软件询查所的“处理器芯片软硬件全自动想象”,清华大学“北斗三号卫星导航信号要道工夫及哄骗”等效果。

▲2025年世界互联网大会最初科技奖受奖现场
当下,数字东谈主正成为AI最具代表性的落地场景之一。百度“脚本开动多模协同的高拟真数字东谈主工夫”体现了这一趋势,不仅是语言、视觉、语音工夫的交融翻新,更是百度多年AI工夫的集大成者。
从2023年“常识增远大语言模子要道工夫”到2024年“文心智能体工夫”,百度成为独一取悦三年获奖的东谈主工智能公司。
二、缘何“高拟真”?5大中枢工夫,为数字东谈主注入“灵魂”往常咱们谈数字东谈主,更多是温雅“像不像”;而今天百度的数字东谈主,仍是投入“酷似”的维度。缘何“高拟真”?
其中枢,在于以文心大模子为内核的“脚本开动多模协同工夫”,让数字东谈主具备了自我会通、贪图和饰演的才气。该工夫有以下五大翻新点:

1、脚本开动多模协同:为数字东谈主注入“灵魂”
传统数字东谈主依赖东谈主工脚本和单模态开动,而百度的这项工夫能生成一份真确瞻仰瞻仰上的“脚本”, 脚本生成的中枢在于语言模子开动下的多模态协同,不仅有“说什么”,还有“怎样说、说的时候怎样配合动作颜料”。
比如,当提到“规矩纹”时,视觉系统会自动指向对应面部区域;当数字东谈主“送福利”时,语音模块会自动蜕变语调,进展出繁盛姿色。甚而在双东谈主互动时,还能标志“在哪个词后接话”,收尾无缝对话。
这让数字东谈主不再仅仅“讲话的模子”,而是真确领有导演级的多模态抒流配合力。

2、交融多模贪图与深度想考的脚本生成:让对话当然通顺
数字东谈主不啻能说台词,还能“想考剧情”。百度通过交融多模贪图与大模子推理,收尾了对对话险阻文的举座会通。
在直播中,数字东谈主不仅能按照预设脚本鞭策,还能左证直播间及时热度及用户反馈,智能蜕变西宾节律与互动本色,收尾衔接当然的动态交互。
这恰是数字东谈主老罗能秒采取罗热梗,展现出明显东谈主设与豁达语言作风的工夫基础。
3、动态有筹划的及时交互:赋予“临场反馈”才气
基于大模子的及时感知与有筹划才气,数字东谈主不再是单向输出的播报机器,而具备了访佛真东谈主的现场“判断力”。
它好像会通弹幕批驳、感知直播间氛围,并据此作念出及时反馈,如回答用户发问、玩梗互动、蜕变西宾计谋,从而极大进步了互动的真实感与用户的参与感。
4、文本自控的语音合成:告别“机械诵读”
声息,是数字东谈主“灵魂”的另一半。百度的语音合成大模子通过“文本自控”机制,让声息开脱机械诵读感,收尾与抒发与语义、姿色高度一致。
其中枢在于,模子能深度会通直播台词的文风与语境,并纠合发音东谈主(如罗永浩)的特有特征,将文本信息“翻译”成当然、裕如感染力的声息。
通过对话险阻文编码器,百度措置了双东谈主直播中声息配合的辛劳,收尾了罗永浩与朱萧木数字东谈主之间通顺、当然的对话效果。

5、高一致性超拟真长视频生成:挑战“时长极限”
数字东谈主直播经常握续数小时,怎样让其在永劫刻内保握颜料、动作和场景的当然连贯,是一项行业辛劳。
百度通过纠合多模态视频会通、跨模态信号生成等要道工夫,攻克了高可控交互、永劫刻一致性保握等业界辛劳,收尾了高一致性、超拟确凿数字东谈主长视频生成,将AI视频生成的哄骗范围从“秒级”拓展至“小时级”。
罗永浩数字东谈主直播6小时全程动作当然、视野交互精确,等于这一工夫的效果。
不错看到,百度以“神、形、音、容、话”的长入才气,构建一个兼具抒发力与姿色力的数字东谈主系统。它不仅仅效法东谈主类,而是在会通东谈主类抒发逻辑的基础上“再创造东谈主类体验”。
三、从罗永浩到万千场景:10万数字东谈主,闪开播资本暴降80%顶尖的工夫价值,最终需要通过大鸿沟哄骗与实简直在的生意效益来考据。
在百度,这项获奖工夫的鸿沟化落地已现成效。官方数据自满,基于该工夫已坐褥特地10万个数字东谈主,遮蔽电商、拔擢、法律、健康等数十个行业,助力商家开播资本裁减80%,直播转动率进步31%。
以“罗永浩数字东谈主”为例,其6月15日的首秀不仅是工夫实力的展示,更是一场收效的生意现实:
整场直播握续6小时,AI调用常识库1.3万次,生成9.7万字居品西宾本色,双数字东谈主搭档作念出超8300个动作。从直播效果来看,整场直播蛊卦1300万东谈主次不雅看,GMV冲突5500万元,部分中枢品类带货单量甚而特地罗永浩5月真东谈主首秀同时数据。
罗永浩本东谈主也通过视频默示“让我骇怪”、“竣工收官”,称数字东谈主直播“可能代表了电商直播的新趋势”。
▲罗永浩的数字东谈主直播
工夫红利正浸透至千行百业。在山东德州夏津县,三位平均年纪超65岁的老支书,借助百度“慧播星”数字东谈主工夫,进行7×24小时不远隔直播,精确西宾居品、及时文告问题。通畅数字东谈主直播短短一个月,他们的地瓜直播间订单近万单,总销售额冲突15万元,收效售出农居品3.3万斤。
据悉,这种“真东谈主+数字东谈主”双轨样子已酿成可复制的助农旅途——百度电商“一村一品”边幅通过“慧播星”等工夫,累计匡助寰宇1000多户农民增收,商品往复总数超2500万元。
不错看到,从超头主播的直播间到田间地头的助农现场,百度数字东谈主工夫正在智能客服、虚构教师、数字代言东谈主、互动文娱等多个领域落地吐花。
结语:AI数字东谈主迎工夫产业升级,带来生意新增长点从罗永浩直播间里阿谁能接梗、会互动、神形兼备的数字东谈主,到赋能十万数字东谈主裁减生意资本、进步转动效力的产业平台,咱们看到,以大模子为中枢的AI数字东谈主工夫,已成为开动产业升级、创造生意新增长点的远大引擎。
数字东谈主的发展,已走过“形似”、“酷似”,正投入百度所界说的“高拟真”、“高劝服力”阶段。而改日,数字东谈主或将真确在某些方面超越真东谈主,收尾超长待机、千东谈主千面、多语言多作风的极致工作。
往常的十年,百度在AI上的每一次冲突,齐像是铺设通向改日的基石。世界互联网大会展现出的新风向标明J9九游会体育,工夫永远宗旨与系统化布局是推动智能产业发展的必由之路。
