Baidu, Inc. (HKG:9888)
Hong Kong flag Hong Kong · Delayed Price · Currency is HKD
118.70
-1.20 (-1.00%)
Apr 30, 2026, 4:08 PM HKT
← View all transcripts

Baidu World 2025

Nov 13, 2025

好玩吧,这还是我第一次看到自己的照片动起来。这些我一路走来的珍贵瞬间都被AI变成了生动的视频,就像旁观了自己的成长过程。原来好的技术能帮助我们留住这么多美好的回忆,太有趣了。大家的网盘里也都留着小时候的照片吗?我也想看看。用百度网盘搜索我的名字,就能生成我的同款回忆视频。在评论区告诉我,我去给你点赞。 假期不知道去哪儿,打开百度地图看看。 帮我规划个广西十一假期路线吧。 结合你爱美食、爱自驾的偏好,为你安排了轻松不赶路的顶流景点,上干货。 出发。 前方10公里拥堵,我这儿有条更快的路。 好的,前方最近的出口下高速。 好嘞,下高速后往前5公里,刚好有个景区,能看到特有的喀斯特地貌。 喀斯特地貌是怎么形成的? 雨水溶解石灰岩,形成了溶洞和山峰。还有什么想问的,可以随时和我聊聊。 帮我找个适合拍照、看日落的地方。 西洋山必打卡,五星好评,绝美落日超出片。每一段你想去的地方,我都伴你出行。 出行有我在,很荣幸成为百度地图的代言人。以后出门问路就来百度地图找我吧,顺便把我的导航语音也安排上。出发。 小度想想2.0,出行更简单,AI更懂你。 现在游戏的最高配置不是多贵的显卡、多强的主机、多大的屏幕,而是能够陪你一起玩游戏的AI伙伴。我们上线的豆豆游戏伙伴1.0,是一个可以陪你玩游戏、追剧、伴你生活的AI搭档。 成交,好耶。 在测试阶段就收获了800万用户。通过VRM模型,豆豆游戏伙伴已经实现对所有游戏的通用支持,理解玩家当前的游戏画面和进展,自主识别场景,陪你一起经历喜怒哀乐,还可以在线为你出谋划策。从游戏中获取到画面后,服务器会进行大量的计算,并把结果传给大语言模型。这些服务我们都托管在百度智能云上。这种高并发即时交互,中间的计算量非常大,对系统稳定性的要求也很高。百度智能云为我们提供了一个强大、稳定的技术底座,让我们的AI伙伴在一秒内就能对游戏画面做实时理解,又结合上下文知识库做深度推理,快速准确响应用户的需求。1.0发布后,大量用户涌入,当天流量暴增。在百度智能云团队的协助下,快速实现了三次连贯的线上扩容,整体耗时不到10分钟,高效保障了用户体验。现在的多模态大模型,可以让AI成为理解你此刻正在经历什么的朋友。未来我们将继续和百度智能云携手,一起用AI为全球更多的游戏玩家带来快乐。 这里是上小河村,一个藏在贵州大山里的原生态村落。村民的箩筐盛满四季风物,在更深处的林间,鹿茸正悄然生长。这些大山深处的宝藏,如何不再被群山阻隔? 我们去入场了。 还有一台车多。 不着急,现在不是有数字的吗? 乡村振兴最重要的还是产业的一个中心。我们就去调研了一下接引过来的张总,他在团结村的梅花鹿产业,把他引到了上小河白族村来,帮助这边的一个产业的发展。 最近这一个星期,我们销出去有30多万,但是更多的大部分呢,也还在积压着,就300多斤,还放在冰柜里。 这款鹿茸中段红粉切片。 对于养生人士来说,真的是非常好。 今天拍下的,我们尽快给大家发货。 现在在处理工作,但是我同时也在直播。 凭借百度会播星数字人的能力,今年6月,他和小鹿一起出现在了百度优选的直播间里。 当时我们录素材的时候,也就几分钟的时间。当我没有想到直播间的时候,我能够无限制地讲了那么多的内容。是在今年的6月份,就是我们在季节参加的一个电商的百度的一个AI的培训,就了解到了AI直播的这么一个项目和内容。 我现在也是在跟我们帮助的几个产业,茶叶、玉米,我都在给他们做AI直播的一个介绍和推荐。 希望在数字直播间的这样的一个带动下,更多的一些乡村,更多的一些农户,更多的一些产业,能够用AI直播有更好的一个增收致富的一个渠道。 当AI技术将山野的沟壑运平,源自大山中的优质农货便有了被看到的希望。每个山老都能与万家灯火紧密相连。 尊敬的各位嘉宾,欢迎来到百度世界2025。本次大会将于2分钟后开始,请您尽快落座,并将手机调整至静音状态。感谢您的配合。 有请百度创始人李彦宏先生。 各位来宾大家好,欢迎参加2025百度世界大会。百度世界呢,是我们一年一度最重要的技术和产品的发布会,从2006年至今已经是第20个年头了。我还清楚地记得呢,第一届百度世界大会的主题是"世界从你开始"。它表达了一种期许:百度世界呢,不是百度的世界,它是一个开放沟通的平台。我们可以聚在一起,探讨前沿技术,碰撞创新思维,洞察未来趋势,看看世界如何改变我们,我们呢又如何改变世界。这才是百度世界大会的真正的意义。 过去一年呢,作为从业者,我们最大的感受啊,就是AI在各种生活生产的场景,都能够看到明显效果了。AI的产业结构呢,从不健康的正金字塔型的结构,正在向健康的倒金字塔型结构在转变。过去呢,AI产业呢,像是一个正的金字塔,最底层的芯片拿到了绝大部分的价值,芯片之上的模型呢,拿到的价值不到1/10,而模型之上的应用呢,它的价值又小了一个数量级。这样的产业结构显然是非常不健康的,是不可持续的,因为芯片并不直接产生价值,对吧,应用才能够产生价值。但是现在呢,大家的兴奋点还是更多的啊,聚焦在芯片和模型这个这些个层面。科技巨头和AI新贵啊,交叉投资,相互抬升估值和市值。那么市场呢,也因此有质疑,就说AI有泡沫。 那么什么是倒金字塔型结构呢?就是说芯片厂商不管赚多少钱,芯片之上的模型要能够赚到10倍的价值。那么基于模型开发出来的应用,能够创造100倍的价值,这样才是一个健康的产业形态。过去一年呢,我们看到模型的能力逐步的走出了聊天机器人的范畴。我们看到数字人技术、代码智能体技术,甚至呢,是通用场景的能够自主演化、寻找全局最优解的智能体的技术,都有了长足的发展。应用层创新不断,开始为我们的生活创造出全新的体验,为我们的工作带来从未有过的高效率。 因此呢,我们更关心如何让AI跟我们要做的每一项任务都能够进行有机的结合,让AI成为企业发展和个人成长的原生的推动力。换句话说,就是怎么让每一家企业、每一个个人都能够内化AI这个能力,把AI用起来,真正的创造价值。因为当AI能力被内化,作为一种原生的能力,智能呢就不再是成本,而是生产力。它能够帮助你提升决策质量,发现新的增长点,让成本更低,利润率更高,创新的周期更短。它能够增强每个人的能力和创造力。 今天任何一家企业,只有用好AI才能够立于不败;任何一个个体,只有用好AI才能够掌控未来。那为什么是今天啊?因为我们正在跨越这么跨越这么一个全新的临界点,就是从智能有限走向效果有限。AI不再是看起来很美的掩饰,而是用起来真香的解决方案。这正是我们把本届百度世界大会的主题定为效果有限的原因。我们坚信,再先进的技术,如果不能够落地为具体的应用,解决具体的问题,创造具体的价值,都只是空中楼阁。 AI的效果有限,将体现在商业决策的更新、创意灵感的迸发、用户体验的重塑。AI效果有限,让智能成为每一个企业的新的增长引擎,让智能成为每一个个人的创造力引擎。 下面呢,我们会给大家展示,在智能生活的场景下,AI涌现出了哪些效果。在智能生产力的场景当中,效果涌现又是如何渗透到千行百业中的。那么基于应用驱动的方式,我们新一代的大模型又将有哪些个创新和突破,给这个世界会带来怎样的改变。 首先让我们看一看,在智能生活场景下的效果涌现。刷短视频、看直播啊,在直播间下单购物,这些个行为已经成我们我们日常的这个移动时代啊,日常的这个行为。但是呢,这些个行为跟今天流行的文字版的聊天机器人几乎没有交集啊,而数字人将会改变这一切。 数字人呢,是一个多模态的全新的产品形态,具有非常大的应用前景。因为数字人本质上,它是一个基础性的技术啊,甚至是AI时代一个全新的啊,通用的交互界面。为什么这么说啊?首先呢,AI的本质就是让机器更像人类。数字人让AI拥有了人的面孔,它就变成了一个有表情、有语气、有情感的可交互的对象。数字人呢,让人机交互变得像和真人的对话一样自然。其次呢,作为一种底层能力,数字人不仅可以被用于电商平台,也可以被用于教育平台、医疗平台啊,或者是用于咨询啊、客服、销售等等场景。也就是说,任何需要人机交互的地方,都能用上数字人。一个由数字人深度参与的时代即将到来。 过去一年呢,数字人技术其实有了重大的飞跃,在电商直播、内容创作、品牌营销等等这个应用当中呢,都实现了效果涌现。双十一刚过,我们呢就来看一看数字人在电商直播当中的表现。 小木,你有没有发现,我们每次卖牛肉丸,都有一种在做美食节目的感觉?嗯,你看这画面,这灯光,这角度,特别像专业的那些美食节目,对不对? 哎,你这么一说还真有点那意思,画面感有了。下次咱们再卖点火锅底料,直接在直播间算起来,让同学们看看这个丸子到底有多弹。 是的,说不定能弹到屏幕外,直接弹到你们家里。 那可太方便了,直接弹到嘴里,连门都不用出。 好,这个可以研究一下,弹色似牛肉丸,世界首创。来,同学们,链接已经上好了,咱俩可以下单了。 大家好,我是惠波星数字人的产品经理柏志雄。刚刚大家看到这场直播呢,我想如果不是Robin提前说明的话,相信在座的各位也很难看得出来,这居然是一场数字人直播。那也没错啊,正如各位所见,现在的数字人直播带货呢,甚至已经实现了超越真人的效果。 我们的惠波星数字人在618和双十一两次电商大战当中,都表现亮眼。本次双十一期间,83%的开播主播都曾经使用过数字人直播。我们的开播直播间数同比增长了119%,GMV同比提升91%。而其中老罗的数字人更是再创辉煌,充分证明了数字人技术的可靠性与商业价值。 而今天在这里,我也很高兴的向大家宣布,老罗同款的高说服力数字人技术,现在已经实现了平台化,可以作为一个标准化的服务,向全行业开放。我们希望千千万万的带货主播,都可以克隆出自己的数字人,人人都能成为超级主播。那下面我们就一起来看一下,如何从零开始,轻松打造一个高说服力的数字人直播间。 如何拥有一个高说服力数字人?一键克隆超级主播,表现更生动。首创单双人直播间,满足更多需求。主播人设可设定,实现个性化直播。支持多品换品,主次品自由调整。Agent自主思考,剧本脉络分步规划。多种智能体配置,玩法更多样。动作、声音、表情生成,完美贴合剧本。形神音容高度统一,开启高说服力直播之旅。 这个香熏拿着倒过来,也根本不会洒出来。除此之外,它还可以放在家里面的卫生间啊等等这些异味重的地方。对,再给大家看看报告。 大家可以看到啊,搭建一个数字人直播间的操作,真的非常的简单,也是在最近呢,领跑汽车和我们的惠波星合作,共同为领跑的首席运营官徐军先生打造了他的首个数字人直播间。那么这位直播新人的数字人到底表现如何,我们也一起来看一下吧。 咱这二六款全新的领跑411呢,不管你是平时上班代步,还是说节假日出去玩,他肯定是你的首选。那我看评论区有好多人在问支架功能咋样,行,导播给大家切个外景,咱们这就出发,带大家看实际效果。 大家看,我们配置了17.3英寸的中控大屏,还配置了140度厘米级精度,支持300米的激光雷达。呃,即便是过几天的小雪节气,路上遇到打滑的时候,这车的自适应控速、智能变道,还有小范围避障这些功能,开起来也觉得让你心里踏实,安全感是直接拉满。 那正如大家所见,我们的数字人主播会根据直播间内观众大家最关心的智驾问题,立马给出回复,并且在直播当中插入智驾功能相关的介绍,并且呢,还会结合近期的天气小雪来介绍汽车的防滑功能。那也正是因为数字人的这些智能化能力,让直播间的流资转化从碰运气变成有方法。领跑的数字人直播间线索转化率提升了44%,订单成本降低了64%。 那不仅如此,数字人在内容直播领域也展现出了巨大的潜力。我们也已经在知识科普、历史人文、情感解读等多个领域进行了成功的实践。数字人也正成为每个内容创作者的智能搭档。 那接下来呢,我们也将正式发布一项数字人的全新能力,实时互动型数字人。它在高说服力数字人强大的感知与决策的基础上,进一步的升级,不仅能基于真实世界的信息给出及时的反馈,更可以在互动当中流露自然情绪,将数字人的互动性提升至新的高度。 那今天呢,在我们百度世界的现场,我们也将现场连麦老罗的数字人直播间。大家可以扫描我们屏幕上方的二维码,进入到我们的互动页面。有什么想跟老罗的数字人聊一聊、说一说的、问一问的,都可以留言。那再次感谢现场和线上各位观众朋友们,对于我们百度世界的热情关注。那我们再次把舞台交给Robin。 有点遗憾哈,就是刚才这个啊,实时互动啊演示呢,没有能够啊让大家现场体验。刚才也是说了,我们在啊二楼的这个啊展位上,大家可以去啊自己去体验一下。其实呢,我们在这个之前演练的过程当中,觉得这个效果还是啊非常令人惊艳的啊。 主要呢,它在连麦的过程当中呢,会啊首先是这个嗯,非常的及时的能够响应啊。其实有有我,我觉得基本上有三个这个特点吧,一个呢就是实时响应啊,它这个数字人呢,从接收信息到做出反应,一般都是在一秒之内,跟真人对话的这种反应时间呢,是差不多的,还能够实现这个多模态的协调统一啊。这方面呢,在技术上百度一直是非常领先的。 那第二个特点呢,就是生情并茂。数字人在这个给出反馈的时候呢,它能够像真人一样,展现出细腻的这种情绪变化啊,表情、声音、内容和情绪呢,能够高度统一啊。像有时候我们需要啊连线的过程当中,让比如说让老罗做一些动作,那么细节的动作呢,它能够像真人一样做得鲜活和自然。 还有一个特点啊,就是这个实时互动数字人,他其实不光是能够对你的语言啊、语音进行反应,实际上呢,他也能看到你就是连麦者的这个形象,以及你的背景啊。所以呢,他会根据现场的环境呢,做出一些啊相关的这种判断。所以数字人呢,对真实世界呢,他是有深度理解的,并且呢敏捷的给出回复啊。所以这种细致的感知力量呢,也是以前的技术没有达到过的。 未来呢,实时互动型的数字人将在这个行业咨询、售后服务等需要高信任、高时效性的这个服务场景当中,发挥更大的价值,成为人与服务之间的高效连接。 今天呢,我们就在这里宣布,惠波星数字人技术全面向全球开放。所谓全球呢,我们是首先在巴西落地生根,现在有大约20%的数字人主播呢,每分钟的订单生成能力啊,已经超越了真人主播。我们知道呢,海外这个电商直播啊,发展的核心瓶颈就是本地化的优质主播非常的稀缺,而我们的惠波星数字人技术呢,已经在跨文化啊的这个商业场景当中,产生了实实在在的效果。 接下来呢,我们还将啊发力东南亚啊、美国等等这些个国家和地区,积极拓展像Shopee啊、Lazada这些个平台。我们计划将模型与服务都直接部署到海外的这些节点,那么可以充分保障全球用户的购物体验。 随着技术的突破,数字人呢,将成为企业的数字员工啊、个人的数字分身或者数字伙伴,将为我们的智能生活带来巨大的改变。比如啊,我们最熟悉的这个搜索场景,数字人智能体呢,就在给我们带来全新的体验。 现在啊,当你打开百度APP,希望解决问题或者完成某个任务的时候,搜索呢给你的不再是一条条的链接,而是用图片、视频甚至直播这些个副媒体形态来直接满足你的需求。如果呢,这些个副媒体内容在网上并不存在,那我们的AI就可以立刻生成它,并且是专为你而生成。那么注意,AI不是在生成文字,而是在生成图片、视频和直播流。 当然呢,直接满足你需求的,也可以是一个数字人智能体,它能够实时的理解你、陪伴你,帮你解决运动、健康、理财、法律等等方面的个人问题。北方的冬天呢,冰雪运动是很受欢迎的,大家相关的问题也很多。现在呢,你可以对话东奥冠军张红的数字人智能体,全面细致的了解冰雪运动。我们就来看这样一个例子: 初次玩冰雪,一定记住做好防护,选正规场地,带好护具,别挑战高难度。滑雪装备拿不准,拨通电话我帮你看看。 我准备去滑雪,我身上这件衣服合适吗?我还需要准备什么类型的衣服吗? 这件冲锋衣比较适合作为滑雪时的外层防护,中间层推荐抓绒衣、轻薄羽绒服、化纤棉服,贴身层务必用速干面料,避免纯棉才能有效锁住体温,保持干爽。 2026年米兰科尔蒂纳冬奥会的时间,正好与春节假期重合,去米兰观赛旅游,有没有什么好的建议可以给到我? 这届冬奥亮点分成:意式风情、开幕式,别错过中国队的热门夺金项目。我还帮您拨通米兰旅游专家,为您量身解答。观赛之余,别错过米兰大教堂品会饭,后半程还可以感受年味十足的一国新年。走,我们一起去米兰大教堂! 这就是米兰的心脏,米兰大教堂。步行登顶,135根尖塔与3,000雕像宛如神迹。走进殿堂,52根擎天石柱,高耸的穹顶,巨型彩绘玻璃,栩栩如生的雕塑,庄严圣洁。2月意大利寒冷,记得备齐防风防水冬装,别忘了伸根签,一起奔赴米兰冬奥。 啊,对,刚才那个老罗数字人的连麦呢,效果应该跟这个差不多,只不过这个呢,它是多了一个,就是多人共同参与,它可以把另外一个数字人智能体呢,啊,拉进来共同参与这个对话。而且呃,你可以问他自己穿的衣服怎么样啊,之类,说明他能看到你穿的什么啊,衣服手里拿的什么东西啊。 数字人智能体呢,代表了百度用AI重构搜索的啊,一个切面。2023年文心一言发布之后呢,我就公开说,百度呢,要做第一个把所有产品都用AI重构的公司,而第一个进行重构的产品呢,就是搜索。我当时提的要求,是要引领搜索行业的代际变革。 百度搜索的AI重构,从一开始呢,就不是从从容容、游刃有余的,期间有很多的纠结和挣扎。但是在今天看来,百度还是全球所有的搜索引擎当中,AI化改造最激进的。我们用AI重构了搜索页面,这不是简单的在AI结果当中插入一个AI的摘要,而是呢,把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片、视频等副媒体内容为主的AI应用。 现在啊,绝大多数这个搜索结果都是由AI生成的了,而且呢,首条结果的副媒体的这种覆盖率已经达到了70%。那这意味着什么呢?就是说现在你搜索10个问题,有7个答案呢,首先出现的都是副媒体,不是一条条的文字链接,而是一个图片、一个视频、一个直播,甚至是一个数字人。那么这样的展现形态,能够精准的满足用户复杂的搜索需求,让搜索体验更好,这个在全球是没有的,是我们的创新。 下面呢,我请我的同事徐丽给大家展示几个相关的例子。 大家好,我是百度搜索产品经理徐丽,下面我会和大家一起看几个百度搜索AI重构的例子。首先来看,如果用户提出了一个比较模糊的问题,百度搜索会给出什么样的答案? 一个外国电影,讲一家人收养了一个小男孩,后来小男孩靠打橄榄球改变了命运,成为运动冠军。这个电影叫什么? 麦克早就习惯了流浪,饿了就去捡别人吃剩的爆米花,困了就睡家学校体育馆,直到淘气太太的出现,才彻底改变了他的命运。 刚才这个例子可以看到,因为有了深度理解能力,模糊问题也能得到答案。这一切呢,都让整个搜索的发问方式产生了变化。不仅如此呢,多模态的理解能力呢,让AI搜索从理解语言,跃升到理解视觉、语音,甚至创意灵感,让用户的提问方式表达都更加的自由。这是以前的搜索做不到的。 我们来看下一个例子,您可能问了一个很小众的问题,那这个问题在网络上呢,是没有特别匹配的视频内容的。AI搜索会怎么办呢?我们可以通过AIGC生成视频。 科学家是怎么判断一个动物相当于人类几岁智商的? 动物与人类的智力存在本质区别,难以直接比较,但科学家仍可以通过一些标准进行粗略评估。首先是镜子自我认知测试,能通过此测试的动物,如海豚、黑猩猩,展现出了初步的自我意识,这标志着认知水平达到了人类1.5至2岁以后的阶段。 这个视频的内容呢,太小众了,没有多少人愿意去生产,也很难在现在流行的短视频平台被分发出去。但是当你需要的时候,它就可以立刻出现。理解的门槛呢,比纯文字的内容要低很多,也更加的有趣。 还有一些问题呢,比较的个性化,您可能需要建议或者一对一的咨询。那这个时候呢,我们就可以调用前面展示的数字人智能体来满足您的需求。不仅如此,AI搜索还通过调用MCP Server与真实世界的服务做链接,将原本需要您做的很多复杂操作,甚至要跨多个APP才能得到的效果呢,简化为了一步到位、一次交付。我们来看一下这个例子。 现在电动车已经换新,还有国家补贴吗? 首先搜索结果给出了明确的答案,有补贴,还有呢,可以会提供视频的一个解读。在下方呢,我们调用了京通MCP,用户呢可以直接进入官网进行注册申请。在结果页的下方,我们还调取了电商MCP,用户可以直接下单购买享受国补的电动车。 那百度搜索呢,通过MCP让生态伙伴提供的服务都能智能的被调用,被用户即时的触达。从找信息到完成任务,这是AI带来的质变。我们希望AI搜索可以成为您身边的一个助手,甚至是万能搭子,帮您实现从知道到做到的飞跃。我们来看一下这个例子。 嗨,你来了!看到这盒头孢复星纸片,是身体不舒服需要用药,还是想了解它的用途呢? 这两个可以一起吃吗? 头孢与铝碳酸镁片不建议一起吃,铝碳酸镁片具有中和胃酸的作用,一起吃可能会降低头孢的吸收率,使其作用减弱。因此对于需要吃这两种药物的患者,建议分开吃。 可以看到,AI不仅准确识别出了两种药物,给出了服用建议,还自动呢帮用户生成了一份用药计划,选择采纳之后呢,每天就可以定时推送给用户。这个呢,是我们的用户都特别喜欢的一个功能。 当然,我们希望搜索不仅仅是被动的响应,AI搜索更能根据您的兴趣、个性等主动的推荐内容给您。因为大模型呢,具备有长期记忆和理解推理能力,它可以推测出用户的下一步意图,进而去生成个人专属的定制化内容。那这种极致的个性化,会让推荐和搜索之间的融合更加的丝滑。 我们来看一个案例,可以看到AI搜索呢,知道用户有肠胃疾病,想养橘猫,最近呢又很关注AI工具,所以就主动帮用户定制了调理食谱、胖橘搬砖专属头像和专属播客。 那新的能力呢,也带来了各种新的可能。我们特别惊喜的发现,我们的用户总是能脑洞大开,让我们来欣赏一下。 我是百度搜索,其实我也没想到,我的工作里居然有这么多出乎意料的场景。 这些食材怎么组合?有时候我要看这些食材怎么组合,可以让他填饱肚子。 冷门邪修,隔壁小孩都常哭了。有时候我要当他的玄学造型师,给他一些好运气。 穿搭信我,做事一路绿灯。小女,哈哈哈,老是你赢了,这又什么意思啊?我也要客串下象棋教练,把你困住的棋盘由我来接盘。 我知道怎么赢了。哎,我还要帮助迷路的外国人。我想起了那个船船,重启来船船,这熟悉又陌生的口音。 船船来喽,哎呀,我也听得懂噻。拍的好哎,这个真好看,这能做出来不?有时候我还要有一些超能力,让数字版的你先享受世界。 可以啊,人生大事,我可以做你的赛博红娘。你俩真是绝配,新婚快乐! 啊,我是谁?现在小学生的题都这么难吗?家庭小事,我也可以是你的电子导师。 宝贝,这道题其实很简单,三角形DCE的底,随时向我发问吧,无论何时何地,只要你需要,我就会以各种形态出现,给你最好的结果。 百度搜索,你的万能搭子。 我们的用户呢,总是特别的有才华。那百度搜索呢,接下来我们还将持续上新,也让我们一起来解锁更多的新的玩法吧。 除了前面展示的自我重构呢,我们还通过AI API的形式,把最前沿的搜索能力开放出来。那什么是AI API呢?大家知道,今天几乎所有的AI原生应用,都需要搜索引擎的能力来补足AI的部分。但纵观全球,其他的搜索引擎要么不提供API服务,要么呢就特别的贵。 那百度呢,我们将搜索能力向全球开放,我们专门为AI开发了一个搜索引擎,它沉淀了百度25年的搜索技术。百度已经和三星、荣耀、Vivo等主流厂商展开了合作。那在这些厂商的AI助手里,虽然名字不同,但底层能力都是百度提供的。目前已经有625家厂商通过了百度智能云,接入了我们的搜索API,可以说百度搜索的AI API正在成为整个行业的技术底座。 AI不仅为搜索打开了新的空间,也创造着更多全新的可能。那Coding Agent呢,是最近一年多都非常火的赛道。接下来就请我的同事朱广祥为大家分享秒搭的最新进展。 大家好,我是秒搭的产品负责人朱广祥。去年的百度世界上,我们预告了秒搭的来临。秒搭一句话所应用,今年一季度我们上线了1.0版本,今天已经进化到了2.0。 秒搭2.0主要强化了两个方面,首先是全站应用一键生成,简单说就是做应用的整套环节,秒搭全包了。从开发、调试、部署到线上托管,用户都可以一句话操作,就算是小白也可以轻松上手。第二是一站式的开发与分发,用秒搭打造的应用可以一键发布到公网,可以打通百度搜索,享受搜索引擎的一级流量曝光,还支持发布成微信小程序,玩转私域运营。 那最近呀,我发现很多用户都用秒搭做了自己的个人主页,很多人还不满足于此,增加了各种功能。那我们今天也现场,我们做一个个人的闲置物品电商平台,我们可以直接用大白话告诉秒搭,描述需求,然后我呢也提前写好了,打开看一眼。 我说要创建一个闲置服装交易平台,它有很多的功能,因为呢我们还是希望它非常完善,所以我这里提了一系列诉求,比如说这个商品的展示、AI的试衣、下单支付,还有后台的管理,这有两个端,一个商家端,一个用户端,那需求还是非常多的。 那我一键复制,直接告诉秒搭,点击发送。那秒搭它的原理就是后台一堆智能体,一起合作,一起协作,为我们打工。第一步是产品经理智能体,他开始工作了,他分析完我们的需求,他再写一个非常专业的产品设计文档,帮我们把产品都设计好。我们看到屏幕上,这个产品设计文档已经出来了,我们一起看一眼。我们刚刚提到的这些需求啊,它都是实现出来了啊,还是非常专业的,不错。 那我们直接点击立即生成应用。那第二步就是程序员智能体开始写代码了。那写过代码的小伙伴啊,现场的小伙伴们啊,写过代码的可以来比一比,看看谁写的快。反正我从初中开始写代码,写到博士毕业,快20年了,对于这样一个电商系统,没个一两周,哎,我还真搞不定。而秒搭就只需要几分钟,这是过去无论如何也想象不到的。 我们今天就来体验这个流程,我们可以看啊,在右侧的对话区,已经看到智能体的思考过程,还有使用工具去工作的这个过程。然后左边的工作区呢,就能可以看到啊,他已经开始往外一个一个蹦这个代码了,他还是挺卖力的。我们先让他先干着啊,我们一会再回来看一下。 然后呢,我们这个桌面屏幕就在舞台的右侧,咱现场观众帮忙看着啊,如果什么时候生成好了,提醒我一下啊。然后我们大屏幕切换到我们下面的环节。 呃,其实呢,咱们线上观众很多呃朋友,其实其实几乎所有人都已经用过秒搭生成的应用了。大家呃,有些朋友可能已经注意到了,就是本次百度世界大会,从邀请函、官网到流资餐会、现场活动的整套系统,都是由秒搭无代码生成的。所以说大家都真的又已经用上了。 那我们来看看,上周的方案又换一版,官网进度现在怎么样了?他还要改方案,变还要改,哎,你再改方案就无法正常交付了。 你以为我们是这样工作的?其实我们有秒搭,嗯,界面美了,逻辑稳了,需求齐了。哎,又来需求了,哎,交给你秒搭吧。 不仅于此,秒搭发布以来,已经有各行各业的人通过完全无代码的方式,生成了40多万个应用,平均每一分钟就有一个应用落地。这些应用已经累计服务了超过千万的用户,覆盖了教育、办公、电商等众多领域,在秒搭的广场上都可以便捷的找到。 那我们也用一个片子来一起看看,一句话做应用,还是一句话,调配更多超能力,再多来点。一句话做应用,人人都是开发者。 看了秒搭做了这么多应用,我们可以感受到,无代码开发越来越成为一个火热的赛道。最近权威的分析师机构IDC做了测评,从工具完备度、产品体验、生成效果等多个维度综合来看,在中文环境下,秒搭是行业第一。 另外,秒搭不仅服务于国内市场,也在积极探索出海。秒搭海外版Midu已经正式扬帆出海,目前已在全球产品搒Product Hunt上取得了一个日搒第一的成绩,初步获得了全球客厅用户的认可。那海外的朋友们,大家可以访问Midu点Dev来快速体验了。 哎,我看现场的这个小屏幕上,已经看到这个平台已经生成好了。那导播老师帮忙切到大屏幕,直接投一下桌面,可以看到啊,智能体在提醒我们这个完成微信支付啊,这是最后一步了啊。因为我们现场是要真的付款,真的收钱,所以说我来配置一下我的微信商户号,需要填写APP ID啊,我找一下APP ID,然后商户号,还有密钥,这个大家可当没看见哦,哈哈,这个密的啊,上传API证书,先证书证书,上传公钥啊,这个大家看不见,我不打开啊,提交,简单几步啊,显示我已经完成配置了。 那我们体验一下这个最终的结果。首先呢,我们先代入一下店主,我们直接进入商家后台,这里啊,应该是商业后台,点击啊,因为我之前呢,在我的需求里已经配置了一个默认的用户名密码作为管理员,那我直接进商家,这个密码大家肯定也猜不到。嗯,登录,可以看到商业后台有很多功能啊,有商品的管理、订单管理、用户管理啊、轮廓图等等的都可以配置。 那今天呢,我们上传一件商品,我就进这个商品管理啊,新增商品,然后上传一个商品图,上传,到冬天了嘛,上传一件羽绒服,名称白色羽绒服,白色羽绒服,价格随便写个吧,10元,库存分类,服装橙色全新,然后啊,新品推荐,我看这里显示说如果开启之后能在首页啊,这个置顶,那我选择,然后可以看到啊,我们现在这个商品已经发布成功了。 那我们再直接进入我们的用户端,去体验用户的购买流程。那这里呢,我看他需要我这个手机号验证码登录,那我就输一下我的手机号,啊,发送验证码,啊,可以看到验证码已经收到了,非常真实啊,774525,774525,然后同意用户协议登录,已经进来了,可以看到刚才这个店家上传的这个最新的一个商品,我们打开这个白色羽绒服,那咱们现场观众朋友们有没有对这件衣服感兴趣的啊,可以举个手来上台体验一下购买流程啊,大家可以举手了。 哎呦,我看这位小姐姐笑得好开心呀,呃,这一排第三位穿白色衣服那位,要不就你了。您好,您好,啊,请问怎么称呼? 呃,我姓高。 哦,高女士,啊,我能问一下你刚才为啥笑得这么开心吗? 因为我刚刚看到你放在桌子底下羽绒服了。 哦,啊,你你觉得我是会真给你是吗?真机灵啊,啊,那行,那我们来体验一下这个购物流程啊,就是呃,AI11呢,就是我们给智能体提了一个需求,它可以让你直接看一下上身效果,要不要体验一下? 呃,可以的。 好,那我来给您拍个照。麻烦帮我拍好看一点,谢谢。 啊,必须好看,必须好看。找好角度啊,美美的啊,可以。看可以吗? 啊,可以,可以。 好,我传到电脑上,等一会啊。个工头送啊,对,可能有点慢啊,没关系啊,刚才也预备了一个模特,他也可以帮你体验一下。啊,我们上传一张模特图吧,A11。我觉得他其实身材和你差不多。啊,对,因为确实啊,这个传输还挺慢的,线上可能人比较多,那我们直接用这张模特啊,他带你来试衣啊,其实差不多的,看一下。 然后啊,借这个机会呢,然后也给您以及我们线上观众介绍一下后台原理啊,就怎么怎么着,就突然出现了一个AI11呢,其实就是啊,秒搭后台有一个非常庞大的插件中心,然后我们的智能体在开发应用的时候,它会智能的去识别我们的需求。如果分析我们做应用之外,还需要一些额外的功能,比如说需要AI11,那肯定是需要照片合成了,它会帮我们自动的集成文生图的插件,那比如刚才我们那个支付,它会集成微信支付的插件,那除此之外还有很多啊,比如上百度搜索等等的,对,我们现在也看到啊,这样的试衣效果已经啊完成了,就是直接看到了啊,穿上了羽绒服的样子,还是挺不错的。 那那我们满不满意?其实还挺满意的。 好的,那那我们直接购买啊,体验购买,然后我们点击立即购买,添加地址,呃,高女士是吧?刚才你说的姓高,高女士电话我随便写了,然后北京,北京我们应该在朝阳,然后会议中心,嗯,保存地址,添加成功,那么可以提交订单,然后进行手机微信支付,扫码。 哎,我靠,谁比我快啊,哈哈哈。 呃,感谢咱现场的观众朋友啊,啊,我刚才扫码比我比我更快,显示已已经支付啊,可能刚才咱们可能很多人都扫过啊,扫过码,这个朋友们都能看到是真实的进了微信支付,只不过有人手快了啊,没轮到我,那咱也感谢现场观众哎,帮你买单了啊,谢谢大家,谢谢大家。 那那就请回到座位吧,啊,好,谢谢,拿上你的羽绒服啊,这羽绒服是我们出的啊,哈哈哈,真给我。 说实话还是挺紧张的啊,啊,毕竟现场生成的,然后我们这个应用呢,其实主流程大家都体验完了,其实还有很多细节细小的功能,它不一定一次全帮你生成出来。那AI coding呢,就是希望我们去人机协作,与AI持续对话,持续沟通,不断去丰富我们的应用,可以持续的去迭代。 那今天啊,我们看到效果是这样的,但是呢,一个应用的成功,哎,不仅是要好用,还要被看见。我们可以看啊,右上角有个发布,我们点击发布,可以让秒搭的应用直通公网,比如这个平台发布到广场之后,经过内容审核就能被搜索引擎收录了。 那这个五脏俱全的电商平台,就是几句话做出来的,怎么样,是不是有种拥有秒搭啊,大家都可以做出BAT的感觉。秒搭的理念就是要实现技术平权和AI普惠,我们希望让每个人都能尽情的挥洒创意,随时随地落地想法。 大会前呢,我们还用秒搭做了一个体验官派送的应用,那现场观众朋友们可以扫描大屏上的二维码进行报名,我们将在大会的最后用这个秒搭生成的应用,先抽出10位幸运观众,成为最新的呃,小度AI眼镜的体验官,然后再抽出3位幸运观众,成为萝卜快跑的全球首批的体验官,有百度送大家到中东去感受无人驾驶的魅力。那祝大家好运,谢谢大家。 好啊,我们看到啊,呃,从旧金山到洛杉矶,从阿布扎比到迪拜,啊,无人驾驶呢,正在给越来越多的城市生活带来颠覆性的改变。它呢,不只是改变交通出行,它甚至会改变整个社会生态。 无人驾驶技术呢,已经越过了那个临界点,2025年,百度的萝卜快跑是高速发展的一年,这个呢,主要是得益于萝卜快跑领先行业的无人驾驶技术、丰富的运营经验和卓越的安全记录。萝卜快跑每周的全无人订单,我们刚刚宣布已经超过了25万,全球出行的服务次数总计超过了1,700万次,这是全球第一。 萝卜快跑的服务呢,覆盖全世界22座城市,全无人里程突破了1.4亿公里,自动驾驶的总里程数呢,累计超过了2.4亿公里,相当于啊,绕地球整整6,000圈。在安全性方面,萝卜快跑的全无人驾驶呢,平均行驶啊,要平均行驶1,014万公里,才会出一次安全气囊。啊,这个数据呢,不仅远超人类驾驶员的水平,那么也超过了我们同行谷歌的威猛。 现在呢,我们来连线一下中东的同事啊,月里小,看看萝卜快跑在那里落地的进展。 哈喽,大家好,哈喽,罗宾你好,哎,李晓你好,啊,你那边现在你那边现在几点啊? 啊,现在是本地本地时间早上6:27,这边呢,是比北京晚4个小时啊,现在也正对,正好是日出,所以我们的萝卜快跑也开启了新一天的工作。 对对对,我看你是在车上啊,能给我看一下周边的这个环境吗? 行,哦,您可以跟随我的摄像头来看一下我们周边的环境。嗯,对,我们现在所处的位置呢,是啊,阿布扎比亚斯马瑞纳赛道,那这里呢,下个月将迎来今年F1世界大奖赛的收官之战,那到时候全球各地的游客也会来到这边,那我们其实也会为全球世界,呃,世界各地的游客来提供接驳服务,那向全世界来展示百度领先的自动驾驶技术,让大家感受到来自中国、来自百度的科技力量。 啊,你那边这个运营啊,以来有碰到什么跟国内不太一样的问题吗? 啊,我们是今年3月份启动测试的,那整体进展还是非常顺利的,啊,而且现在我们已经进入了全无人商业化运营的阶段,同时呢,我们的规模和运营的范围也在快速扩大之中,我们也非常有信心和当地的合作伙伴一起打造阿布扎比最大的全无人Robotaxi车队,那这里呢,也非常欢迎大家,各位同学来阿布扎比亲自体验。 啊,好的,谢谢李晓,我们期待这个萝卜快跑早日改变阿联酋人们的呃,出行方式,谢谢你。 好好,谢谢Robin,那我们也将继续努力,将萝卜快跑带入更多的国家,更多的城市。 好嘞,再见。 好,谢谢。 我们看到啊,在呃,阿布扎比呢,现在还是早上,车也不是很多,但是呢,萝卜快跑在中国的这个更加复杂的环境道路上已经得到了充分的验证,所以呢,它可以在全球很多很多城市非常容易就能够上手,就能够跑起来,就能够运营起来。 全球领先的这个投资机构ARC呢,有一项研究表明,到2030年,美国Robotaxi的每英里的成本大概会降到$0.25,那么打车的需求呢,会因此被放大5到7倍。那么你可能会问,为什么降价会带来这么大的这个扩张?其实啊,道理也很简单,很多人原本呢,因为打车贵,会选择不出去,那么即使出去呢,也会选择公交、地铁啊,甚至是骑车走路。但是如果价格降到人人都打得起的水平,那大家呢,自然就会倾向于选择更为舒适和便捷的方式。 那么当打车足够便宜、足够方便的时候,需求自然就被激发出来了,无人车成为人们一个全新的移动的生活空间,能够带来非常非常多的新的可能。我们呢,就看这么一个视频。 萝卜切歌,好的,也为您换了首歌。 萝卜,帮我把按摩的力度加大一点。 喂,带着呢,我的作品它自己在路上。 既然方向盘会自己动,我们还要方向盘干什么? 这个地方再改改,这里好,谢谢大家,散会。 哎,你想烫头发呀?已为您开启无障碍长途模式。 对无人驾驶呢,不仅仅是出行方式的一次变革,更是未来城市的一个起点,它会带来土地价值、居住需求等城市空间的全面的重构。以前我们讲到房地产,都是说location、location、location,但是未来呢,这个位置就不像以前那么重要了。现在在城市最宝贵的地方,大量的位置呢,被用来停车,是非常浪费、非常不合理的。随着无人驾驶的普及,未来社会的状况会因此而发生根本性的改变。 那刚才呢,我们展示了一系列的AI的应用啊,数字人让每个人和AI都有自然、亲切、实时的互动和交流;秒答呢,让人人都成为开发者,一句话就能够做出应用来。AI的搜索呢,不仅用负媒体的方式直接满足用户的需求,还能够完成各种任务,成为你的万能的搭子。萝卜快跑呢,让你的出行更安全、更快捷、更舒适。 然而,这只是这场智能革命给我们带来的变革的开始,更大的价值还在生产力的提升。技术进步很快,AI新能力不断涌现。当下呢,非常重要的问题是企业如何内化AI能力,把AI能力呢,用在内部的生产、研发、运营、销售等等这些环节当中,升级为一种原生能力啊,帮助企业提升效率,扩大收入和利润。 目前看来呢,企业内化AI能力有三个代表性的应用方向。第一个就是AI能够替代重复性的劳动,最简单的,比如说像文心快马这样的辅助编程工具。那么今天呢,百度有52%的新增的代码是由AI生成的,对,就是已经超过了一半,但是我觉得还不够。我希望呢,是80%、90%的代码都由AI来生成。 那第二个方向呢,是生产力的无限供给,比如说AIGC啊,就是AI生成内容。未来呢,随着AI能力的进步啊,越来越多的内容都是靠AI生成的。刚才我们看搜索的这个结果,70%情况都是AI在生成这些搜索结果。那么这就会使得内容的供给变得无限多。以前啊,人们常说office是超级的生产力工具,但是呢,我们文库网盘Genflo啊,就是这样一个超越甚至颠覆office的产品。待会呢,会有机会给大家介绍这方面的这个新的进展。 第三个呢,第三个方向呢,是AI超越人类的认知。我们呢,会把越来越多的过程数据变成上下文,喂给模型。那么整个世界就会变成一个巨大的强化学习机器,模型呢,通过不停的迭代学习,就会变得越来越强大。AI呢,会发现我们过去不知道的东西,找到过去我们没有找到过的最优解。在这个方向上呢,我们今天也会有一个前瞻性的新产品发布。 下面啊,我们来一起看看在智能生产力场景,AI如何做到效果涌现,每个企业又应该如何内化这些AI能力。有请百度智能云沈斗博士给大家介绍。 大家好,刚才罗宾提到呢,企业要内化AI能力,让AI呢成为我们企业增长的新动力。为了让大家尽快的享受到这一红利,百度智能云呢,给大家准备了一整套完善的AI基础设施。 那么这套基础设施呢,包括两个部分,一个是AI infra,一个是agent infra。那所谓AI infra呢,就是算力基础设施,会为您提供强大的从芯片超节点、超大规模的集群到百个平台一系列的能力,解决您的算力供给的问题。agent infra呢,其实就是智能体基础设施,那会给您提供一套从智能体的开发到运营的系统,帮助您呢,在自己的场景里面用好agent。 我们先来看AI infra,那先说一下大家比较关心的昆仑新。其实早在2011年,我们就组建了昆仑新的团队,真可谓是这个十年磨一剑。那么在今年上半年呢,我们点亮了昆仑新P800的3万卡集群,这是国产算力发展的一个重要的里程碑。 P800呢,在百度内部得到了充分的验证,除了我们现在绝大多数的推理任务好在P800上之外,我们还基于一个P800的5,000卡单一集群,高性价比的训练出了一个多模态模型。而现在这个训练集群呢,已经扩展到万卡以上,正在训练更大规模的模型。 其实不只是在百度内部广泛应用,昆仑新也在互联网、金融、能源、制造、交通和教育等等行业落地,包括招商银行、南方电网、中国钢联、国家管网、吉利汽车、Vivo以及一家互联网大厂和一家超头部的运营商等上百家客户。交付规模呢,从几十卡到万卡以上不等。 今天呢,我们又有了新进展,首先发布全新一代昆仑新M100。M100呢,针对大规模推理的场景做了优化,充分发挥昆仑新自研架构的优势,使得MOE的模型,它的推理性能能够大幅提升。那么昆仑新M100呢,我们会在明年年初正式上市。 那么接下来呢,再发布下一款昆仑新M300。这款芯片呢,会在2027年的年初上线。这个芯片呢,主要是针对超大规模的多模态大模型的训练和推理,做了深入的优化,性能将会极为卓越,敬请期待。 那今天发布的这两款芯片呢,就是希望以极致的性能和低成本,为中国企业提供强大、低成本、自主可控的AI算力。 当然了,单个芯片的强大啊,只是一个基础条件。现在这些大模型的训练和推理,都不是你一颗芯片能够完成的,而是需要多个芯片来协同工作,尤其是在现在流行的这种MOE网络架构下,这个卡和卡之间的通讯量会急剧的增加。那么这时候呢,我们用传统的那种一台机器8卡的节点组成的这个集群,它在通信上就会有明显的瓶颈。所以我们就需要把几十张、几百张卡组成一个超节点,让这些卡呢,像一个超级芯片一样紧密的连接在一起,这样可以大幅的提高卡间的通讯。 但是呢,这个超级的方案非常考验AI infra厂商从芯片、内存、通讯、供电、冷却等一系列的这种能力的全站协同能力。那毫无疑问呢,百度是国内最早一批在这个方向上取得突破的厂商。 那在今年4月份的时候呢,我们基于昆仑新的P800已经发布了32卡和64卡的超节点啊,在座的客户呢,也有不少人在体验,市场反响非常好。所以呢,我们在这个方向上持续的加大研发的投入。 所以今天呢,我很高兴的向大家正式发布我们全新一代的超节点天池256。在现有这个超节点的基础之上,天池256呢,会把256张P800卡放到一个节点里,它的性能呢,相比我们4月份发布的那个超节点,单实力的这个卡间互联的总带宽提高了4倍,性能呢,提高50%以上。那么对比同等卡数的P800原来的集群,天池256的这个超节点,在主流模型上的推理任务上,单卡的吞吐提升了超过3.5倍。 另外呢,我还要再发布一个更强大的版本,天池512,同样基于P800,它在天池256的基础之上,卡数翻倍。所以呢,卡间互联的总带宽也再翻一倍。单个天池512的超节点,就可以完成万亿参数模型的训练。 那么这两款超节点的产品呢,我们会分别在明年的上半年和下半年正式上市。另外呢,我们也基于新发布的昆仑新M系列,在研发千卡级别的超节点。所以从27年下半年,我们就会陆续推出相应的千卡和4,000卡的超节点。 那么基础设施呢,是一个长期投资啊,我们会坚定的做好长期的布局。未来5年,昆仑新呢,每年都会推出新产品,持续的攀登算力高峰。当然不仅是硬件,我们也会继续优化软硬件之间的协同效果,进一步呢,提升我们算力管理的百格平台,它的熏推引擎的性能。所以通过持续的推出更强大的这种超节点、更快的网络、更好用的软件,我们会将昆仑新的单一集群的规模,从刚才讲的3万卡推向百万卡的级别,满足国内尤其是在座诸位日益强劲的算力需求。 那么AI infra之上的是agent infra,也就是智能体基础设施。我们知道,现在的模型已经具备了非常高的治理水平,但是呢,你想让它在产业场景中发挥更大的价值,还要有一套好的方法去组织、去运用它们。就像我们管理一个团队,同样一批人,你在不同的环境下用不同的管理方式,它的产出就会天壤之别。 那么agent infra呢,就是把agent所需的这些模型和上下文工具、运行环境等等,封装进封装进一个agent的这个系统,那去和真实的世界去交互。这时候呢,它就可以执行任务、获得反馈、持续优化。所以从这个角度来讲呢,这套系统的能力和模型的能力同样重要。 我们在agent infra,也就是千帆上,提供了我们最新版本的百度文心大模型,以及150多个主流的模型。但是你也可以通过千帆的这个模型开发平台去定制您自己的模型。模型之外呢,还有数据和工具。那么千帆的数据服务,它会把企业沉淀的这种数据经验、流程、规则等等,转化为模型可以理解的信息。那工具呢,它是agent和外界交互的核心能力。您可以通过千帆的工具服务来使用刚才提到的百度AI搜索、地图这样百度自由的组件。您也可以通过MCP啊去访问您企业已有的工具,或者是第三方那些丰富的组件。 另外呢,千帆还提供了一系列agent的引擎、开发框架和企业级的运行环境,也包括完备的权限管理和安全防护的机制,来确保您的agents安全合规。 那么正是基于刚才说的这套agent infra,我们跟客户呢一起深入产业,打造了一批服务于这个核心业务的企业级agents。那么我们就先从一件大家习以为常的人生大事说起:吃饭、出餐快、出品稳啊。这是现在这个连锁快餐深受年轻人喜欢的一个关键原因。但是呢,快餐店能做到这一点,它依靠的不只是厨师的手艺,更是一套标准化的管理体系。 我们知道门店里啊,多名员工、多种菜品、多个工序、时空交错,而我们要确保每一道菜从头到尾符合工序,传统的世界系统很难实现。现在呢,我们就基于agent infra打造了一个一键的多人协同SOP分析agent来解决这个问题。这个agent呢,它能够理解视频里面复杂的时间和空间的关系,能够识别出每一道菜它完整的工序,并且分析出来你在哪个环节出了错。 那么接下来呢,我会跟大家现场演示一下。比如我就是一个汉堡店的员工啊,收到了这么一个订单,包括两个汉堡啊、一杯咖啡。一会呢,我和我的同事呢会现场制作这个订单,看看agent是怎么工作的。 时间原因呢,我就事先做好了这个agent,不过我们可以先看一下这个搭建的过程。首先呢,我们进入这个一键的平台啊,第一步呢,就是要创建这个汉堡的SOP agent。我们输入这个提示词以后,让这个agent呢基于标准的视频,它来学习这个汉堡制作工序的这个规范。第二步呢,我们为这个agent来配置技能和工具。那么这里呢,既用到了这个多模态的大模型啊,也用到了CV的小模型,它就用来追踪你一个特定菜品的特定工序。最后呢,我们来给这个agent配置它的运行时间啊,一般呢就是默认门店的运营时间啊。这之后呢,我们就可以发布,绑定到门店的设备以后呢,它就可以工作了。 所以我们也用同样的方式呢,提前配置好了这个饮品制作的SOP的agent。那么把这两个agent都已经关联到了舞台上的这个设备。接下来我们就试一试啊。 那待会呢,我的两个同事他们来做汉堡,我来做这个咖啡啊,咱稍微规范一下啊。我把这个围裙带上,然后呢戴上手套。好,那咱就开始制作。我要先弄这个咖啡的萃取液,拿个杯子,我得装上冰,然后再倒150毫升的牛奶。好,然后牛奶加进来,牛肉保味,打粉呦,牛肉保味。 其实我同事漏了一步啊,那你赶紧改一下啊。哎,我把这个加进去,我再把咖啡倒上,盖子盖上,接上这个封口条。好,你俩速度比我快。好,我也差不多了。来,我把这个放进来。好,这时候咱们ready放到这个出餐区,冷饮未放吸管。 哦,忘了放吸管,未放吸管。急性的非常及时啊,这单就算完成了啊。这样的话呢,让这个世界上又少了一个因为没有吸管而emo的年轻人。嗯,啊,好,围裙。 嗯,所以后厨这活呢,还挺容易出错啊。我相信在座的诸位呢,可能大部分都有过这样的经历:外卖送烂以后不是缺米饭就是少筷子啊。好在呢,有了一键之后,它就能够准确的识别你在这个多人协作过程中的每一个操作失误,及时的纠正。 那么刚才的操作中呢,一键就准确的识别出了两个错误。我们可以点开第一个预警,我们看到这上面的这个红色的线段,它记录的就是你刚才忘了撒这个黑胡椒粉的哪一步啊。其实我们在跟这个客户共创这些的过程中呢,我们的客户通常会把这个看板就接入到他们自己的系统里面去。我们这儿呢,就复刻了一个客户的内部系统。从这里面我们可以看到哈,所有的工序,所有的出错步骤都是一目了然。 那另外呢,屏幕的上方啊,还统计了这个物料消耗的数据,这也是意见一个很重要的能力。这时候就可以帮助门店呢,准确的掌握你自己的库存,来进一步的降本增效。 那说完吃的啊,咱们再到下一个领域,看看金融领域。我们知道金融行业呢,瞬息万变,其中这个场外交易呢,变种多,要素复杂,每一笔询价都不一样。所以一名交易员呢,他常常要服务几十个客户,很容易跟不上节奏,错失这个交易的良机。所以我们和银河证券联合打造了场外交易agent,这