李彦宏百度世界2024演讲：不是要推出一个“超级应用”，要打造数百万“超级有用”的应用

来源：

2024-11-14

“过去24个月，AI行业发生的最大变化是什么？是大模型基本消除了幻觉。”11月12日，百度创始人李彦宏在百度世界2024大会上，发表了主题为《应用来了》的演讲，发布两大赋能应用的AI技术：检索增强的文生图技术(iRAG)和无代码工具“秒哒”。

截至11月初，百度文心大模型的日均调用量已经超过15亿，相较一年前首次披露的5000万次，增长约30倍。李彦宏表示，“这条陡峭的增长曲线，代表着过去两年中国大模型应用的爆发。”演讲中，李彦宏再次强调，智能体是AI应用的最主流形态，即将迎来爆发点，它将成为AI原生时代，内容、信息和服务的新载体。

以下为李彦宏的主要观点摘选：

文心大模型日调用量达15亿，代表着过去两年中国大模型应用的爆发

“过去24个月，这种全球性的大模型狂热，究竟是一场新的技术革命还是新一轮泡沫？作为中国人工智能的扛旗者，我想我们是有资格回答这个问题的。大家请看这张图：这是文心大模型的日均调用量变化曲线图，到今天这个数字已经超过了15亿次。这是一条非常陡峭的增长曲线，代表着过去两年中国大模型应用爆发。说实话，这个增速是超出了我的预期的。

过去24个月，AI行业的最大变化是大模型基本消除了幻觉

“去年三月，文心一言发布的时候，我们说百度大模型的特色是知识增强、检索增强。后来发现，检索增强不是百度特色，而是逐步成为了行业的共识。检索增强的手段，英文叫RAG，就是Retrieval-augmented Generation。当然，我们是做搜索起家的，这个方面理应做得最好。这个手段的意义在哪呢？它就是让大模型基本消除了幻觉。

“所以，如果你要问我，过去这24个月，对这个行业而言，最大的变化是什么？我的回答一定是，大模型基本消除了幻觉，它回答问题的准确性大幅提升了，这让AI从‘一本正经的胡说八道’，变得可用、可被信赖。

检索增强的文生图技术iRAG发布，整体效果远远超过文生图原生系统

“今天，文字层面的RAG已经做得很好了，但是图像等多模态内容和RAG的结合还不够。大家请看这张图，这是我们用一个开源模型生成的一张北京天坛的图片，看上去确实有点像天坛，但总觉得哪儿不对。告诉大家，真正的天坛长这样，是三层，但模型生成了四层，这是文生图比较典型的幻觉现象。这种幻觉现象，今天仍然很普遍，所以今天的多模态大模型，没有什么成规模的应用出来。就是幻觉没有解决，至少没有像文生文RAG解决得那么好。”

“今年年初，我们决定要解决图像生成的幻觉问题。我们开发了一项颠覆性的技术叫做iRAG，就是image based RAG，检索增强的文生图技术。之前，完全基于大语言模型的文生图系统，生成的图片常常是“一眼假”，甚至是逻辑不合常理。百度的iRAG，将百度搜索的亿级图片资源跟强大的基础模型能力相结合，就可以生成各种超真实的图片，整体效果远远超过文生图原生系统，去掉了机器味儿。”

“随着AI生成图片的可用性大大提高，它的应用空间也随即打开了。比如在品牌宣传场景，以前拍这样一组海报动辄需要一二十万，甚至大几十万，但是现在创作的成本接近于0。简单说来，iRAG的商业价值体现在：无幻觉、超真实、没成本，立等可取。”