5月30日,腾讯宣布上线App腾讯元宝,这是一款基于腾讯混元大模型的C端应用,苹果及安卓应用商店均已开放下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,“腾讯元宝”提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,提供了多个特色AI应用,包括百变AI头像、口语陪练、超能翻译官等。
“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示,过去九个月腾讯对大模型的整个技术架构做了很大的升级,混元的多项能力都已经提升了50%。
刘煜宏还多次强调,今年以来大模型AI落地应用异常火热,但事实上互联网用户渗透率不足1%,产品和观念也未真正传导到C端核心用户中去,用户认知的提升还有很长的路要走,此时谈所谓先发优势、商业化都为时尚早。
AI应用的互联网用户渗透率不足1%
进入2024年,大模型AI产品发布会每月都在密集举办,各种产品榜单也层出不穷。不过,腾讯云副总裁、腾讯混元大模型负责人刘煜宏观察到,在火热表象下,当前的AI应用渗透率并不高。“国内的移动互联网用户有12亿多,大学生、很多互联网从业人员或职场用户都是高频用户,这些核心人群也有几千万。但现在大模型相关的AI应用去重之后,每家产品可能只有几十万或几百万的DAU(日活用户)。(DAU)合在一起看可能就是百万量级,对整个互联网12亿人群来讲渗透率非常低,可能不到1%。”
刘煜宏表示,造成渗透率低下的原因主要有两个,一是从技术能力上看,ChatGPT 3.5问世至今不过一两年,大模型技术目前仍在早期阶段,产品的成熟度并不够。“不管是大模型本身的能力,还是在产业每个领域落地的能力,离企业和用户的需求都非常远。另外,我们也看到很多高频的用户需要,但是现在大模型能力远远达不到这种水平,跟我们需要的场景匹配度也非常低”。
二是从用户认知来看,市场教育仍有较长的路要走。“我跟很多企业CTO或负责技术的高管聊过,问怎么看这个事情、有没有用?想了半天,他们提到的第一场景还是私人客服。过去一年多,我们在腾讯内部几百个应用以及在小程序端看到用户对AI的使用场景,差不多一半的人还是把它当成一个大搜索引擎。其实,原来的搜索引擎已经做得挺好,现在大模型可能更智能一些。还有一些人用AI来辅助编码、辅助文本提炼总结、画图或写创作文案、营销文案,这些都是比较窄的一些探索。”
超65%需求集中在工作学习场景
当前,大模型仍在快速发展期,从模型能力到应用落地存在较大“时延”。根据腾讯给出的数据,当前人们使用大模型相关产品时,有超过 65%的需求集中在工作/学习效率场景。细分来看,在面向C端大模型应用的场景中,“搜索问答”的需求达到了45%,“效率提升”“创意生成”和“创意聊天”分别为20%、15%和12%。
针对效率场景的三大核心需求:信息获取、处理和生产,腾讯元宝均进行了产品化探索。
在AI搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,并通过AI搜索增强,提升时新类和知识类问题效果,比传统搜索更有效率;同时,元宝内容覆盖微信公众号等腾讯生态内容及互联网信源,还会提供所引用的参考资料,并给出相关推荐,方便快速溯源及延伸阅读。这也意味着对创作者而言,元宝也成为了引流、导流渠道之一。
在AI总结方面,元宝可上传最多10个文档,并能够一次性解析多个微信公众号链接、网址,支持256K的原生窗口上下文,相当于一本《三国演义》,或是英文原版的《哈利·波特》全集;在AI写作方面,元宝不仅支持多轮问答,还能够将对话的内容整理成报告,按照要求进行结构化输出,提升信息从获取到处理再到生产的效率。
据悉,元宝也支持用户根据个性化需求,快速创建个人专属的智能体。除在元宝上提供自定义智能体外,腾讯混元也面向开发者和企业推出了一站式智能体创作与分发平台腾讯元器。
目前,腾讯元器已经全量面向用户开放。
可以看到,与近期包括OpenAI、谷歌、360、百度、百川智能等厂商押注的趋势一致,腾讯也将AI搜索作为自己的核心应用场景。谈及腾讯做AI常见功能搜索、文档总结、智能体等能力的优势,刘煜宏在会后接受媒体采访时表示,优势可以从腾讯的产品力、产品体系和研发布局上来看。
“一是腾讯产品或者工程能力比较强。腾讯服务了海量用户,工程方面同等情况下我们有更低的成本,做到更好。二是相较于其他AI产品,腾讯产品体系是最全的,我们打磨了这么久,从能力来讲对应用领域的适配度更强;三是大模型本身技术方面的优势,我们去年虽然发布产品比较晚,但是技术演进方面一点不落后。” 刘煜宏称。
“谈C端大模型产品商业化为时过早”
腾讯元宝产品能力升级的背后,是混元底层模型的持续迭代。据刘煜宏透露,从混元发布至今已过去九个月,混元已经做了多次迭代升级。“现在我们采用了比较先进的MoE混合专家的架构,一下子打开了天花板,相比过去的参数量大了很多倍,喂给它的知识含量也高了很多。在文生文大语言模型方面除了技术升级,能力也在过去九个月提升了超过50%的能力。”
具体来说,自 2023 年 9 月首次亮相以来,腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至7 万亿tokens,并率先升级为多专家模型结构(MoE),整体性能相比Dense 版本提升超50%。除不断提升通用大模型能力外,腾讯混元也支持角色扮演、FunctionCall、代码生成等领域能力,数理能力提升 50 %。
值得一提的是,腾讯混元大模型在视频、3D生成等方面也持续探索,目前已经支持16s视频生成,单图仅需30秒即可生成3D模型,相关能力也将于后续在元宝中上线。
目前,腾讯内部有超600个业务及场景都已经接入腾讯混元,腾讯广告、微信读书、腾讯会议、腾讯文档、腾讯客服等,都已经基于混元实现了智能化升级,同时在腾讯内部,混元的日均调用量是两亿次。此外为满足开发者及企业客户对于通用模型能力的需求,腾讯混元大模型已通过腾讯云对外开放,可通过API调用,也可以作为基底模型,为不同产业场景构建专属应用。
近期,一场关于大模型的B端价格战正打得激烈。但刘煜宏表示,就C端App元宝而言仍未到要谈商业化的时候。“toC的产品先发优势重要吗?除非你已经比较成熟抢占了这个位置。但现在渗透率才不到1%,先发优势抢到也就是百分之零点几,99%的用户都没覆盖,这个先发优势就有点微不足道了。从渗透率来看现在都不到1%,现在来谈整个行业的商业化也太早了。当然我们会把大模型的能力开放给到很多产品,比如腾讯会议、文档、广告等,它们有自己的商业化路径。”