大模型这把火还在持续燃烧。
近日,不止百川智能、蚂蚁相继对外发布了自己的大模型,腾讯自主研发的通用大语言模型混元(下称“混元大模型”)也在9月7日亮相,并通过腾讯云对外开放。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生当日表示,腾讯将迈入“全面拥抱大模型”时代。
(相关资料图)
历经大半年,国产大模型早已从原来的卷技术转向卷应用。早前第一批大模型应用在8月末通过备案并对外上线,也已经意味着大模型所代表的B端市场竞争将更加激烈。
混元终亮相
腾讯方面公布的数据显示,混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。
据记者了解,针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%。此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。
不过腾讯集团副总裁蒋杰表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中”。他当天介绍称,腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。他在采访中还透露,混元大模型已经向相关部门备案且已获批。
同其他大厂研发的大模型一样,混元大模型也已经同腾讯的内部业务对接。
《华夏时报》记者从腾讯方面了解到,目前混元大模型已经接入腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议等50多个业务并取得初步效果。据悉,混元大模型的微信小程序腾讯混元助手也已开启内测,目前处于排队申请试用中。
混元大模型更大的目标是“改造”千行百业。
今年6月,腾讯云首次对外公布了自己的MaaS服务解决方案:它打造了一个行业模型商店,覆盖金融、文旅、政务、传媒、教育等10个行业,在这些能力模型基础上,客户加入自己独有的场景数据,就可以快速生成自己的“专属模型”。
记者还从腾讯方面了解到,混元大模型将作为腾讯云MaaS服务的底座,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。汤道生当天也表示:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新的思路。大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。”
B端竞争激烈
腾讯看到了大模型背后的产业市场。
汤道生当天在发言中称,腾讯已经和1万1千家生态伙伴展开紧密合作,推出了覆盖100多个产业场景的行业解决方案。此外,去年生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的4倍。记者还从腾讯方面了解到,目前腾讯云已经助力百川智能、智谱科技、MiniMax等企业打造大模型。
而在今年Q2财报中,包括腾讯云的“金融科技及企业服务”依然是腾讯最大的收入来源,约486亿元的收入同比增长15%,占到腾讯Q2总营收的32%,这也是这一业务连续第九个季度营收占比超过三成。腾讯相关高层在8月16日晚间的业绩说明会上还表示,今年下半年腾讯还将在云业务方面做出更多努力,腾讯最新发布的MaaS有望为云业务带来新的增长点。
但随着国内大模型产业进入“百模大战”,腾讯也面临着激烈竞争。
以与腾讯并称BAT的另外两家为例,在通用大模型方面,百度和阿里在今年3月和4月间相继发布了文心一言和通义千问。在MaaS领域,它们的思路看起来也与腾讯一样。百度CTO王海峰今年5月在中关村论坛期间表示,未来MaaS将成为云计算的主流商业模式,大模型将与实体经济深度融合。阿里云CTO周靖人在今年5月的中关村会议上也提出,Model as a service概念正在被广泛接受,模型会作为业务和开发系统开发的重要生产元素。
而对于国内大模型市场化的一个关键节点是,8月15日,《生成式人工智能服务管理暂行办法》正式实施。自8月30日晚间起,以百度为代表的多家国内大模型相继宣布获批上线,对公众开放,这意味着大模型市场的竞争更加激烈。
对于大模型市场眼下的竞争局面,盘古智库高级研究员江瀚对《华夏时报》记者表示,多家大模型通过备案代表了市场在合规的同时也保留了充分的竞争,市场的多元化属性依然非常明显,这是符合当前市场发展初级阶段的一个状况。他认为,国内的大模型的商业化空间还是很大。
深度科技研究院院长张孝荣则认为,腾讯的混元大模型有一定后发优势,在算力上有腾讯云提供保障,在数据上腾讯在内容产业有广泛布局,可以用来训练的语料规模足够大,在场景上腾讯可以针对旗下社交、新闻、视频、游戏等诸多互联网场景进行应用训练,“有可能探索出新的道路。”不过他同时也对记者表示,由于大模型产业处于发展早期,依然是投入大产出少,需要大量烧钱,进一步完善技术创新,进而提升AI成熟度。
(文章来源:华夏时报)
关键词: