2023-12-30 09:08
2023年以来,大模型赛道百花齐放,中国数字科技领军企业纷纷公布了大模型研发的进展。今年9月,腾讯混元大模型正式亮相。10月26日,腾讯宣布混元大模型迎来升级,正式对外开放“文生图”功能。
“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新的思路。大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生接受采访时表示。
始于技术
从年初到年尾,我国人工智能“百模大战”趋于白热化。在这一年时间里,国产大模型奋起直追,有媒体评价,中国人工智能技术水平已经处于世界第一方阵。
然而,大模型赛道的高质量发展终究不是靠数量取胜。“自主研发大模型是大模型领域发展的必然趋势。通过研发把关键技术牢牢掌握在自己手里,可以保障国家安全,提高产业竞争力,并实现关键环节自主可控。”业内人士认为。
对此,腾讯深以为然。“腾讯混元大模型是从零开始训练,公司掌握了从模型算法、机器学习框架、人工智能基础设施的全链路自研技术。”腾讯集团副总裁蒋杰介绍。
根据腾讯在全球数字生态大会上披露的信息,腾讯混元大模型是一款由腾讯全链路自主研发的通用大语言模型,其模型参数达到了千亿级别,在中文创作、复杂语境下的逻辑推理和可靠的任务执行等方面均有良好表现。
在语义理解方面,腾讯混元大模型同时建模中英文实现双语理解,并通过优化算法提升了模型对细节的感知能力与生成效果,有效避免多文化差异下的理解错误。在内容合理性方面,混元文生图通过增强算法模型的图像二维空间位置感知能力,让生成的图像结构更合理,减少错误率。在画面质感方面,混元文生图基于多模型融合的方法,提升生成质感。
数据显示,在广告业务下的多轮测评中,腾讯混元文生图的案例优秀率和广告主采纳率分别达到86%和26%。
“大模型的全链路自研是当前国际环境下,中国发展通用人工智能最佳的技术路径之一。借助于全链路自研,逐渐形成体系化的产业链、人才链、技术链和创新链,走出一条发展通用人工智能的中国路径。”有学者分析称。
强于应用
研发大模型的最终目的,终究还是要让技术解决实际问题。“大模型的应用和研发同样重要。”腾讯表示,只有提供方便、强大的接入平台,才能让大模型真正走向应用。
业内普遍认为,大模型走向应用的目的,是能够提高效率,降低使用门槛,让用户能够更方便、更快捷地使用大模型,形成所谓的“随取随用”“开箱即用”。
而“开箱即用”的关键在于预训练基础模型的泛化能力,高性能框架提供的微调或扩展工程能力,以及应用平台的灵活构建能力等支撑。
据悉,基于自研机器学习框架Angel,腾讯打造了大模型接入和应用开发的一站式平台,让针对业务场景的数据处理、模型微调、评测部署和应用构建等多个环节,从以往“散装”的多团队协作方式,转化成流水线平台上自动化生产方式,让大模型的“开箱即用”成为可能。
实现“开箱即用”以后,大模型就可以快速融入各产业的业务应用中。官方数据显示,截至目前,有超过300个腾讯内部业务和应用已接入腾讯混元内测,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。
在外部,则有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户,通过腾讯云调用腾讯混元大模型API,应用领域涉及智能问答、内容创作、数据分析、代码助手等多个场景。
“中国一方面要继续优化自己的大模型质量,另一方面也要基于现有的产品,利用我国特有的超大规模市场和丰富应用场景,深耕应用层面,切实地为千行百业赋能。”业内专家表示。