对话北京智源人工智能研究院院长王仲远:大模型远没有到泡沫临界点
北京商报

2024-08-06 20:54 语音播报

热点关注

“叫我仲远吧。”相比王院长,他更习惯这个称呼。

2024年2月,北京智源人工智能研究院(以下简称“智源”)宣布王仲远成为第二任院长,他在2018年荣获“《麻省理工科技评论》35岁以下科技创新35人”;并有微软、Facebook(现Meta)、美团、快手的工作经历,科技圈很想听听这位“85后”院长心中人工智能的当下和未来。今年3月,中共中央政治局常委、国务院总理李强在北京调研时专门来到智源,详细了解大模型前沿技术研发情况。

在接近一个小时的专访中,王仲远与北京商报记者就当下人工智能行业待破的瓶颈与泡沫、中美互联网发展的差异、国内大模型价格战走向、智源的定位及发展规划等问题进行了深入交流。

“9.11和9.8哪个大”,难倒大模型不奇怪

Q:“9.11和9.8哪个大”的问题最近难倒了一众大模型,您怎么看这个结果?

A:我一点都不惊讶。从研究者的角度看,大模型的惊艳感来自于它解决了人工智能之前很难解决的理解、推理、常识性问题,但它没有解决所有的问题,比如数学。我们发现看起来很容易的数学题,大模型反而做得不好。做不好比数字大小的题,并不妨碍大模型的持续进化以及产业落地。

Q:大模型火爆一年半,业界的判断更加理性,您认为人工智能是否达到了泡沫临界点?

A:还远没有到所谓的泡沫临界点,这是我非常坚信的观点,大模型大的序幕才刚刚拉开。iPhone从诞生到迭代至大家公认好用的iPhone4、iPhone4S,有四年时间,大模型从实验室到产业界才一年半,但我赞同大模型的能力需要持续提升,也要针对不同的场景去打磨应用。

百模大战,证明我们的市场化不错

Q:百模大战打到现在,您依然对价格战持保留意见吗?

A:大模型的迭代需要持续性投入,百模大战显然不利于基础大模型发展,会造成资源分散。价格战的利好在于可以筛掉一些不是真心投入大模型研发的企业,也有利于发现场景,并且针对场景打磨应用。不过,我希望价格战不要导致企业不敢投入研发,就好比iPhone,如果对比的始终都是第一代产品,那离想要的目标会渐行渐远,这是我不愿意看到的。

Q:如果价格战无法避免,您对大模型to B(企业)有什么建议?

A:想要建立to B的生态需要企业愿意为软件付费、为大模型付费、为知识付费,这是我特别想呼吁的。只有形成这样的生态,才既有利于大模型的发展,也有利于使用大模型的企业发展。

价格战只是推动大模型普惠的一种方式,更重要的是大模型的效果。我更期待大模型能在B端找到提升效率的场景,或企业发现大模型能更好解决问题的场景,这是大模型to B需要解决的。未来一两年内可能就会看到一些成熟的B端大模型应用出来。

大模型to C(用户)可能需要更多的耐心,因为用户对于体验非常敏感,研发人员认为大模型面对“9.11和9.8哪个大”问题不会比大小很正常,但用户无法接受它不会这个问题。

Q:中国互联网曾出现过百团大战、千播大战,这场百模大战可能怎样收尾?

A:在美国,每个行业或领域出现一两个巨头后,其他企业就会开始打差异化。国内不管是互联网还是移动互联网都经历过充分竞争,我觉得这说明我们的市场化不错。在这种情况下,最终能胜出的企业,竞争力和战斗力更强。

要做高校做不了,企业不愿做的研发

Q:人工智能不等同大模型,智源在大模型上的力量匹配有怎样的计划?

A:人工智能发展至少有三大流派,符号主义、连接主义和行为主义,分别对应着知识图谱、神经网络、智能体,大模型只是神经网络中的一个分支。大模型之所以不同,是因为它将海量数据通过神经网络进行压缩,让我们看到了它在常识、推理方面的进步。大模型确实不等于人工智能,但是大模型是当下人工智能的重要推动力,智源的愿景是成为人工智能创新引领者。我们依然会在大模型方向投入很多资源,去持续地解决挑战性问题,但也依然会布局大模型以外的人工智能技术。

比如,不久前智源发布了大模型全家桶,有语言大模型上的共性研究,也有多模态、生物计算、具身智能大模型三个方向上的前沿研究,智源还在做类脑、数字心脏等研究。

Q:2018年智源在科技部和北京市委市政府的指导和支持下成立,如今人工智能是发展新质生产力的重要引擎。智源在其中扮演什么角色?

A:智源是一家独立的非营利性研发机构,在中国科研体系中扮演着独特的角色。高校模式已经运行了几十年,较难有组织、有规模、跨团队地做系统性研发。企业也会投入做研发,但面临着激烈的业务竞争和生存压力,更倾向于研发与业务强相关的。智源会做高校做不了、企业不愿做的研发,做3—5年甚至更长时间才能看到成果的研究项目。

Q:智源是新型研发机构,保持对重大科学问题的敏锐眼光,未来3—5年有什么规划?

A:2024年北京智源大会上的研究进展和成果发布就是我们的答案,我们对整个人工智能尤其在大模型技术发展趋势上做了判断:从语言大模型到统一的多模态大模型,再到具身智能和生物计算模型,最终到世界模型、AGI(通用人工智能),这是我们对整个人工智能技术路线发展的判断,主要是攻克一些技术难题。

原生的多模态大模型,从一开始就把不同模态的信息,比如文字、图像、视频、语音放在一个模型里训练,这样的多模态大模型能像人类大脑一样理解和推理。

大模型跟硬件结合,也就是具身智能,这是未来一个非常重要的发展方向,它使人工智能不再存在于虚拟世界,能进入物理世界服务人类。

微观角度就是生命科学,人工智能技术可以对生命分子进行理解、建模及推理,它对于AI制药以及整个制药产业有重大帮助。

智源希望人工智能能够像人类一样对这个世界建模,最终实现AGI。

Q:为了赶上大模型浪潮,企业面临压力和挑战,智源是否也有紧绷感?

A:当下整个人工智能行业确实面临非常多的挑战,同时又有激烈的竞争,大家永远都在快速奔跑的路上,最终比的是谁跑得快,又不摔倒。

智源聚焦人工智能的原始创新,焦虑感主要来自于能不能在人工智能技术领域取得国家急需的技术突破。所以智源既要明确要做什么,又要想清楚做这些能不能真的取得突破,并且最终有利于整个人工智能乃至更大的产业发展。

年轻,成为智源的标签

Q:作为“85后”院长,您非常年轻,也拥有丰富的互联网大厂经验,您怎么看这一标签?

A:过去十几年,我个人的经历可以分为两大段,一段是毕业之后加入微软亚洲研究院,那是一段偏科研的经历,后来从一个纯科研机构进入企业,将人工智能技术落地到具体的业务里。在互联网行业我已经不算年轻人,而是一个老兵了。

在科研机构,很多人会认为“85后”做院长比较年轻,我想这恰恰是智源的特质。智源提倡青年人挑大梁,不论资排辈,智源很多非常重要的科研项目,都是很年轻的科研人员来承担的。比如,我们原生多模态大模型的负责人还不到30岁,生物计算大模型的负责人才30岁出头,具身大模型负责人也是30岁左右,与其说年轻是我个人的标签,我更愿意把它作为智源的标签,我也非常欢迎所有年轻、有冲劲、有想法、有能力的青年科学家加入智源,一起做未来的研究,一起做核心技术的突破。

Q:任何研发都高度依赖人才,智源在人才引进上有什么优势?

A:人才始终是智源这样的新型研发机构的核心要素。智源非常重视年轻人,只要有能力、有想法、有冲劲,就能拿到最顶尖的科研岗位和项目。智源很多的资源调配,都围绕核心和优秀的人才展开。

深蓝智库

编辑:杨子墨

打开APP阅读全文