5·18国际博物馆日·数字体验|快来体验!汽车科普AI数字人来了!
2025-05-16 11:22 来源:  北京号
关注

最近在生活中总能听到一个词——“大模型”。大模型究竟是什么呢?它又能做些什么?

大模型是大的“模型”(不是这个)。

当我们看见绿灯亮起,眼睛会向大脑输入图像,大脑思考分析后,会输出一个指令:可以过马路。中间负责思考分析的框架,就是模型。

听起来就像是人类的神经系统。

没错,我们现在常说的大模型,就是通过模拟大脑中神经元的连接方式,输入的数据中学习并生成有用的输出。

但是人类的大脑与机器模型之间有本质的区别。

正如我们描述红绿灯。我们大脑中先产生概念:红绿灯、绿色灯亮、指挥交通,根据我们的语言逻辑,选择合适的词语组成完整的句子。

而模型不是这样。大模型能够写很长的内容,不过是“文字接龙”的数据续写。简单来说,就是:根据前面的内容,基于概率,预测下一个词是什么,然后把这个词接上,再预测,再接上,循环往复,其实它并不知道自己在说什么。(你也可以管这个叫:自回归)

大模型就这么一个个词的猜,直到猜完一整篇文章。

也正是因为模型只是单纯地进行词语接龙,基于它已有的数据给出回答,这就容易造成“幻觉”。

如何尽量减少模型的“幻觉”呢?

很简单,让“猜”变得更加精准。不过这里又出现了一个新问题:AI是如何判断哪个词可能性最大?又是如何理解我们写的内容呢?

答案是:“预训练”。你可以把它想象成 AI在正式工作前,先进行大量的“阅读”学习。但这个“阅读”过程,不仅仅是“塞”数据,还包含了 AI的“消化吸收”,将每一个知识拆成小块并打上标签存储起来,就像大雄的记忆面包一样。

因此,当猜词的数据库足够丰富庞大,回答也就会更加精确。

大模型之所以被称为 “大”,是因为它所使用的数据量和拥有的参数数量极其庞大,可以达到千亿级别的超大规模。

这些数据,不是随便网上下载得来的。整个数据需要经过收集、清洗、脱敏和分类等过程。这样可以去除异常数据和错误数据,还能删除隐私数据,让数据更加标准化,有利于后面的训练过程。

当“投喂”了海量数据后,我们就要像教孩子学习一样,对大模型进行训练,让它学会更好应用数据。

经过训练的大模型,拥有了两项重要的能力:泛化和涌现。

这时的大模型,已经是一个“成熟”的大模型了,可以解决许多通用的问题。但是,它还不够专业。因此,如果要成为“专家”,就要在预训练模型的基础上,使用特定任务或领域的数据集进行进一步“微调”训练,以优化模型在该任务或领域的性能。

现在,经过“微调”训练的汽车科普AI数字人来了!通过向它提问,可以了解“游客服务中心在哪里”“四层进步馆有多少个展区”等等通用大模型难以回答的复合问题。

并且,北京汽车博物馆为“AI数字人”塑造了一个通过计算机技术生成的虚拟数字人形象。这个数字人不仅在外观上与人类相似,还具备大模型赋予的智能和交互能力,是您乐游汽博的绝佳选择。

大模型的相关知识已经介绍完毕,那“AI数字人”如何体验呢?

观众体验途径:北京汽车博物馆三层未来馆

北京汽车博物馆三层未来馆创新未来展区中设置有AI数字人一体机,期待您现场进行互动体验。

供稿/宣传教育部


作者:

北京汽车博物馆

打开APP阅读全文
特别声明:本文为北京日报新媒体平台“北京号”作者上传并发布,仅代表作者观点,北京日报仅提供信息发布平台。未经许可,不得转载。