事实上,大模型并不是突然就有了这么强的能力,回溯根源,突变来自于2013年的一项技术侧进化——word2vec,奠定了从自然语言向量化表征过渡到预训练大语言模型智能理解、生成、交互的技术基础,这个技术解决了自然语言可计算的问题。
于海华称,在2013年之前是传统NLP语言模型,侧重建立并优化分词、句法、语法等抽象规则体系,针对每个特定任务,训练专门的模型对应,用人类对语言的理解去教机器。而2013年后是深度学习—生成式预训练模型,即把自然语言文本串转化为表征语义相关性的可计算向量,预训练过程以无监督学习为主,也就是让机器自学,同时预训练模型本身“涌现”出泛化能力,也可进一步微调优化。
同时还有用户侧的进化,从Web1.0到Web2.0再到Web3.0,从早期用户创造内容,到现在用户UGC生成主体,以及UGC技术瓶颈被AIGC打破,AI可以帮助用户生成大量有趣的内容。于海华表示,这个过程相对漫长,但已由量变引发技术跃迁。
联想控股前瞻技术研究院在2022年9月围绕元宇宙的进化整理了一张图谱,并随着技术的进化在不断更新。该机构认为“原宇宙”包含时间和空间两个维度,在过去几十年的时间里,随着电子化、信息化、数字化的发展,人们积累了大量信息化系统,同时自动化、软硬件的优化使技术堆栈越来越复杂。好的一方面是人们积累了大量好的数字内容,不好的一方面是造成了技术割裂,所有人类知识分散在不同的软硬件系统里,基于此,需要通用的智能技术。
“在此背景下,AIGC经历了几波起伏发展到今天,这是技术侧的进化——从物理原生世界向数字世界完善进化。”于海华称。
同时还有用户侧的进化,即“源宇宙”的进化。于海华表示,“目前,全球大概有50亿人都在网络化生存,人们离不开网络和智能手机等,人们的生活也在走向虚实共生社会进化。人与人之间的沟通通过自然语言表达,每个人的大脑实际就是自身的大语言模型,我们理解别人说的话,然后生成我们想说的话,也会借助IT技术把它表达成数字化文字和画面等多模态内容借助网络传播。”
但如何让机器理解人类的语言?AIGC技术就填补了这个空白,它可以理解人类告诉它的内容,并生成人类想让它输出的数字化内容。于海华表示,“AIGC技术从时间线上来讲,解决的是可重演的时间线问题。什么意思?就是人类积累的所有知识都可以喂给大模型,在掌握了这些知识后,所有积累过的知识大模型都可以重演,这是第一环。”而AGI技术就是下一个节点,它解决的是“势”的问题,让时间线变得可预测。
于海华表示,AI或者大语言模型积累了足够多的人类知识,可以越来越精准的预测出未来可能发生的事情,打通原宇宙和源宇宙这两个环后,就具备将来元宇宙终极形态成立的基本逻辑,也就是统合物理世界和数字世界,同时借助于通用人工智能,甚至将来超越人类水平的超级人工智能,来驾驭复杂技术,而人类只需要通过自然语言跟机器沟通交流。
“未来,元宇宙、原宇宙和源宇宙融合后,人机融合智能加速引擎将成为其中的活动主体,我们非常期待未来出现这个加速节点。目前,人类在AIGC领域迈出了第一步,我们在等待AGI迈出下一步。”于海华如此表示。