朱民：跨越ChatGPT，看到大模型和AI的未来

启元社閱讀 23 2023-2-26 14:52

朱民 | 中国国际经济交流中心副理事长、IMF前副总裁

今天是一个经济学家跨界的时代，我讲的是ChatGPT，网上都在讲它确实厉害，很惊艳，前景非常好，大家都在讲怎么追随它、怎么做自己的ChatGPT，各个网站现在讨论很多，我借这个机会把我的观察给各位嘉宾做一个汇报。

ChatGPT很有意思，很有未来，它的基础是大模型，是GPT，它是延伸到GPT3.5的往前的一个应用。人工智能发展的核心转移是GPT，是大模型，不是ChatGPT，我觉得这个概念特别重要，理解这一点的话，我们要把所有的工作重点、赶超的重点、研究的重点放到大模型，放到GPT上来，而不是放在ChatGPT。当然，我们应该承认，我们在ChatGPT，在大模型上落后，但是怎么发挥我们的优势，这是在人工智能也是在中国未来科技创新，以及未来的经济金融发展中特别重要的一战，这确实是科技走到今天一个重大的转折点。所以我们要跨越ChatGPT，看到大模型和AI2.0以及它的未来。

ChatGPT横空出世，ChatGPT的出现有点像2016年阿尔法战胜了韩国的世界冠军一样，引起了所有舆论的关注，它的应用场景确实很多，比如财富管理中心，每个人都要填表，要做风险测试，以后就可以用ChatGPT做风险测试，把你的偏好需求全部搞清楚，剩下的就是机器和机器交换，构造财富管理的产品，做风险管理，做整个后台，精准度可以大大提高，产品也可以大大丰富，所以ChatGPT是一个很有意思的产品。

比如走向医院，给你看的第一个医生是ChatGPT，它可以把你的基本问题全部搞清楚，剩下的就是机器和机器的沟通和交流，给你做基本的解答，再加上人的辅助，做最终的解答。在这个过程中把数据全部留下来，这是了不得的事情。ChatGPT基本上是一个语言大模型，它是WebGPT的基础，最早是教上网查询的机器，但它主要应用了生成AI，可以不断推演、不断反馈，使得它的反馈学习加强，训练加强以后，能够把语言模型的输出和用户的意图连起来，反馈和强制训练强化一下就爆发了，这还是很厉害的。它的核心是Transformer、Transformer之后的ChatGPT1/2/3，它的核心还是在Transformer的集成，它是基于GPT3.5基础上的应用，它的好处很多，能记住大量的信息，搜索效率真的很高，它给我做经济学研究的文献索引不亚于我的助理，因为它的面广、快。

它能够保持对话和对话的一致性，但它也能承认错误，与此同时，它支持多种任务，支持艺术创造、改故事。我有一次让ChatGPT给我做翻译，翻译得非常优美，它可以编码，可以写办公邮件，它的用途是很广的，这就使得它特别火爆。它参加考试的话，可以考到中以上的水平，这是很不容易的，当然它有它的局限性，主要是输入的知识的局限性，它的时间点基本停留在2021年以前，我们用最新的东西试它，就有点跟不上。

从大的应用来看，它是从2020年5月份GPT3开始，一直到DALLE生成，到ChatGPT，从大模型发展的过程中长出来的一个东西。国内也一直在做大模型，但我们是落后的，落后两年左右，我们的生态也不够，所以不能从大模型衍生出ChatGPT应用。归根结底要回到什么地方呢？回到大模型，现在在ChatGPT大热的时候，在更深的层面上考虑问题，我们要看的是大模型的发展，这是影响今天、影响未来、影响中国、影响世界的最根本的科技发展。

大模型还是从GPT3开始，1150亿个变量，一路过来，我们有PanGu，我们也有百度，清华最近也出了一个GLM，现在世界上已经GPT3走到GPT4，所以大模型的发展应用是很厉害的。在大模型层面上走的最快的是深层次的人工智能，深层次人工智能能从文字转到图形、文字转到编程、文字转到影像录像，然后走向3D，一旦走向3D就很厉害了，现在生成AI就是做蛋白质的三维结构分析，深层AI在整个大模型基础上走，这是未来的一个特别重要的方面。

与此同时，从文字到图像生成的模式，从GPT3开始，到DALLE，到DALLE2是一个突破点，从文字到图像的过程是走的很快的。我刚才讲对蛋白质的分析，我们可以对190万个蛋白质用人工做三维的结构图，大概占了我们已知蛋白质的1/100，不能小看这个数，这是一个很短的时间。再仔细想人是什么？人是蛋白质组成的，如果我们能把蛋白质全部数字化，还不能说把蛋白质合成一个人，但可以合成新的物种，所以蛋白质的应用现在也是走的特别厉害的。

这背后一个核心的变化是人工智能从1.0走向2.0，1.0是以编程为中心，2.0是以数据为中心的，这是一个特别大的区别。1.0的时候聚焦的是算法、模型、程序，是软件工程师在主导，2.0的时候是数据，数据越多越精越好，机器自己通过数据学习反馈优化不断生成、迭代，几乎就是一个无限的过程，它就离开了人脑，这是大模型和2.0最大的潜力和最大的远景，我们已经看到了人工智能可能可以离开人，从已有的智能走向一种新的智能，这个智能并没有被人所意识到，这个事情就很有意思了。所以在这个基础上，大模型产生的基础模型是GPT3，现在出现因果人工智能，这是巨大的发展。最后是神经，因为一切都是神经AI的网络，神经AI现在走得很快。我现在列的这些最新篮球模型，在整个曲线下都是在两年到五年的阶段成熟，科技的浪潮非常厉害。

在这种情况下，产生另一个更大的变化，就是人工智能“脱虚向实”，虚就是人工智能以前是服务于虚拟世界的，搜索、资讯、信息等等，但有了大模型以后，特别生成人工智能以后，人工智能逐渐走向物理世界，在大模型的基础上，通常走的是文字到图像、到音频、视频、到三维、到蛋白，但未来是什么？在这条线以前，人工智能服务的是虚的，在这条线以后，人工智能服务是实的，是走向物理世界。第一个突破是蛋白，第二个突破是材料，这以后会走得特别厉害，这是因为在大模型的情况下，科学研究的方式发生了根本变化，我们称之为科学研究的“第四范式”。

牛顿和爱因斯坦时期科学研究的简单方式，是通过观察把数学模型化，这是最简单的第一方式，第二是用模型推演，第三是用计算机仿真，这不是很成功。进入近代以后，我们发现最大的问题是你观察到的东西没办法写成数学方程式，因为维度太高，在科学研究上有一个概念叫维度的诅咒，特别是量子物理学的角度没法计算，大模型出现以后，现在可以做1024到2048个维度，这已经不完全是个空间概念。两千亿到一万亿的变量，方程可以做到两千亿个变量，这个世界上还有什么方程是不可解的，这在根本上改变了科学研究的方式。以前是慢慢做、细细做，现在是用数据大规模做，这个世界就真的变了。

这就是为什么最近在有些领域突破特别快，生化、药、材料，都是因为人工智能的原因。根本的科学研究的方式变了，以前科学研究是从最早的原理一步一步往前走，现在科学是从数据逆向倒推，整个思维方式根本变了。大模型现在帮助科学家人工智能进入物理学，特别在数学和材料学，现在用一个数学家和机器合作来探索新的材料，这里有很多逻辑、很多理论，就不细说了，特别是也取得了一些很有意思的进展，因为数学家的核心是把所有的一切数学化，能够用公式表达才有应用，不能用公式表达就不能作为产品，就不能生产。做药，最近的生物药研究的时间短了一半，成本下降一半，就是因为大模型的帮助，从数据着手，生物进展很快。

材料，德州用大模型做耐高温耐氧化的高熵的合金，材料科学将来会走得很快，新的材料会出来，会有无限想象的空间，它的算力如此之大，算法效率如此之高，第一次我们可以把物理世界和信息世界、虚拟世界连起来，物理世界的数字在虚拟世界经过大模型回到物理世界去操纵物理世界，这个世界真的变了。现在用的最多的是什么？战争，现在战争的电子演习已经做得很大规模和经济化。现在由人工智能主导运营数字化的过程，因为数字的产生和迭代效率特别高，这个过程也在不断加速自动化，而且在提升自动化的效率。

人工智能帮助管理物理世界最典型的案例，最近美国公布在核聚变取得突破性发展，人类第一次核聚变产出的电大于投入的电，我在普林斯顿读书的时候，80年代和苏联合建的装置，这个装置做一次试验，我们小镇就没有电了，做了几十年没有进展，这是突破的一个核心功能，等离子在磁的电里转的时候，产生功能的时候，不能碰到地，一旦碰到电磁的地就衰退，一衰退就没有能量，但是等离子是没法控制的，它自由在里面转，怎么控制呢？人想了一个别的办法，控制外面磁的线圈，怎么控制磁的线圈呢？用人工智能。深度学习可以帮助形成一秒钟高达几千次的线圈位置的移动，来使得里面走的等离子不会碰到这个线圈，它是移动墙壁使里面走的人自由，而不是走的人不能碰到墙壁，这个思维方式是反过来的，结果就有了核聚变的突破。美国的目标是核聚变让每度电一美分，如果达到这个标准，今天所有的能源世界彻底改观。

这种对物理世界的管理和深化，影响是巨大的。大模型带来了巨大的想象空间，特别在推动科学实验方面空间是很大的，它对生命科学、药物研发空间很大，材料科学空间很大，能源科学空间很大，电子工程和计算机科学空间也很大，当然环境地球空间就更大了。大模型现在变成了工程学，变成了一个辅助工具，变成了我们今天所有一切超高级、超高速效率的辅助工具，世界在这个基点上变了。

我们必须承认人工智能走得很快，中国在2021年第一次人工智能的论文总量超过了美国，中国在两年前人工智能的专利超过了美国，我们赶超非常厉害。我们需要围绕赶超的过程，围绕AI的2.0重新制定自己的人工智能发展战略，因为这个世界从根本上变了。第二点特别重要的，就是发挥我们的数据，人工智能三项核心的资源，算力、算法、数据。我们真正的优势是数据。

三年以后，我们预计2025年中国的数据会超过美国，成为世界上最大的数据之国，因为物联网，中国数据的质量也会很好，所以让数据流起来变成资源、变成资产、变成财富，就是今天这个论坛的主题，让数据变成生产力是我们迎接科学革命、迎接大模型的最根本的一条，只有在这个基础上，我们才能把大模型的应用和商业化、企业化的发展结合起来，才能走上我们的赶超之路。