当前位置:
彭文生在2025中国数字经济发展和治理学术年会上的主旨演讲:从规模经济看DeepSeek对创新发展的启示
发布者:网站管理员 发布时间:2025-03-08

编者按

2025年2月22日,中国数字经济发展和治理学术年会在南开大学召开。本次年会以“人工智能、数字经济与新质生产力”为主题,积极响应党的二十大报告中关于“加快建设网络强国、数字中国”的战略号召,汇聚了学术界与产业界的智慧力量,共同探索数字经济的未来发展方向。年会邀请了40余名专家学者及机构代表,就数字经济、数字金融、数字贸易、数据要素、人工智能创新发展等核心议题展开深入研讨。


中金研究院院长、中金公司首席经济学家、研究部负责人彭文生研究员,以《从规模经济看DeepSeek对创新发展的启示》为题发表主旨演讲。本文根据彭文生研究员现场发言内容整理。


彭文生发表主旨演讲


很荣幸回到母校,参加此次学术研讨。我将分享一些关于DeepSeek、AI的发展经济学逻辑理解及最新变化的思考,这些思考基于我们中金研究院去年出版的《AI经济学》一书的分析框架。


DeepSeek最近备受关注,有三个令人意想不到的点。


第一个点,它不是由一家大型科技公司开发,而是源自一家量化投资公司。量化投资在金融行业曾一度有些污名化,但DeepSeek的突破却由这样一家公司实现,很多人没想到。


第二个点,DeepSeek选择了开源,这与闭源模式的影响截然不同。以手机为例,安卓系统凭借开源策略,在市场份额上远超苹果,但盈利不及苹果,简单来讲,开源对整个经济更为有利,闭源是对于单个公司有利,背后与规模经济密切相关。


第三个点,美国在AI领域的领先地位似乎并不稳固。过去,我们总认为规模优势意味着大企业主导,且多集中在美国。我们该怎么理解规模优势、先发优势呢?在《AI经济学》里面,我们的研究员提出了一个名为“AI发展指数”的指标,以美国作为单位1,是一个参照标准,中国在0.75,其他国家就低多了,明显中美是两个大型经济体,在第一梯队。背后有经济规模、人口规模的因素。最近,DeepSeek的发展促使我们重新审视规模的定义和影响。


在《AI经济学》中,我们提出了两个关键概念:规模定律与规模经济效应。


对于我们这些学习经济学的人来说,规模经济效应是一个熟悉的概念,它主要探讨的是经济可行性。而规模定律则侧重于技术可行性,它关注的是如何通过增加模型的规模,比如数据和算力,来提升AI的性能。从经济学的角度来看,我们可以将这一过程简单地理解为AI的生产函数,即模型的性能或产出是由其规模决定的。那么,这里的生产要素是什么呢?主要就是数据和算力。所谓的Scaling Laws,实际上揭示了一个规律,那就是随着模型规模的不断扩大,虽然我们持续增加数据和算力以提高模型性能,其边际产出却是递减的。


要如何提升模型的性能呢?答案是通过不断地累积数据和增强算力。其中蕴含的一个重要含义在于,大企业由于拥有资源优势,因此能够跨越一定的投入门槛。例如,马斯克发布的Grok 3就是通过堆积算力来实现的。相比之下,中国的DeepSeek所展现的门槛似乎并不那么高。那么,我们应如何理解DeepSeek的突破?


在经济增长理论中,内生增长模型把技术进步视为内生的,是人类经济活动的结果,这意味着技术可行性与经济可行性之间存在着密切关联,因为技术进步本身就是人类经济活动的一个重要成果。技术进步可以带来规模报酬递增,即随着生产规模的扩大,边际报酬并不会减少,反而会增加。


如果将这一观点拓展到整个经济范畴,特别是在AI模型的应用领域,我们就不能仅仅将数据与算力视为简单的生产要素。数据的来源问题同样至关重要,其中数据清洗便是一个不可或缺的环节,它本质上是一种经济活动,并呈现出规模经济效应,这通常是大型企业才能够承担的任务。这恰恰体现了经济学中的规模效应,即随着规模的扩大,固定成本得以分摊。


更为关键的是,规模的扩大对于推动技术进步具有显著作用,这契合了内生增长模型的理论。以DeepSeek为例,其核心在于算法的优化。算法优化代表着技术的持续进步。


按照这个逻辑,规模经济效应可分为内部和外部两种。一种是内部规模经济效应,针对单个企业或者是单个模型,大型科技企业更具优势;一种是外部规模经济效应,依赖于上下游生态体系、共享基础设施和人才池。我国AI的发展与我们近年来在数字经济领域基础设施的大力建设密切相关。当前,众多创新企业都受益于这一高效、共享的基础设施环境。同样,人才池的构建也是如此。而开源模式,则成为了实现外部规模经济的重要平台。


以上讨论揭示了一个重要启示:DeepSeek可能并不意味着没有门槛要求,而是这些门槛可能不再是针对单个企业或单个模型的,而是体现在大型经济体所拥有的资源优势上,特别是那些拥有大型生态系统和更优质基础设施的经济体。基础设施作为一种公共服务,其特性在于使用者越多,每个个体所承担的成本就越低。这也是为什么大城市往往能享受到更好的公共服务,因为大城市人口众多,人口密度高。这一逻辑同样适用于国家层面。


因此,AI大模型更有可能在美国和中国这样的大型经济体中出现。进一步来说,不要因为DeepSeek降低了成本,就认为小型经济体有了更多机会。实际上,这是一个涉及生态体系的竞争,大型经济体依然保持着明显的领先优势。下一步到AI产出的应用更是这样的,中美这样的大型经济体具有优势。


接下来,让我们从微观经济学的角度,通过图表具体阐释之前提到的规模定律。以算力和算法为例,假设Q2、4、6、8代表一个模型的产出量。在给定的技术生产函数下,当增加一个生产要素(如算力)的规模时,通常会出现边际产出递减的现象,即为了获得模型效力的同等提升,所需的算力会越来越大。然而,如果我们考虑高算法的情况,如图中的绿色线条所示,如果算法研发领域取得了显著进展,这条曲线将表明什么呢?它意味着为了达到模型边际产出的同等增加,所需的算力增加量会更小。这正是我们为什么要重视技术进步的原因,因为技术进步不仅关乎数据和算力这两个生产要素,它还能优化这些要素的使用效率。


图1:DeepSeeK的换道追赶式创新

资料来源:中金研究院


原先的讨论相对较为静态,在更动态的分析中,模型的规模、算力、数据、参数以及模型的性能等因素共同构成了描述算法框架和技术约束的几条关键线。每一条独立的线,其形状所揭示的是边际产出递减的规律,即随着算力和数据的不断累积,其增长斜率将趋向于平稳。如果我们通过研发努力提升算法框架本身,从动态角度看,我们将能够观察到一种规模报酬递增的趋势。


关键还是技术进步,而算法的诞生离不开人才。这是一张去年《AI经济学》一书中极为重要的图表,它展示了AI优秀人才的来源地与工作地。来源地指的是本科就读的国家,是在中国、法国还是美国等;工作地则依据服务机构总部的位置来确定,即便你个人在中国工作,但若服务的机构总部在美国,那么你的工作地仍被视为美国。从这张图表中,我们可以清晰地看到,中美两国在AI人才方面遥遥领先。无论是从人才的来源地还是工作地来看,整个欧洲大陆的总和与这两个大型经济体相比,都存在着显著的差距。


图2:主要经济体AI优秀人才来源地和工作地

注:此处是Macropolo对于AI优秀研究者的来源地和工作地的统计,AI优秀研究者的界定是被人工智能顶级会议NeurIPS接收文章的作者,来源地是研究者本科毕业学校所在地,工作地是研究者工作机构总部所在地。
资料来源:Macropolo.org ,《AI经济学》.


中国还存在一个显著特点:虽然在中国完成本科学习的AI人才数量明显超过美国,但在美国工作的AI人才却多于在中国工作的。此外,近年来出现了一个新趋势,即中国本科阶段AI领域的学生人数大幅增加,同时出现了显著的人才回流现象,选择在中国工作的人数也显著增加。当我们探讨规模效应时,需要深入理解这一效应在两个经济体之间分工的含义,这涉及到了比较优势的概念。从理论层面讲,美国可以拥有绝对优势,比如算力优势,并且在美国工作的AI人才数量超过中国,因此可以说美国在AI人才方面具备绝对优势。


但是,分工并非由绝对优势决定,而是由相对优势或比较优势所主导。相较于中国,美国的比较优势在于其强大的算力,尽管它也拥有众多AI人才。那么,中国的比较优势又是什么呢?答案是人才。因此,美国通过Grok 3堆积算力,是符合其比较优势的举措。而我们在算法领域发力,这符合我们在人才方面的比较优势。将这一逻辑扩展到整个经济领域,不仅限于AI模型的研发,还包括AI经济的应用,我们可以看到规模经济效应的一个体现。在这里,算力和数据可以被理解为更广义的生产要素,它们都是经济活动和技术进步的结果。这种技术进步不仅仅局限于算法本身,还包括数据清洗、中国半导体产业的未来进步等多个方面,这些都将共同推动AI经济向更高水平发展。


尽管众多大型科技公司和科研院所尚未在这一领域取得显著成果,但这并不应否定他们的贡献。DeepSeek的成功,实际上是得益于我们整个生态体系的协同发展。在这个过程中,许多创新创业企业可能也在不断探索与试错,但并未能如愿成功。这并不意味着他们的努力是徒劳的,因为样本的偏差是创新过程中难以避免的一部分。DeepSeek之所以能够成功,并非仅凭一个小型企业或小型经济体的力量就能实现,而是在一个大型且成熟的生态环境中孕育而生的。


另一个值得探讨的是需求问题。与某些基础性研究相比,AI的发展从一开始就更具有需求导向性,DeepSeek也是如此。这解释了为何AI的重大突破往往不在科研院所内产生。科学研究中,有些基础性研究具有很强的正外部性,需要政府的干预来纠正市场失灵,提供必要的投入。而对于外部性导向不那么强烈的研究领域,市场本身就能提供足够的创新动力。这一点在中国未来AI的发展中尤为重要,因为中国在应用场景和各个细分赛道上的优势非常突出,在需求端或是供给端,我们都占据了全球最大的市场份额。


DeepSeek近期的发展还蕴含了另一层重要意义,即如何理解地缘经济竞争,特别是中美两国在AI大模型领域及由此引发的创新经济发展竞争。以往,全球创新可以概括为G2模式:美国主导科技创新,而中国擅长产业创新,双方均从中受益。美国的科技创新,如苹果、特斯拉等公司,借助中国大型制造业体系的规模生产优势,迅速降低成本并获取高额利润,这些利润反过来又促进了其前沿创新的持续发展。中国也从中受益,通过干中学,快速缩小了与美国的差距。这种双赢的局面使得全球都从中受益。


然而,当前面临的挑战更为严峻,脱钩趋势日益明显。脱钩意味着中国不仅要继续强化产业创新,更必须加大科技创新的力度。同样,美国也不得不兼顾科技创新与产业创新,因此强调制造业回流。在此背景下,中国必须更加重视科技创新,以应对这一新的挑战。


背后的深层含义在于,美国需要避免过度依赖需求和人才,而忽视供给和产业发展这两个关键路径。而中国则需克服对供给和有形资产的过度依赖,加强对需求和人才的重视,以打破现有的路径依赖。这是我们在思考创新经济时必须认识到的。


总体来说,从规模经济向创新经济转型的过程中,我们拥有规模优势。那么,如何实现这一优势呢?最根本的途径在于市场贸易、分工与交换,正如亚当·斯密的理论所指出的,没有分工就没有规模经济。然而,外部性问题可能影响“看不见的手”的作用,我们需要通过两种方式来纠正:一是政府的直接投入,二是制度设计,这其中也包含了金融层面的考量。特别值得一提的是个人破产机制的缺失,对初创企业不利,因为许多创始人承担着无限责任的债务。


最后,我想提及科技金融领域一个常被讨论的话题,重视资本市场的外部规模经济效应。科技创新主要依赖于科技人才,而产业创新则更侧重于供给与资产。在这方面,银行信贷更能有效支持供给与资产相关的创新,而资本市场则更能促进以人才需求为核心的创新活动。这两者都能实现规模与效益的提升,但它们的载体有所不同。银行通过扩大规模,能够提高其内部的规模经济效应和信用评级能力。相比之下,资本市场则展现了一种典型的外部规模经济特征,它汇聚了大量的投资者与融资者,以及专业机构、律师事务所、会计事务所和媒体的监督,形成了一个多元化的生态环境。


这两种模式下,银行信贷往往面临负外部性问题,由于政府的担保和房地产作为抵押品,可能导致其规模过度扩张并引发一系列问题。而资本市场则展现出正外部性,即技术的外溢效应,DeepSeek便是一个生动的例证。因此,在思考科技金融时,我们需要从这两个不同规模经济的融资渠道出发,深入考虑金融结构的优化和金融监管的完善,包括产融分离的边界,银行和证券分业经营。最后,宏观经济领域的财政扩张不仅能促进总需求的增长,稳定当前经济形势,更能在长远上有利于提升整个经济的创新能力。


以上就是我的汇报内容,谢谢大家!


来源:清华服务经济与数字治理研究院公众号

编辑:徐牧谣、田腾骧

审核:卢彤菲、孙景宇