撰文 | 张天祁
● ● ●
在很长一段时间里,外界对DeepSeek的主流看法是,一支年轻、经验不多的团队成为AI界的黑马,在资源并不占优势的条件下做出了比肩世界顶尖公司的大模型。DeepSeek创始人梁文锋也曾在访谈中表示,他们不设KPI,招人看能力而不是看经验,核心技术岗位基本以应届和毕业一两年的人为主。
但斯坦福大学与胡佛研究所近日联合发布的一项报告,展示了 DeepSeek 团队的另一面。团队确实年轻,但并不缺乏系统性的训练和科研积累[1]。
这项研究梳理了DeepSeek自2024年以来公开发表的五篇核心论文,统计了其中223位作者的信息,最终获得211人的教育背景与学术指标。平均而言,每位DeepSeek研究者发表了61篇论文,获得1059次引用,h指数(评估学者科研影响力的重要指标,越高影响力越广)为10.8。而最核心的31名作者中,这一数字进一步跃升。平均发表70篇文章、被引用1554次,h指数达13.5。
换句话说,DeepSeek的科研主力虽然平均来说比较年轻,但学术上已经积累了不错的成果。
在五篇核心论文中均有署名的31位核心作者学术水平更高,他们人均引用次数为1554次,中位数为501次,平均h指数为13.5,i10指数(学者发表的论文中,有多少篇被引用超过了10次)为 25.5。特别值得注意的是,这不是一个靠少数人拉高平均表现的群体。
在这31名核心成员中,至少有一半人的h指数都达到了10或更高。这说明,团队的学术实力并非集中在少数人身上,而是多数成员都有稳定产出,整体分布更为均衡。报告作者认为,DeepSeek的研究能力不仅强大,而且分布均衡。在基础模型竞争不断加速的背景下,这种组织特征可能会发挥尤为重要的作用。
如果和同样号称以年轻团队为主的OpenAI 做个对比,这种差异会更清楚。OpenAI在2023年发布的o1模型汇聚了265位作者,平均引用次数4403次,但中位数却不高,只有338。这背后的含义不难想象,团队中确实有少数明星研究员贡献突出,拉高了整体指标,但大多数成员的学术产出相对有限,内部差距较大。
这份报告还指出,中国也已经具备了独立培养AI人才的能力。在对 201 位有明确隶属信息的作者进行分析后发现,超过一半(111 人)始终在中国机构接受培训并任职,没有学习和留学的经验。
DeepSeek的作者群体中,隶属本土机构占据了多数。对201位具有明确隶属关系的作者统计显示,2025年时,其中171人隶属于中国机构。作者们一共与全球499家机构建立过学术或职业联系,中国机构占到368家,占比达74%。
这个分布广泛的机构网络以大学和研究机构为主,也包括少量来自企业(17家)、政府部门(12家)和非营利组织(9家)的背景。这张网络以中国科学院(CAS)为核心节点。中国科学院直接关联18名DeepSeek作者,若将其下辖的153个附属单位(包括研究所、实验室和专业中心等)纳入计算,覆盖的作者总数达到53人,几乎构成了DeepSeek作者网络的主干。
北京大学拥有20名作者,清华大学紧随其后,有16名作者。中山大学和南京大学分别贡献了10名作者。这种机构分布展现了中国培养本土AI人才的能力,一个以中科院为核心、辐射多所顶尖高校的知识网络,正在成为中国AI创新的重要土壤,也在一定程度上挑战了长期由美国主导的AI人才格局。
美国成为中国AI人才跳板
美国保尔森基金会 (Paulson Institute) 下属的麦克罗波洛智库(MacroPolo)曾经做过一项名为“全球人工智能人才追踪”的调查。这项报告根据2022年NeurIPS会议的作者数据,描绘了顶尖AI人才的教育和职业轨迹,它的一个关键发现是,中国是最大的AI人才输出国,而真正承接并发挥他们才能的,却主要是美国的AI产业。
报告显示,在中国接受本科教育的顶级(前20%)AI人才占全球47%。不少活跃于国际AI领域的人才,最初都在中国接受了基础培养。
但到了研究生阶段,流向开始发生变化。将近四成的中国AI人才选择赴美深造,逆转了中美的AI人才比例。在美国获得博士学位之后,77%的非美国学生选择了留在美国工作。美国的公司和研究机构成了他们职业发展的下一站,甚至是最终去向。在这个过程中,中国出身的大量AI人才被留在了美国。
按照调查的数据,美国顶级AI机构中有接近四成的人才来自中国,甚至略微超过了美国本土人才的比例。反过来,几乎没有美国出身的人才最终在中国AI领域工作[2]。
OpenAI的GPT-4的贡献者名单为这一趋势提供了更具体的样本。团队中的32位中国背景研究人员中,有11人在中国完成本科,其余21人在美国就读。在研究生阶段,这些人才中接近八成都在美国读书,并且后续留在美国AI领域工作[3]。
但两年多的时间过去,同样是做出了世界知名的大模型,DeepSeek团队中的人才流动轨迹又是另一番景象。在DeepSeek的团队中,美国似乎成了中国的AI人才的孵化器。
DeepSeek相关作者中49人曾有美国高校或科研机构的经历,包括本科、硕士、博士或博士后等阶段。这部分人学习或工作的机构横跨26个州、65个机构,涵盖了公立大学、私立学院、医疗中心、非营利机构和科技公司。南加州大学、斯坦福大学、纽约大学等学校有多位研究者产生关联,但没有任何一个机构拥有超过三位DeepSeek作者。报告指出,这种分布覆盖了美国AI生态的多个层面。
比地点更关键的,是人才流动的方向。对这49位曾与美国科研机构发生关联的研究者进行梳理可以发现,其中将近四成(19人)最初在中国接受教育,随后赴美深造,最终回到中国加入本土机构;另有11人虽然早期在美国或其他国家学习、工作,但最终也选择在中国落脚。相比之下,仅有7个人是在中国读本科,赴美读研并留美工作,在DeepSeek团队中并不占主流。相反,大量曾赴美读研的人才,最终选择来中国AI领域工作,这和几年前报告给出的趋势完全不同。
在曾有美国经历的49位DeepSeek作者中,大多数人其实只是短暂停留,31人在美国只逗留了一年,足以接触高水平的研究环境,但不足以建立持久联系。有9人在美时间超过5年,已经深度融入了美国的学术体制,学术成就最为突出,但值得注意的是,这9人中目前仅有3人仍与美国机构保持隶属关系。无论属于哪一类,对DeepSeek论文作者来说,美国更像是他们学术生涯中的一段过渡,而非终点。他们在美国教育深造,但取经归来还是选择在中国AI领域工作。
这批拥有美国经历的49位研究人员,在 DeepSeek 团队中数量不多,但并非边缘角色。他们的平均被引次数达到2168次(中位数为 565次),平均h指数为17,i10指数为34,显著高于团队整体水平,称得上是核心贡献者。其中长期停留美国、深度融入当地科研体系的9人,更是其中的佼佼者。
DeepSeek作为一家中国公司,当然无法代表全球AI人才流动的全貌。但与几年前中美AI人才流动的趋势相比,变化也的确存在。美国不再是AI人才默认的首选目的地。
报告作者反思,美国政策制定者始终相信,世界上最优秀的技术人才会自然而然地选择留在美国发展,但现实开始偏离这一判断。美国的高校和研究机构现在更像一个人才跳板,对很多研究人员来说,美国提供了高水平的资源、经验和人脉,但最终这些积累被带回中国,成为支撑本土AI领域发展的一部分。
参考文献:
1.A deep peek into DeepSeek AI’s talent and implications for US innovation. (n.d.). Hoover Institution.
2.Methodology for Global AI Talent Tracker (2023) - MacroPolo. (2024, March 6). MacroPolo.
3.The Global AI Talent Tracker 2.0 - MacroPolo. (2024, March 6). MacroPolo.
上一篇:普京:金砖国家GDP超越G7