一个科学家,几个月前写了一篇文章,宣示了他和他的公司通过强大的人工智能解决全人类身心健康、心理疾病、贫困、和平、工作与生活的意义等诸多方面的美好善意。几个月后,还是这名科学家,又突然发布了一篇文章,强烈呼吁不应该让任何一块美国的芯片出口到中国,以限制中国人工智能的发展,维系人工智能的“单极世界”(我很震惊他会赤裸裸地使用这个词汇)。这件事,怎么看都让人觉得割裂,以及那么一丝丝虚伪。
这个人就是人工智能公司 Anthropic 的 创始人和 CEO Dario Amodei,一名意大利裔美国人、神经物理学博士、资深 AI 科学家、昔日的 OpenAI 研究团队灵魂人物之一、中国公司百度的深度学习实验室早期员工、号称将打造最强大和安全的 AI 的理想主义者、OpenAI 最重要的竞争对手的创始人,以及现在,美国对中国 AI 全方位无死角禁运最激烈的呼吁者,没有之一。
尽管 Anthropic 和它旗下的 Claude 系列模型在中国公众当中的知名度相当有限,但毕竟,它是目前世界上最受 AI 应用开发者欢迎的大语言模型的提供者,在中国的 AI 研究人员和开发者群体中也有着相当多的拥趸。但是一夜之间,很多中国的 AI 从业者公开表示:Anthropic 和 Amodei 本人失去了他们最基本的尊重。
这就是一篇“檄文”的效应。
在这篇题为《关于 DeepSeek 和出口控制》的文章中,Dario Amodei 一方面云淡风轻指称 DeepSeek 取得的成就撼动美国 AI 的优势被夸大描述了,在表达对 DeepSeek- V3 模型创新肯定的同时,坚决不承认引发更大轰动效应的 DeepSeek 推理模型 —— R1 的取得的突破(这厮在这一问题上的心思,是本文后面论述的重点)。他更不愿意承认的是 DeepSeek 模型在算力成本和算法效率上取得的成果—— 用一个自己也承认”未经过证实”的 DeepSeek 有五万张走私而来的英伟达 A100、H100 和 H800 显卡的流言,力证 DeepSeek- V3 模型不可能用600万美元的低成本训练而成。显然,Amodei 不能接受 DeepSeek 以算法效率创新替代算力堆砌这个被日益普遍承认的路径,因此不惜用一个连他自己也知道未经验证的 DeepSeek 走私了大量高端显卡的前提实现了这个论述。但他又表述美国对中国的算力出口管制没有失效——他可能恰好忘了他前面的论述建立在 DeepSeek 走私的假设上。
一个处处讲逻辑和推理的科学家,试图用一篇万字长文论证一个无法自圆其说,但又要在形式上处处讲逻辑的推理的结论,他就会显得如此的笨拙,以及虚伪。
这并不是 Dario Amodei 第一次呼吁加强对中国的算力管制,你也没法要求一个美国的人工智能科学家对中国有与生俱来的善意,但他在 DeepSeek 引发了硅谷的广泛关注、肯定和一定程度的恐慌的背景下,专门鼓噪对中国的算力出口进一步管制,以及极力否定 DeepSeek 在算力效率优化和模型推理方法上的创新,是非常值得关注和解析的现象。没人期待他对中国的善意,但他对中国和中国诞生的 AI 公司 DeepSeek 的恶意和怨念如此之重,是很值得玩味的。