原文标题:China’s March from Imitation to Innovation: The Case of DeepSeek
中文摘要:加图研究所(美国)高级研究员詹姆斯·多恩(James A. Dorn)在《中国从模仿走向创新:以DeepSeek为例》一文中表示,当中国人工智能公司深度求索(DeepSeek)在1月底发布R1模型时,人工智能界大吃一惊。美国风险投资家马克·安德森(Marc Andreessen)称,R1是“我见过的最惊人、最令人印象深刻的突破之一”。R1建立在深度求索2024年发布的V3模型上,使用更低成本的芯片,并经过优化,可以运行具有推理能力的预测性大语言模型。
R1在1月27日搅动科技股英伟达的市值下跌近6000亿美元,因为人们预计市场对英伟达顶级芯片的需求将会下降。
美国于2022年10月实施出口管制,限制中国获得先进半导体。当时,中国人工智能公司就决心在没有英伟达最先进芯片的情况下找到取得进展的方法。DeepSeek创始人梁文锋用不那么强大的芯片和创新的工程技术,生产出高效的人工智能模型,可以与OpenAI和该领域的其他领导者竞争,而且成本更低,这让所有人都感到惊讶。在DeepSeek创新之前,人们一直认为只有人工智能巨头才能开发和运行高性能的人工智能模型。
文章认为,看到DeepSeek开发开源模型,其他人可以用它来改进自己的模型,包括像R1这样的“推理”模型,这令人兴奋。(编译:潘立华、秦川)