超越ChatGPT登顶!中国“神秘力量”由杭州公司开发 -6parknews.com

超越ChatGPT登顶!中国“神秘力量”由杭州公司开发

新闻来源: 19楼/牲产队于2025-01-27 3:08:00 提示:新闻观点不代表本网立场分享

近日，国产AI DeepSeek在中国、美国的科技圈受到广泛关注，甚至被认为是大模型行业的最大“黑马”，在外网，DeepSeek被不少人称为“神秘的东方力量”。1月27日，DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。同日，苹果中国区应用商店免费榜显示，DeepSeek成为中国区第一。

苹果美国区应用商店

苹果APP Store中国区免费榜

1月27日相关微博热搜刷屏

游戏科学创始人、CEO，《黑神话：悟空》制作人冯骥评价DeepSeek：可能是个国运级别的科技成果。

DeepSeek是啥？

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。

去年12月DeepSeek-V3发布后，AI数据服务公司Scale AI创始人Alexander Wang就发贴称，DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。”不到一个月之后，今年1月20日，DeepSeek正式开源R1推理模型。

据DeepSeek介绍，其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。这一模型发布后，引发了海外AI圈众多科技大佬的讨论。例如，英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示：“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理，但最有趣的结局往往最可能成真。”

图源：证券时报

DeepSeek为何突然爆火？26日，DeepSeek出现了短时闪崩现象。不少网友反映，使用时遇到 “服务器繁忙” 的提示。对此，DeepSeek回应称，当天下午确实出现了局部服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后，用户访问量激增，服务器一时无法满足大量用户的并发需求。不过，官方状态页并未将这一事件标记为事故。

据了解，此前DeepSeek在美区榜单的排名并无特别突出表现，处于稳步上升阶段，但未进入前十。此次突然蹿升，与其近期一系列突出表现有直接关系。

据报道，“DeepSeek爆火的原因主要可以归结为两点：性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉媒体。DeepSeek解释称，R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注，也让投资界看到了其巨大的商业潜力。

更为关注的是，DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元，仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时，DeepSeek公布了API的定价，每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一，也因此，DeepSeek被称为AI界的“拼多多”。

郑磊直言，DeepSeek对硬件市场产生了重大影响，因为它可能会降低人工智能模型的硬件成本，从而推动人工智能技术的发展。

团队不到140人都来自国内顶尖高校DeepSeek之所以能取得这些创新并非一日之功，而是“孵化”数年之久，长期谋划后的结果。DeepSeek创始人梁文锋也是头部量化私募幻方量化的创始人。Deepseek充分利用了其幻方量化积累的资金、数据和卡。

梁文锋本科、研究生毕业于浙江大学，拥有信息与电子工程学系本科和硕士学位。2008年起，他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月，DeepSeek正式成立，进军通用人工智能领域，至今从未对外融资。此前，OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇用了“一批高深莫测的奇才”，对此，梁文峰在接受自媒体采访时曾透露过，并没有什么高深莫测的奇才，都是来自Top高校的毕业生、没毕业的博四、博五实习生，还有一些毕业才几年的年轻人。

从目前已有的媒体公开报道中可以看出，DeepSeek团队最大的特点是名校、年轻，即使是团队Leader级别，年纪也多在35岁以下。不到140人的团队，工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校，工作时间都不长。

DeepSeek核心成员是应届生

出色的成就与其团队规模形成了鲜明的对比。根据公开报道，DeepSeek的员工规模不及OpenAI的1/5，百人出头的公司中，算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人，主要在北京分部，其余30多人在杭州总部，多为前端、产品以及商务人员。

让人惊奇的是，这家公司内并没有外界推论的高深莫测的奇才。DeepSeek创始人梁文锋曾透露，员工都是一些Top高校的应届毕业生、没毕业的博四、博五实习生，还有一些毕业才几年的年轻人。他说，在人工智能领域，“前50名顶尖人才可能不在中国，但也许我们能自己打造这样的人。”

在梁文锋看来，在这一波人工智能的浪潮中，DeepSeek的出发点，不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展。他说：“过去很多年，中国公司习惯了别人做技术创新，我们拿过来做应用变现，但这并非是一种理所当然。”

开年最大黑马，DeepSeek凭什么打爆美国科技圈？

一家名为“深度求索”的中国AI公司，打爆了美国科技圈。只因为它开源了一款AI工具：DeepSeek。其实，这已经是DeepSeek第二次震撼美国了。差别在于，这一次的震撼程度更大。

上一次是去年底，DeepSeek发布V3版本，首次跻身全球一流水平，但与OpenAI，DeepMind还有着明显的差距。可当它迭代到R1版本时，它与OpenAI的技术差距已经非常小了。甚至，在部分技术领域，DeepSeek已经追上ChatGPT了。可你要知道，任何AI工具都离不开强大的算力支持。为了限制中国的AI技术发展，美国对中国实施了全面的AI算力芯片封锁。DeepSeek是怎么做到后来居上的呢？这主要有三大原因：

一是，深度求索公司不缺钱。他的创始人名叫梁文锋，出生于广东湛江，这是一个典型的三四线城市。梁文锋呢？也是一个传统意义上的小镇做题家。他凭借优异的成绩，17岁时考入浙江大学，于2010年，在浙大信息与通信工程专业硕士毕业。从这一刻开始，梁文锋就走向了截然不同的职业路径。他没有去打工，而是与同学一起创立了雅可比投资，一头扎进了金融行业。

在积累了第一桶金以后，5年以后，梁文锋30岁，与徐进联合创立了“幻方量化”对冲基金。什么是量化基金呢？就是通过海量的高频交易，打时间差，哪怕只有5毛钱的利润，它也能海量吃进，在成千上万次交易中，获取巨额利润。而“幻方量化”最大的不同就在于，它从一开始，就立志于使用AI工具，实现全自动量化交易。

也就是说，你在炒股的时候，你的对手不是人类，而是“幻方”量化打造的超级AI，它的准确率超过80%。在强大的AI支持下，“幻方量化”管理的基金规模，迅速突破1000亿，跻身中国头部基金。这些基金投资所带来的巨额收益，让深度求索从一开始，就完全不缺钱。

深度求索在打造DeepSeek的时候，不追求盈利，也不考虑商业化变现，以一种近乎纯粹的科研氛围，招募了一大批顶尖人才。这样做的好处是，它的员工可以心无旁骛地搞定技术，打破美国的AI封锁。可以说，DeepSeek的成功，中国股民做出了重大贡献。

二是，深度求索公司不缺算力。在美国的封锁下，英伟达对中国禁售了A100、H100等顶级算力芯片。可“幻方量化”起步太早了，它在做量化交易的时候，就已经提前买入了上万张英伟达GPU芯片。其中，最先进的A-100芯片，也囤积了数千张。和美国公司动辄囤积数万张，甚至十万张英伟达芯片来比，深度求索的算力资源确实太少了。但是，它却具备起步的基础了。除了自有GPU以外，它还从云计算厂商那边，租借了一部分算力，来填补自身算力的不足。

三是，技术积累深厚。DeepSeek不是零基础起步的，它在做量化交易的时候，就提前储备了大量的AI训练方式。这对OpenAI的训练要求更高。因为在股市里面，发生细微的错误，都很容易亏钱。这就要求幻方量化在大模型训练上，寻求更精准的判断。它不依赖于海量的算力堆积，而更注重于精准的价值判断。这就让它在有限的算力资源之上，通过持续优化的训练方法，以极低的成本，做到了OpenAI的技术水准。

但技术上的逆袭，还不足以震撼硅谷。它真正震撼硅谷的是：开源。它的核心代码，训练逻辑全部免费公开。有人问了，咱们好不容易搞出来的技术，为什么要开源呢？这不是让美国人躺着抄作业吗？可开源，才是真正的核弹。它的底层逻辑是，自己赚不到钱，却可以杀死对手。

你想一下，OpenAI是收费的，每个月要付20美元的订阅费，你才能用得上。可现在，中国DeepSeek来了，它的性能与ChatGPT差不多，却免费给全世界所有人用。你是一个普通消费者，你选择免费的DeepSeek，还是选择每个月付20美元，去购买ChatGPT？

这一招开源，直接带来了三大影响：

一是，ChatGPT凭什么卖那么贵？如果海量用户都转投DeepSeek，那ChatGPT的价值在哪里？它凭什么让用户买单？

二是，美国人的技术是不是太差了？明明掌握更多的算力资源，做出来的东西，为什么连DeepSeek都比不了？人家才投入一个百人级的团队，大部分还都是应届生，AI大模型技术究竟有没有护城河？如果没有护城河，它的估值逻辑在哪里？资本方凭什么投入数百亿，甚至上千亿美元，去押注AI？可以说，免费开源，恰恰打掉了硅谷科技资本的傲慢。原来是一家独大，OpenAI怎么吹都行，可现在DeepSeek来了，美国AI公司不能乱吹了。

三是，开源，可以吸引全球顶尖专家，共建共创。因为所有代码、训练方法全部公开了。如果你是一个美国人，你觉得DeepSeek还可以优化，你就可以自己补充，把DeepSeek变得更强大。也就是说，任何一个人，都可以在DeepSeek的基础上，去做技术性补充，通过共创共建的方式，让DeepSeek变得更加强大，以免费开源的方式，服务于全人类。

这种伟大的技术梦想，反而能够吸引到全世界的顶尖科学家，共同参与进来。当初，马斯克参与创建OpenAI就是想打造一个开源社区。可最终，微软收购了OpenAI，使得OpenAI变成了一个商业化工具。

如今，真正实现马斯克开源梦想的，反而是一家中国公司。但最受伤的还不是OpenAI，而是扎克伯格。他投入巨资，打造AI，却至今都不如DeepSeek。整个Meta的AI部门，都需要重新审视自己，钱究竟花在哪里去了？真的需要买那么多的英伟达芯片吗？这些美国技术人员真的值那么高的工资吗？

DeepSeek这一招开源，直接打爆了整个硅谷。它震撼的不只是硅谷科技圈，也震撼了硅谷资本圈。

它用一招从天而降的掌法告诉全世界：AI的护城河远没有大家想象的那么深，也不需要烧掉巨额资金。它真正需要的充沛的算力，加上天才的大脑。