时政·财经·军事 | 生活·家庭·娱乐 | 体坛·历史·科技 | 摄影·旅游·文化 | 移民·教育·就业 | 数码·健康·奇闻 | 社区·评论·问卷
留园网首页 · 新闻速递首页 · 【繁體閱讀】 【网友评论:35 条】 【 热评新闻排行 】 【 热门新闻排行 】 【 即刻热度新闻排行 】 【 72小时神评妙论 】   

超越ChatGPT登顶!中国“神秘力量”由杭州公司开发

新闻来源: 19楼/牲产队 于2025-01-27 3:08:00  提示:新闻观点不代表本网立场

近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

苹果美国区应用商店



苹果APP Store中国区免费榜

1月27日相关微博热搜刷屏





游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

DeepSeek是啥?

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。



据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”


图源:证券时报

DeepSeek为何突然爆火?26日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。

据了解,此前DeepSeek在美区榜单的排名并无特别突出表现,处于稳步上升阶段,但未进入前十。此次突然蹿升,与其近期一系列突出表现有直接关系。

据报道,“DeepSeek爆火的原因主要可以归结为两点:性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉媒体。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。

更为关注的是,DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一,也因此,DeepSeek被称为AI界的“拼多多”。

郑磊直言,DeepSeek对硬件市场产生了重大影响,因为它可能会降低人工智能模型的硬件成本,从而推动人工智能技术的发展。

团队不到140人都来自国内顶尖高校DeepSeek之所以能取得这些创新并非一日之功,而是“孵化”数年之久,长期谋划后的结果。DeepSeek创始人梁文锋也是头部量化私募幻方量化的创始人。Deepseek充分利用了其幻方量化积累的资金、数据和卡。

梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。此前,OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇用了“一批高深莫测的奇才”,对此,梁文峰在接受自媒体采访时曾透露过,并没有什么高深莫测的奇才,都是来自Top高校的毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

从目前已有的媒体公开报道中可以看出,DeepSeek团队最大的特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。

DeepSeek核心成员是应届生

出色的成就与其团队规模形成了鲜明的对比。根据公开报道,DeepSeek的员工规模不及OpenAI的1/5,百人出头的公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人,主要在北京分部,其余30多人在杭州总部,多为前端、产品以及商务人员。

让人惊奇的是,这家公司内并没有外界推论的高深莫测的奇才。DeepSeek创始人梁文锋曾透露,员工都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。他说,在人工智能领域,“前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”

在梁文锋看来,在这一波人工智能的浪潮中,DeepSeek的出发点,不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。他说:“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。”

开年最大黑马,DeepSeek凭什么打爆美国科技圈?




一家名为“深度求索”的中国AI公司,打爆了美国科技圈。只因为它开源了一款AI工具:DeepSeek。其实,这已经是DeepSeek第二次震撼美国了。差别在于,这一次的震撼程度更大。

上一次是去年底,DeepSeek发布V3版本,首次跻身全球一流水平,但与OpenAI,DeepMind还有着明显的差距。可当它迭代到R1版本时,它与OpenAI的技术差距已经非常小了。甚至,在部分技术领域,DeepSeek已经追上ChatGPT了。可你要知道,任何AI工具都离不开强大的算力支持。为了限制中国的AI技术发展,美国对中国实施了全面的AI算力芯片封锁。DeepSeek是怎么做到后来居上的呢?这主要有三大原因:

一是,深度求索公司不缺钱。他的创始人名叫梁文锋,出生于广东湛江,这是一个典型的三四线城市。梁文锋呢?也是一个传统意义上的小镇做题家。他凭借优异的成绩,17岁时考入浙江大学,于2010年,在浙大信息与通信工程专业硕士毕业。从这一刻开始,梁文锋就走向了截然不同的职业路径。他没有去打工,而是与同学一起创立了雅可比投资,一头扎进了金融行业。



在积累了第一桶金以后,5年以后,梁文锋30岁,与徐进联合创立了“幻方量化”对冲基金。什么是量化基金呢?就是通过海量的高频交易,打时间差,哪怕只有5毛钱的利润,它也能海量吃进,在成千上万次交易中,获取巨额利润。而“幻方量化”最大的不同就在于,它从一开始,就立志于使用AI工具,实现全自动量化交易。

也就是说,你在炒股的时候,你的对手不是人类,而是“幻方”量化打造的超级AI,它的准确率超过80%。在强大的AI支持下,“幻方量化”管理的基金规模,迅速突破1000亿,跻身中国头部基金。这些基金投资所带来的巨额收益,让深度求索从一开始,就完全不缺钱。



深度求索在打造DeepSeek的时候,不追求盈利,也不考虑商业化变现,以一种近乎纯粹的科研氛围,招募了一大批顶尖人才。这样做的好处是,它的员工可以心无旁骛地搞定技术,打破美国的AI封锁。可以说,DeepSeek的成功,中国股民做出了重大贡献。

二是,深度求索公司不缺算力。在美国的封锁下,英伟达对中国禁售了A100、H100等顶级算力芯片。可“幻方量化”起步太早了,它在做量化交易的时候,就已经提前买入了上万张英伟达GPU芯片。其中,最先进的A-100芯片,也囤积了数千张。和美国公司动辄囤积数万张,甚至十万张英伟达芯片来比,深度求索的算力资源确实太少了。但是,它却具备起步的基础了。除了自有GPU以外,它还从云计算厂商那边,租借了一部分算力,来填补自身算力的不足。



三是,技术积累深厚。DeepSeek不是零基础起步的,它在做量化交易的时候,就提前储备了大量的AI训练方式。这对OpenAI的训练要求更高。因为在股市里面,发生细微的错误,都很容易亏钱。这就要求幻方量化在大模型训练上,寻求更精准的判断。它不依赖于海量的算力堆积,而更注重于精准的价值判断。这就让它在有限的算力资源之上,通过持续优化的训练方法,以极低的成本,做到了OpenAI的技术水准。

但技术上的逆袭,还不足以震撼硅谷。它真正震撼硅谷的是:开源。它的核心代码,训练逻辑全部免费公开。有人问了,咱们好不容易搞出来的技术,为什么要开源呢?这不是让美国人躺着抄作业吗?可开源,才是真正的核弹。它的底层逻辑是,自己赚不到钱,却可以杀死对手。

你想一下,OpenAI是收费的,每个月要付20美元的订阅费,你才能用得上。可现在,中国DeepSeek来了,它的性能与ChatGPT差不多,却免费给全世界所有人用。你是一个普通消费者,你选择免费的DeepSeek,还是选择每个月付20美元,去购买ChatGPT?



这一招开源,直接带来了三大影响:

一是,ChatGPT凭什么卖那么贵?如果海量用户都转投DeepSeek,那ChatGPT的价值在哪里?它凭什么让用户买单?

二是,美国人的技术是不是太差了?明明掌握更多的算力资源,做出来的东西,为什么连DeepSeek都比不了?人家才投入一个百人级的团队,大部分还都是应届生,AI大模型技术究竟有没有护城河?如果没有护城河,它的估值逻辑在哪里?资本方凭什么投入数百亿,甚至上千亿美元,去押注AI?可以说,免费开源,恰恰打掉了硅谷科技资本的傲慢。原来是一家独大,OpenAI怎么吹都行,可现在DeepSeek来了,美国AI公司不能乱吹了。



三是,开源,可以吸引全球顶尖专家,共建共创。因为所有代码、训练方法全部公开了。如果你是一个美国人,你觉得DeepSeek还可以优化,你就可以自己补充,把DeepSeek变得更强大。也就是说,任何一个人,都可以在DeepSeek的基础上,去做技术性补充,通过共创共建的方式,让DeepSeek变得更加强大,以免费开源的方式,服务于全人类。

这种伟大的技术梦想,反而能够吸引到全世界的顶尖科学家,共同参与进来。当初,马斯克参与创建OpenAI就是想打造一个开源社区。可最终,微软收购了OpenAI,使得OpenAI变成了一个商业化工具。

如今,真正实现马斯克开源梦想的,反而是一家中国公司。但最受伤的还不是OpenAI,而是扎克伯格。他投入巨资,打造AI,却至今都不如DeepSeek。整个Meta的AI部门,都需要重新审视自己,钱究竟花在哪里去了?真的需要买那么多的英伟达芯片吗?这些美国技术人员真的值那么高的工资吗?



DeepSeek这一招开源,直接打爆了整个硅谷。它震撼的不只是硅谷科技圈,也震撼了硅谷资本圈。

它用一招从天而降的掌法告诉全世界:AI的护城河远没有大家想象的那么深,也不需要烧掉巨额资金。它真正需要的充沛的算力,加上天才的大脑。

			
网编:空问站

鲜花(9)

鸡蛋(1)
35 条
【手机扫描浏览分享】

扫一扫二维码[Scan QR Code]
进入内容页点击屏幕右上分享按钮


敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。
热门评论当前热评  更多评论...
评论人:szacy[♂★COOLMIND★♂][个人频道][个人动态] 2025年01月27日5:40 回复
最近這一年來,杭州的創新科技和STARTKUPS太令人驚艷了,讓全球驚歎不已。
- 黑悟空3A遊戲 Gamescience 遊戲科技公司;
- Unitree 機器狗、機器人;
- DeepSeek AI Model
這即便是深圳作為中國創新之都和東方硅谷也相形見絀。
14  
评论人:沙拉维[♂★理性爱国客观★♂][个人频道][个人动态] 2025年01月27日4:05 回复
试了一下R1,比之前强很多,终于可以说人话了。
总结归纳能力特别强。
之前你问他一些基本的是和不是的问题,他会因为话题敏感东拉西扯。
现在问他是不是独裁者,是不是人民生活悲惨,他会给你确切答案,解释的很客观,有理有据。
8  
评论人:剑指蠢货[♂★★无齿道人★★♂][个人频道][个人动态] 2025年01月27日3:25 回复
年底吹牛逼大会开始!!唉😔十四亿人口大国,却弄个傻子整天靠吹大牛忽悠我们中华民族!
14   4
评论人:无伤93[★品衔R6★][个人频道][个人动态] 2025年01月27日3:14 回复
那只数据狗不来了
11   2
评论人:铗归来[♂★★声望品衔10★★♂][个人频道][个人动态] 2025年01月27日8:44 回复
打造国之重器,A股股民亏钱骄傲!
1  
评论人:xxlm[☆品衔R4☆][个人频道][个人动态] 2025年01月27日8:08 回复
 回复10楼:国际支持里居然出现了日本。请问日本在国际社会的话语权什么时候可以跟美国并列了?
 
新闻速递首页 | 近期热门新闻 | 近期热评新闻 | 72小时神评妙论 | 即刻热度新闻排行
生活原创】【三叶原创】【留园网事】【生活百态】【杂论闲侃】【婚姻家庭】【女性频道】【科技频道】【宠物情缘
前期相关精彩新闻
新闻速递首页·向留园新闻区投稿·本地新闻·返回前页