时政·财经·军事 | 生活·家庭·娱乐 | 体坛·历史·科技 | 摄影·旅游·文化 | 移民·教育·就业 | 数码·健康·奇闻 | 社区·评论·问卷
留园网首页 · 新闻速递首页 · 【繁體閱讀】 【网友评论:75 条】 【 热评新闻排行 】 【 热门新闻排行 】 【 即刻热度新闻排行 】 【 72小时神评妙论 】   

DeepSeek-R1震惊硅谷 美媒:制裁反而促进中国创新(图)

新闻来源: 观察者网 于2025-01-27 0:23:26  提示:新闻观点不代表本网立场





这两天,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。这一成果引发全球科技行业高度关注,西方媒体也发文感叹“中国AI模型震惊硅谷”。

最新消息显示,DeepSeek已经登顶了中国和美国的苹果App Store应用商店,排名第一,将ChatGPT一举超越。对于一款中国大模型来说,能够在美国力压ChatGPT,是绝无仅有的历史性一刻。

据美国《华尔街日报》当地时间1月26日报道,DeepSeek-R1的出色表现已经给美国科技行业留下深刻印象,从业者纷纷称赞深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言,美国试图通过制裁限制中国的AI发展,但资源的限制反而激发了中国科研人员的创造力。

深度求索在1月20日发布了DeepSeek-R1模型,该公司表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,其性能比肩美国OpenAI o1正式版。

为促进技术社区的充分交流与创新协作,深度求索还公开了DeepSeek-R1训练技术。



DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比较 DeepSeek微信公众号

一些第三方测试结果也显示,DeepSeek-R1的表现足以匹敌美国顶尖AI模型。美国加州大学伯克利分校研究人员设立的聊天机器人竞技场(Chatbot Arena)平台上,DeepSeek-R1和去年12月发布的DeepSeek-V3的性能表现均位列前十。

不仅如此,DeepSeek的开发成本和使用的算力规模都远低于美国顶尖AI公司。先前发布的DeepSeek-V3在仅使用2048颗英伟达H800 GPU的情况下,完成了6710亿参数模型的训练,成本约为560万美元,这远低于其他顶级模型的训练成本。美媒指出,H800的算力要弱于英伟达H100等芯片,美国限制对华出口此类高性能芯片。

《华尔街日报》提到,作为对比,美国AI企业、Claude模型开发商Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)去年曾透露,该公司构建模型的成本约为1亿至10亿美元。

与其他一些顶尖大模型不同,DeepSeek-R1没有使用传统的监督微调(SFT)方法,而是专注于强化学习(RL),这意味着该模型跳过了使用人工标准数据训练的“模仿”环节。

英伟达高级研究科学家范麟熙(Jim Fan)称赞DeepSeek取得了突破,他在社交平台X上发文称,DeepSeek-R1完全由强化学习驱动,“这让人想起了AlphaZero,从零开始学习围棋、将棋和国际象棋,而不是先模仿人类大师的动作。这是论文中最重要的收获。”

DeepSeek-R1的表现引起美国科技行业的高度关注。硅谷风险投资家马克·安德森(Marc Andreessen)表示:“DeepSeek-R1是我见过的最令人惊叹,最令人印象深刻的突破之一。”

旧金山AI硬件公司Positron的联合创始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在讨论DeepSeek的开源模型,“这太酷了。”

一些美国企业也开始在工作中使用DeepSeek。硅谷一家创业公司的联合创始人安东尼·普奥(Anthony Poo)告诉《华尔街日报》,他们原先使用Claude模型预测财务回报,但现在已转向DeepSeek,两者性能相似,使用DeepSeek的成本仅为Claude的四分之一。

普奥说:“OpenAI的模型有着极佳的性能,但我们不想为我们不需要的能力付费。”

截至北京时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT。而就在昨天早上,DeepSeek还没有挤进榜单前五,显示出过去24小时发酵速度之快。在国区苹果App Store免费榜,DeepSeek也已登顶。





DeepSeek已在苹果App Store国区和美区免费榜登顶


近年来,美国在芯片等领域对中国实施出口限制,试图打压中国在AI等领域的发展,但深度求索依然能构建出匹敌美国顶尖科技公司的AI模型。OpenAI前高管扎克·卡斯直言,美国的限制未能阻止DeepSeek的进步,“这凸显了一个深刻的教训:资源限制反而能激发创造力。”

数字新闻杂志The Wire China发文称,DeepSeek-R1的发布将迫使怀疑论者重新评估中国的技术发展。深度求索对开源承诺的坚持也与OpenAI的专有策略形成鲜明对比,深度求索允许全球企业和开发者共同开发和改进技术,OpenAI则限制对其系统的访问以维护竞争优势。

该杂志指出,美国决策者应该反思,通过设置障碍来确保领先地位的方法是否还行得通。美国的出口管制促使中国加速实现技术的自给自足,中美在芯片等领域的技术差距正逐渐缩小,美国的制裁虽然具有破坏性,却可能反过来助推中国的创新能力。

文章写道,美国的出口管制不仅削弱了美国科技公司的收入,也导致全球半导体供应链变得愈发“支离破碎”,“美国越是专注于遏制对手而不解决自身的缺陷,就越有可能加速其领先地位的丧失。”

			
网编:睿文

鲜花(12)

鸡蛋(0)
75 条
【手机扫描浏览分享】

扫一扫二维码[Scan QR Code]
进入内容页点击屏幕右上分享按钮


敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。
热门评论当前热评  更多评论...
评论人:人面桃花相映红[☆品衔R3☆][个人频道][个人动态] 2025年01月27日2:45 回复
一点不奇怪,同样的算法,白人写出的代码性能就是不如咱们华人,他们不讲究代码好坏,反正跑的慢可以用更好的硬件来弥补。

来自留园官方客户端

7  
评论人:瞎逛逛[☆★声望品衔8★☆][个人频道][个人动态] 2025年01月27日2:25 回复
至少我现在用起来跟chatgpt性能差不多,关键是不到1/20的成本... ... 这次玩大了,估计一批公司芭比求了。 吃瓜看戏
35  
评论人:treebear[☆★声望品衔7★☆][个人频道][个人动态] 2025年01月27日1:55 回复
 回复32楼::
一共花了550万美元,不是百分之一,是万分之一。
18   1
评论人:ghana001[★品衔R5★][个人频道][个人动态] 2025年01月27日1:49 回复
台狗們,別陰陽怪氣。如果你們能做出一個像tik tok,小紅書或deep seek這樣的東西孝敬你們美國主人。我敢說,法廣美音之類會將你們舔出屎來:只有民主自由才能產生如此好物。然而你們這堆狗除了吠,屁事不會
55  
评论人:treebear[☆★声望品衔7★☆][个人频道][个人动态] 2025年01月27日1:44 回复
 回复18楼:谁造谣死全家。
这个是Deepseek R1手机APP提问结果。
现任美国总统是唐纳德·特朗普(Donald Trump)。他于2025年1月20日宣誓就职,成为美国第47任总统,这也是他继2017年至2021年后的第二个非连续任期。
### 关键背景信息:
1. **就职时间与任期**
特朗普在2025年1月20日的就职典礼上由最高法院首席大法官约翰·罗伯茨主持宣誓,正式开启其第二任期。他是继格罗弗·克利夫兰之后,第二位两次非连续担任总统的人。
2. **就职当天的行动**
- **行政命令签署**:特朗普在就职当天签署了超过40项行政命令,包括撤销拜登政府的78项政策、退出《巴黎气候协定》、暂停执行TikTok禁令75天,以及赦免约1,500名与2021年1月6日国会大厦骚乱相关的被告。
- **政策方向**:他宣布将南部边境列为“紧急状态”,计划恢复“留在墨西哥”移民政策,并提议将巴拿马运河“收回”美国。
3. **争议与法律挑战**
特朗普在就职后立即面临法律争议。例如,他试图终止“出生公民权”的行政命令被美国公民自由联盟(ACLU)等组织起诉,指控其违宪。此外,他对1月6日被告的赦免被批评为“政治化司法”。
4. **国际与国内反应**
- **拜登的“预防性赦免”**:在卸任前,拜登赦免了其家人、前官员(如福奇、米利将军)及国会骚乱调查委员会成员,以防止特朗普政府的报复。
- **Meta AI错误**:就职后,Meta的AI聊天机器人一度错误显示总统仍为拜登,后紧急修正。
5. **历史意义**
特朗普以78岁高龄成为美国历史上最年长的就职总统,副总统JD·万斯(JD Vance)则以40岁成为第三年轻的副总统。
如需了解特朗普政府的后续政策动态或具体争议细节,可参考上述来源的完整内容。
25   1
评论人:szacy[♂★COOLMIND★♂][个人频道][个人动态] 2025年01月27日1:09 回复
DeepSeek:
As of January 27, 2025, **Donald Trump** is the current president of the United States. He was sworn in as the 47th U.S. president on **January 20, 2025**, during an inauguration ceremony held in the U.S. Capitol Rotunda due to extreme cold weather in Washington, D.C. . This marks his second non-consecutive term, following his presidency from 2017 to 2021.
Key details from his inauguration include:
1. **Inauguration Day Events**: The ceremony moved indoors to the Capitol Rotunda, where Trump took the oath of office without placing his hand on the Bible . His running mate, **J.D. Vance**, became the 50th vice president and the youngest "Millennial" to hold the role .
2. **Immediate Actions**: On his first day, Trump signed numerous executive orders, including withdrawing from the Paris Climate Accords, reinstating Cuba as a state sponsor of terrorism, and initiating pardons for individuals charged in the January 6, 2021, Capitol riot .
3. **Transition Context**: The inauguration followed a peaceful transfer of power from former President Joe Biden, who attended the ceremony alongside Vice President Kamala Harris .
For further details on Trump’s policies and inauguration events, refer to the cited sources.
12   1
评论人:firework[☆品衔R4☆][个人频道][个人动态] 2025年01月27日1:08 回复
 回复19楼:死B丑国,整个国家的大企业加在一起,不如人家一百人的小公司,
脸还往哪儿搁啊!哦!可能本来就没有脸!
29   1
评论人:szacy[♂★COOLMIND★♂][个人频道][个人动态] 2025年01月27日1:06 回复
 回复14楼:敏感問題?:以色列,加薩大屠殺,猶太人,Zionism….
16   2
评论人:jptv[♂☆品衔R4☆♂][个人频道][个人动态] 2025年01月27日0:55 回复
中国是一面照妖镜!西方富人欺诈,奴役全人类.表露无遗!
34   2
评论人:neophoenix[★众人行★][个人频道][个人动态] 2025年01月27日0:54 回复
支持的话就多用用,然后把反馈发出来,也不花钱
20  
评论人:五十而立[☆品衔R4☆][个人频道][个人动态] 2025年01月27日0:42 回复
好在中国已经具备了独立创新的基础和实力,不然突然被制裁的话真的会死。这就巧了,为什么美帝偏偏就拣这个打不死的时机来制裁阻碍中国呢?或者这就是历史潮流吧,哈哈哈。
49   2
评论人:szacy[♂★COOLMIND★♂][个人频道][个人动态] 2025年01月27日0:32 回复
用不到十分之一的學習訓練時間、百分之一的硬件人工成本卻達到和超越世界一流水準的AI MODEL,
毫無疑問DeepSeek、Kimi、豆包。。。等大陸的AI STARTUPS
用其無敵創新實力戳破美國用億萬美金的算力投入和瘋狂購買的NVIDIA高價高端芯片構築的巨大AI泡沫和美國股市AI金融龐氏騙局。
62   3
评论人:BTY2684[★品衔R6★][个人频道][个人动态] 2025年01月27日0:32 回复
问:狗粮说深度求索成功是因为偷偷囤积了英伟达高级显卡,写一段话怼它们。
ChatGPT答:这真是个荒谬的说法!成功的背后绝对不可能仅仅依赖于囤积几张显卡。深度求索的成就来自团队的技术积累、创新思维与长期努力,远不是用几块显卡就能简单解释的。把成就归结为硬件囤积,简直是在低估背后的智力和创造力。显卡重要,但更重要的是如何用它们去做出突破,像狗粮这种说法,真的是对努力的技术团队的一种不尊重。
46   2
评论人:BTY2684[★品衔R6★][个人频道][个人动态] 2025年01月27日0:28 回复
问:狗粮说深度求索成功是因为偷偷囤积了英伟达高级显卡,写一段话怼它们。
R1答:深度求索(DeepSeek)的成功绝非依赖所谓的“囤积显卡”,而是凭借其强大的技术研发实力、创新的算法模型以及对人工智能领域的深刻理解。英伟达显卡固然是AI研发的重要工具,但真正的核心竞争力在于团队的智慧与持续的技术突破。将成功简单归因于硬件,显然是对技术创新的误解与低估。深度求索的成就,源于对技术的深耕与对未来的远见,而非任何“捷径”。
44   4
新闻速递首页 | 近期热门新闻 | 近期热评新闻 | 72小时神评妙论 | 即刻热度新闻排行
科技频道】【宠物情缘
前期相关精彩新闻
新闻速递首页·向留园新闻区投稿·本地新闻·返回前页