媒体:师承ChatGPT的DeepSeek和国运有啥关系?(图)
新闻来源: 冰川思享号 于2025-02-16 3:23:14 提示:新闻观点不代表本网立场 分享
撰文丨关不羽
DeepSeek横空出世,成功破圈。破圈之后,照例就是各自发挥的“六经注我”。其中最值得警惕的,中美双方都出现了借题发挥的“技术孤立主义”。美方的“脱钩论”者把DeepSeek视为技术威胁,剽窃、盗用的指责满天飞;这边则是把DeepSeek渲染为“中美争霸”的一击制胜,自我感觉良好。
好端端的科技成果,却成了地缘政治的符号。妖魔化和神化看似针尖对麦芒,其实都是对科技进步事业的亵渎,是阻挠人类科技进步事业的合谋。
唯有屏蔽杂音,才能直面真相:DeepSeek到底是什么?将会造成怎样的影响?
01DeepSeek师承ChatGPT
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。随即引发了资本市场的震荡,DeepSeek被形容为“英伟达的最大空头”,英伟达的股价大幅下跌。“DeepSeek碾压ChatGPT,吊打英伟达”的神话就此诞生。
先说DeepSeek和ChatGPT之间的关系。DeepSeek和ChatGPT之间的竞争,是“师徒之战”。两者的师承关系源于“蒸馏技术”,这是DeepSeek快速崛起的技术路径。
通俗地说,“蒸馏技术”就是用一个较为成熟的“教师模型”训练“学生模型”,这一过程类似低度酒蒸馏加工为高度酒。具体操作方式是,“学生模型”每分钟上百万次高频提问,从“教师模型”中汲取数据、学习逻辑。然后在人工干预下优化算法,最终形成独特的个性。ChatGPT就是DeepSeek的“教师模型”,或许不是唯一的,肯定是主要的。因此,说ChatGPT是DeepSeek的老师,不过分吧?

图/AI配图
“蒸馏技术”不是近年来的新发明,发明者既不是中国人,也不是美国人,而是英国佬杰弗里·辛顿在2015年提出的,比阿尔法狗一战成名还早一年。所以,当时“蒸馏技术”只是纯理论的屠龙技——压根就没有成熟的“教师模型”,没法蒸馏。直到ChatGPT等成熟大模型相继投入实际应用,“蒸馏技术”才有了实际应用的空间。因此,“先有ChatGPT,后有DeepSeek”也是无法否认的事实。
显然,DeepSeek不是“天上掉下个林妹妹”,而是站在巨人肩膀上的衍生产品。咋咋呼呼地竭力否认、淡化DeepSeek的师承ChatGPT,强拗“独立原创”的造型,是可笑又可怜的掩耳盗铃。
当然,也不能因为DeepSeek是蒸馏技术的产物,就否认其原创性。蒸馏不等于盗窃、抄袭。要是能一抄了之,哪里轮得到DeeSeek?在蒸馏技术的赛道上,有名有姓的玩家少说也有上百家。DeepSeek能出圈,是有几把刷子的。“蒸馏”大同小异,人工干预的算法优化各显神通。简洁高效的算法是DeepSeek的成功关键,颇有中国特色。
人工智能三大要素——算法、算力、数据,中国长于算法,美国重视算力。这种“偏科”倾向在赛道开启初期就已经显现了。昔日商汤为代表的视觉系AI“中国四小龙”,就是以算法著称。ChatGPT崛起,“算力为王”的大力出奇迹成为主流。风水轮流转,DeeepSeek的勃兴,在一定程度上是“算法复兴”。这种技术风格的转换,在人类的科技进步史上反复发生,是一种常态。
DeepSeek最大的优势是性价比,算法赋能大幅降低了算力成本。省钱永远是商业竞争的王道,绝大部分个人用户都没有很高的专业需求,免费、开源的DeepSeek更有吸引力,这是人工智能商业化应用的成功。
但是,这并不意味着因DeepSeek已经青出于蓝胜于蓝,更谈不上“碾压ChatGPT”。“蒸馏技术”和算法优化是做减法,以简化的方式提高效率。所以,DeepSeek更垂直、更聚焦专业领域,这也意味着牺牲了一部分通用性。比如说,文生图等视觉系技术就不是DeepSeek的强项,和文心一言比都有差距,遑论ChatGPT。而且,蒸馏技术的技术“天花板”到底有多高,现在也很难判断。未来能否实现性能全面超越,并没有清晰的预期。
这从资本市场的表现也可以看出端倪,DeepSeek上架后,微软的股价仅仅下跌了2%。表明了市场投资者还处于观望态度,资本市场用真金白银的站队表态,不是各路“嘴强王者”的唾沫星子可比的。
反而是英伟达的股价“大跌”17%,DeepSeek真是“英伟达终结者”吗?
02
DeepSeek不是“英伟达终结者”
DeepSeek到底使用了多少英伟达芯片,目前有三个版本分别是五万、一万和两千多,越传越少。其中“只有了两千多”的版本最假,DeepSeek创始人梁文锋本人在采访中就说过,早在公司成立前的2021年就囤了一万块GPU。无论是一万还是五万,比起动辄几十万芯片的大厂产品,都是数量级的降低。大可不必在传播过程中人为夸大DeepSeek的“省芯”。
必须指出的是,DeepSeek的算法优化“省芯”,并不会降低人工智能领域的算力需求降低。算法优化和算力需求的关系,有点类似燃油发动机技术节油和燃油消费需求。燃油发动机开发省油技术,并没有降低汽油消费的总量。因为汽车的燃油成本越低,促进了汽车的普及度,燃油消费的总量不降反增。DeepSeek省芯降低了人工智能研发应用的资金门槛,会吸引更多的投资者进场。
人工智能的研发端将会进一步走向“群狼搏虎”的遍地开花。在应用端,DeepSeek成功实现免费开源模式,大幅推进了人工智能的普及应用,也会产生巨大的算力需求增长。别小看中小企业、个人用户本地部署的仨瓜俩枣,聚沙成塔是巨大的潜在需求增长。DeepSeek不是“英伟达终结者”,而是英伟达的财神爷。

图/NVIDIA官网
所以,英伟达对DeepSeek的态度非常积极,不仅第一时间登陆NVIDIANIM,还给了权威背书——“DeepSeek-R1是最先进的大语言模型”。
至于所谓“股价大跌”,英伟达经历了市值十年增长222倍的超高增长,区区17%的跌幅不痛不痒。这轮回调,不是DeepSeek对英伟达产生了实质性威胁,而是市场投资者借DeepSeek释放一波回调势能。
当然,算力需求增长,未必是英伟达笑到最后。给英伟达造成竞争压力的不是DeepSeek,而是其他大厂的算力芯片。英伟达的大客户谷歌、亚马逊、微软竞相推出自家算力芯片,算力大战已经开打。这场“神仙打架”对人工智能技术的研发、应用无疑是好消息。
因此,强行把DeepSeek树立为英伟达的对手,是莫名其妙的“关公战秦琼”。这种强行对立,不是拔高,而是矮化——低估了Deepseek对整个人工智能领域的结构性冲击。
03
DeepSeek是计划外的中美科技合作产物
我们应该怎样评价DeepSeek呢?DeepSeek创始人梁文锋给出了标准答案,“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼”。

▲DeepSeek创始人梁文锋(图/视频截图)
DeepSeek的成功完全是计划外的市场产物。一家注册资金1000万的小公司,而不是“国家队”。起点不高,也没有“星辰大海”的宏大目标——DeepSeek的初始目标是专攻金融交易。这样一家“起于草莽”的小民企,打造了一款成功的人工智能产品。不经意间改变了整个产业。这才是科技产业发展的正常模式。各种奇思妙想在开放的市场中竞争、试错,实现从量变到质变的升华。
DeepSeek的成功,没有“赌国运”、中美争霸的宏大叙事,只有朴实的市场逻辑和水到渠成的科技路径。市场需要性价比高的人工智能技术,企业研发满足了市场需求。蒸馏技术从纯理论的纸上谈兵,到成熟大模型开道后真正落地。自然而然,不需要拔苗助长。
DeepSeek不是闭门造车的产物,而是中美科技合作的成果。美国大厂的“教师模型”和算力技术,中国科技企业的研发力量,缺一不可。市场机制的无形之手,总是撮合出“佳偶天成”。那些彩旗飘飘、仪式感十足的“合作签约仪式”十之八九只是“仪式”而已。只有市场机制下的合作才保真。
因此,大可不必刻意强调DeepSeek的原创性、创新性。师承ChatGPT的蒸馏技术、使用英伟达GPU都是无法否认的事实,又何必遮遮掩掩?“微创新”的一小步,也可以是人类科技事业的一大步。瓦特并没有发明蒸汽机,而是改良了前辈的创作。这并不妨碍瓦特蒸汽机叩开了工业化的大门。
一款好产品本身,足以说明一切。DeepSeek无疑是一款好产品,至于是否具备“划时代”的意义,无需“口头加冕”,时间会说明一切。就算没有又何妨?只要有良好的市场合作机制,而不是以邻为壑的自我封闭,划时代的好产品一定不会缺席。
DeepSeek横空出世,成功破圈。破圈之后,照例就是各自发挥的“六经注我”。其中最值得警惕的,中美双方都出现了借题发挥的“技术孤立主义”。美方的“脱钩论”者把DeepSeek视为技术威胁,剽窃、盗用的指责满天飞;这边则是把DeepSeek渲染为“中美争霸”的一击制胜,自我感觉良好。
好端端的科技成果,却成了地缘政治的符号。妖魔化和神化看似针尖对麦芒,其实都是对科技进步事业的亵渎,是阻挠人类科技进步事业的合谋。
唯有屏蔽杂音,才能直面真相:DeepSeek到底是什么?将会造成怎样的影响?
01DeepSeek师承ChatGPT
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。随即引发了资本市场的震荡,DeepSeek被形容为“英伟达的最大空头”,英伟达的股价大幅下跌。“DeepSeek碾压ChatGPT,吊打英伟达”的神话就此诞生。
先说DeepSeek和ChatGPT之间的关系。DeepSeek和ChatGPT之间的竞争,是“师徒之战”。两者的师承关系源于“蒸馏技术”,这是DeepSeek快速崛起的技术路径。
通俗地说,“蒸馏技术”就是用一个较为成熟的“教师模型”训练“学生模型”,这一过程类似低度酒蒸馏加工为高度酒。具体操作方式是,“学生模型”每分钟上百万次高频提问,从“教师模型”中汲取数据、学习逻辑。然后在人工干预下优化算法,最终形成独特的个性。ChatGPT就是DeepSeek的“教师模型”,或许不是唯一的,肯定是主要的。因此,说ChatGPT是DeepSeek的老师,不过分吧?

图/AI配图
“蒸馏技术”不是近年来的新发明,发明者既不是中国人,也不是美国人,而是英国佬杰弗里·辛顿在2015年提出的,比阿尔法狗一战成名还早一年。所以,当时“蒸馏技术”只是纯理论的屠龙技——压根就没有成熟的“教师模型”,没法蒸馏。直到ChatGPT等成熟大模型相继投入实际应用,“蒸馏技术”才有了实际应用的空间。因此,“先有ChatGPT,后有DeepSeek”也是无法否认的事实。
显然,DeepSeek不是“天上掉下个林妹妹”,而是站在巨人肩膀上的衍生产品。咋咋呼呼地竭力否认、淡化DeepSeek的师承ChatGPT,强拗“独立原创”的造型,是可笑又可怜的掩耳盗铃。
当然,也不能因为DeepSeek是蒸馏技术的产物,就否认其原创性。蒸馏不等于盗窃、抄袭。要是能一抄了之,哪里轮得到DeeSeek?在蒸馏技术的赛道上,有名有姓的玩家少说也有上百家。DeepSeek能出圈,是有几把刷子的。“蒸馏”大同小异,人工干预的算法优化各显神通。简洁高效的算法是DeepSeek的成功关键,颇有中国特色。
人工智能三大要素——算法、算力、数据,中国长于算法,美国重视算力。这种“偏科”倾向在赛道开启初期就已经显现了。昔日商汤为代表的视觉系AI“中国四小龙”,就是以算法著称。ChatGPT崛起,“算力为王”的大力出奇迹成为主流。风水轮流转,DeeepSeek的勃兴,在一定程度上是“算法复兴”。这种技术风格的转换,在人类的科技进步史上反复发生,是一种常态。
DeepSeek最大的优势是性价比,算法赋能大幅降低了算力成本。省钱永远是商业竞争的王道,绝大部分个人用户都没有很高的专业需求,免费、开源的DeepSeek更有吸引力,这是人工智能商业化应用的成功。
但是,这并不意味着因DeepSeek已经青出于蓝胜于蓝,更谈不上“碾压ChatGPT”。“蒸馏技术”和算法优化是做减法,以简化的方式提高效率。所以,DeepSeek更垂直、更聚焦专业领域,这也意味着牺牲了一部分通用性。比如说,文生图等视觉系技术就不是DeepSeek的强项,和文心一言比都有差距,遑论ChatGPT。而且,蒸馏技术的技术“天花板”到底有多高,现在也很难判断。未来能否实现性能全面超越,并没有清晰的预期。
这从资本市场的表现也可以看出端倪,DeepSeek上架后,微软的股价仅仅下跌了2%。表明了市场投资者还处于观望态度,资本市场用真金白银的站队表态,不是各路“嘴强王者”的唾沫星子可比的。
反而是英伟达的股价“大跌”17%,DeepSeek真是“英伟达终结者”吗?
02
DeepSeek不是“英伟达终结者”
DeepSeek到底使用了多少英伟达芯片,目前有三个版本分别是五万、一万和两千多,越传越少。其中“只有了两千多”的版本最假,DeepSeek创始人梁文锋本人在采访中就说过,早在公司成立前的2021年就囤了一万块GPU。无论是一万还是五万,比起动辄几十万芯片的大厂产品,都是数量级的降低。大可不必在传播过程中人为夸大DeepSeek的“省芯”。
必须指出的是,DeepSeek的算法优化“省芯”,并不会降低人工智能领域的算力需求降低。算法优化和算力需求的关系,有点类似燃油发动机技术节油和燃油消费需求。燃油发动机开发省油技术,并没有降低汽油消费的总量。因为汽车的燃油成本越低,促进了汽车的普及度,燃油消费的总量不降反增。DeepSeek省芯降低了人工智能研发应用的资金门槛,会吸引更多的投资者进场。
人工智能的研发端将会进一步走向“群狼搏虎”的遍地开花。在应用端,DeepSeek成功实现免费开源模式,大幅推进了人工智能的普及应用,也会产生巨大的算力需求增长。别小看中小企业、个人用户本地部署的仨瓜俩枣,聚沙成塔是巨大的潜在需求增长。DeepSeek不是“英伟达终结者”,而是英伟达的财神爷。

图/NVIDIA官网
所以,英伟达对DeepSeek的态度非常积极,不仅第一时间登陆NVIDIANIM,还给了权威背书——“DeepSeek-R1是最先进的大语言模型”。
至于所谓“股价大跌”,英伟达经历了市值十年增长222倍的超高增长,区区17%的跌幅不痛不痒。这轮回调,不是DeepSeek对英伟达产生了实质性威胁,而是市场投资者借DeepSeek释放一波回调势能。
当然,算力需求增长,未必是英伟达笑到最后。给英伟达造成竞争压力的不是DeepSeek,而是其他大厂的算力芯片。英伟达的大客户谷歌、亚马逊、微软竞相推出自家算力芯片,算力大战已经开打。这场“神仙打架”对人工智能技术的研发、应用无疑是好消息。
因此,强行把DeepSeek树立为英伟达的对手,是莫名其妙的“关公战秦琼”。这种强行对立,不是拔高,而是矮化——低估了Deepseek对整个人工智能领域的结构性冲击。
03
DeepSeek是计划外的中美科技合作产物
我们应该怎样评价DeepSeek呢?DeepSeek创始人梁文锋给出了标准答案,“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼”。

▲DeepSeek创始人梁文锋(图/视频截图)
DeepSeek的成功完全是计划外的市场产物。一家注册资金1000万的小公司,而不是“国家队”。起点不高,也没有“星辰大海”的宏大目标——DeepSeek的初始目标是专攻金融交易。这样一家“起于草莽”的小民企,打造了一款成功的人工智能产品。不经意间改变了整个产业。这才是科技产业发展的正常模式。各种奇思妙想在开放的市场中竞争、试错,实现从量变到质变的升华。
DeepSeek的成功,没有“赌国运”、中美争霸的宏大叙事,只有朴实的市场逻辑和水到渠成的科技路径。市场需要性价比高的人工智能技术,企业研发满足了市场需求。蒸馏技术从纯理论的纸上谈兵,到成熟大模型开道后真正落地。自然而然,不需要拔苗助长。
DeepSeek不是闭门造车的产物,而是中美科技合作的成果。美国大厂的“教师模型”和算力技术,中国科技企业的研发力量,缺一不可。市场机制的无形之手,总是撮合出“佳偶天成”。那些彩旗飘飘、仪式感十足的“合作签约仪式”十之八九只是“仪式”而已。只有市场机制下的合作才保真。
因此,大可不必刻意强调DeepSeek的原创性、创新性。师承ChatGPT的蒸馏技术、使用英伟达GPU都是无法否认的事实,又何必遮遮掩掩?“微创新”的一小步,也可以是人类科技事业的一大步。瓦特并没有发明蒸汽机,而是改良了前辈的创作。这并不妨碍瓦特蒸汽机叩开了工业化的大门。
一款好产品本身,足以说明一切。DeepSeek无疑是一款好产品,至于是否具备“划时代”的意义,无需“口头加冕”,时间会说明一切。就算没有又何妨?只要有良好的市场合作机制,而不是以邻为壑的自我封闭,划时代的好产品一定不会缺席。
网编:和评 |
|
39 条 | |||
|
|||||
这篇文章的作者就是头猪,自己做不出来,却放肆地胡扯别人。
deepseek完全开源了,说说那段代码是抄袭别人的。 这篇文章的作者需要知道的是:自己是个完蛋货,就别迁拖别人也是完蛋货。
无知无耻。蒸馏是一种模型压缩算法,需要知道教师模型的参数,目前ds只发布了qwen和llama的distill模型,都是开源模型,闭源模型没法做蒸馏。说ds盗用openai的数据,有证据吗?那就公布出来,没证据就闭上你的狗嘴! 这帮造谣的死玩意儿就该乱刀砍死,人人得而诛之。
|
【科技频道】【宠物情缘】【杂论闲侃】【博论天下】
敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。