留园首页  新闻速递首页  热评新闻榜  新闻评论公告  72小时神评妙论  即刻热度新闻 
评论人:hotcpu [☆品衔R3☆] [个人频道] [个人动态] 发送时间: 2025年01月25日 9:47:26 【回复】
把技术的事留给技术吧,别往上套政治了。 deepseek 的技术优势是他的训练方法。 而这方法是基于蒸馏其他大模型而来的。 换句话说, 在其他大模型完成训练的基础上才有效。 这可以大幅降低进一步训练的成本。 但隐患是他的模型并不是从材料里直接训练出来的, 开源也许没问题, 一旦蒸馏被禁止他的成本就会直线上升。
4  1 
↓↓↓ 共 5 条评论 ↓↓↓
评论人:jxxy1234 [★品衔R6★] [个人频道] [个人动态] 发送时间: 2025年01月25日 20:19:14 【回复】
:
可惜你说的不对
自己去看 deepseek 的报告,训练成本压根和信息蒸馏没关系
我估计你是被今天的某篇小作文误导了
   
评论人:fkxfh [品衔R2☆] [个人频道] [个人动态] 发送时间: 2025年01月25日 14:04:44 【回复】
正解,所以这是开源的成就,不是哪个国家的,可惜很多人根本不理解,看到个标题就开喷。
   
评论人:今日雨果 [☆品衔R4☆] [个人频道] [个人动态] 发送时间: 2025年01月25日 11:15:44 【回复】
“ 把技术的事留给技术吧,别往上套政治了。 deepseek 的技术优势是他的训练方法。 而这方法是基于蒸馏其他大模型而来的。 换句话说, 在其他大模型完成训练的基础上才有效。 这可以大幅降低进一步训练的成本。 但隐患是他的模型并不是从材料里直接训练出来的, 开源也许没问题, 一旦蒸馏被禁止他的成本就会直线上升。”

愿闻其详
2  3  
评论人:斯文嗨盗 [☆品衔R3☆] [个人频道] [个人动态] 发送时间: 2025年01月25日 10:00:36 【回复】
其他大模型本来就不是开源的 你告诉我蒸馏怎么被禁止
3   
评论人:斯文嗨盗 [☆品衔R3☆] [个人频道] [个人动态] 发送时间: 2025年01月25日 10:00:00 【回复】
   

用户名:密码:[--注册ID--]

新闻评论原文:陆媒:硅谷惊恐了!中国AI大模型突然弯道超车(图)
暂 时 还 没 有 上 榜 的 热 门 点 评
获赞最多的网友评论,将自动推送到留园神评妙论荟萃  



[ 留园首页 ] [ 留园条例 ] [ 广告服务 ] [ 联系我们 ]

Copyright (C) 6park.com All rights Reserved.