留园首页  新闻速递首页  热评新闻榜  新闻评论公告  72小时神评妙论  即刻热度新闻 
评论人:djtg [☆品衔R4☆] [个人频道] [个人动态] 发送时间: 2024年12月28日 17:45:07 【回复】
 回复12楼:文里说了技术原理“零一和DeepSeek用的都是MoE(混合专家)模式,相当于是在事先准备的高质量数据集上去做特定训练,不能说在跑分上完全没有水分,但市场并不关心原理,只要质价比够看,就一定会有竞争力。”这里高质量的数据集不出意外是现有的大模型上生产出来的,加上一定量的新数据,这样训练数据会非常“干净”,随便训练一下就有很好的效果,但缺点是应用范围会比原装训练出来的小,所以说有水份。这根本不是什么技术性革命,不过是利用别人的产品,在其基础上改进而已。
8  1 
↓↓↓ 共 0 条评论 ↓↓↓

用户名:密码:[--注册ID--]

新闻评论原文:陆媒:中国AI的进步之快 让美国人怀疑现实了(组图)
暂 时 还 没 有 上 榜 的 热 门 点 评
获赞最多的网友评论,将自动推送到留园神评妙论荟萃  



[ 留园首页 ] [ 留园条例 ] [ 广告服务 ] [ 联系我们 ]

Copyright (C) 6park.com All rights Reserved.