留园首页  新闻速递首页  热评新闻榜  新闻评论公告  72小时神评妙论  即刻热度新闻 
评论人:comgeek [☆品衔R3☆] [个人频道] [个人动态] 发送时间: 2024年12月28日 19:14:51 【回复】
中国刚刚发布的DeepseekV3已经在英语中文数学推理超越了GPT4 Omi。它的学习成本只有美国同类大模型的1/11甚至更少。而且它还是开源的。美国那种靠对显卡的做法是不可持续的,老黄的股票又要跌了。
2   
↓↓↓ 共 1 条评论 ↓↓↓
评论人:djtg [☆品衔R4☆] [个人频道] [个人动态] 发送时间: 2024年12月28日 23:44:56 【回复】
国内2种大模型使用Mixture of Experts (MoE),不是什么新东西,把数据分成不同的子类,用不同的子模型训练,最后再综合。这是算力不足的一种折中方法,但种方法有其自身的局限性。高缓存要求, overfitting,还有更复杂的微调,和稳定性差。
1   

用户名:密码:[--注册ID--]

新闻评论原文:AI教父:AI在30年内毁灭人类的几率高达2成 (图)
暂 时 还 没 有 上 榜 的 热 门 点 评
获赞最多的网友评论,将自动推送到留园神评妙论荟萃  



[ 留园首页 ] [ 留园条例 ] [ 广告服务 ] [ 联系我们 ]

Copyright (C) 6park.com All rights Reserved.