时政·财经·军事 | 生活·家庭·娱乐 | 体坛·历史·科技 | 摄影·旅游·文化 | 移民·教育·就业 | 数码·健康·奇闻 | 社区·评论·问卷
留园网首页 · 新闻速递首页 · 【繁體閱讀】 【网友评论:12 条】 【 热评新闻排行 】 【 热门新闻排行 】 【 即刻热度新闻排行 】 【 72小时神评妙论 】   

阿里推重磅新模型,是时候整体重估中国AI资产了吗?(图)

新闻来源: 硬AI 于2025-01-28 22:34:17  提示:新闻观点不代表本网立场

农历除夕夜,在全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴巴美股股价在收盘前出现显著异动——从涨幅1%快速拉升至6.7%。

行情异动的背后,是一场没有硝烟的技术奇袭。

1月29日凌晨,阿里通义千问团队悄然上线的大模型Qwen2.5-Max,在多个权威基准测试中展现出与全球顶级模型比肩的性能。

继DeepSeek之后,Qwen2.5-Max的发布是中国AI阵营在高性能、低成本技术路线上的又一重要突破。

市场人士分析称,此前过度聚焦DeepSeek,却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示,若阿里Qwen-2.5-max这次的确性能超过V3,可以对其RL推理模型给予更大期待。

进一步,当阿里云展现出"强大模型+充足算力+完整云平台"的组合优势时,是否印证了类似去年北美云计算服务商的投资逻辑?如果美股因AI整体增值10万亿美元,中国AI资产的重估时机是否已至?



全面对标全球顶级模型,百万token里程碑

Qwen2.5-Max采用超大规模MoE(混合专家)架构,基于超过20万亿token的预训练数据。

在测试大学水平知识的MMLU-Pro、评估编程能力的LiveCodeBench、综合能力评估的LiveBench,以及近似人类偏好的Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至领先的性能。

阿里团队表示,随着后训练技术的不断进步,下一个版本将有望达到更高水平。



Qwen2.5团队同步发布了两个创新型号:Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。这些开源模型支持高达100万token的上下文窗口,成为业内首个达到此规模的公开可用模型。

这些模型使用稀疏注意力,只关注上下文中最重要的部分。这种方法处理百万token输入的速度比传统方法快3到7倍,输出长度可达8000个token。然而,这需要模型识别上下文文档中的关键段落——这是当前语言模型经常难以完成的任务。

在测试中,14B型号和Qwen2.5-Turbo在查找非常长的文档中的隐藏数字时都达到了完美的准确性。较小的7B型号也表现良好,只有轻微的错误。

在RULER、LV-Eval和LongbenchChat等要求更高的复杂的上下文测试中,百万token模型的表现优于128K token模型,尤其是在超过64K token的序列中,14B型号甚至在RULER中得分超过90分——这是Qwen系列的第一次——在多个数据集上持续击败gpt - 4o mini。



是时候整体重估中国AI资产了吗?

如果说DeepSeek V3的横空出世展现了中国AI的锐度,那么本次阿里的突破则体现了产业生态的深度进化。

在Qwen2.5-Max发布当天,阿里云百炼平台同步开放了完整的工具链支持,开发者可以直接在云端调用。这种"超算集群+开源生态+云原生"的三位一体架构,与北美AWS、Azure、GCP三大云服务商的商业模式形成镜像。

此外,根据我们之前提到的摩根士丹利最新研报,低成本高性能模型也将重塑数据中心和软件行业格局:

对于中国数据中心而言,短期内,如果大型科技公司采用类似技术路线,可能减少AI训练相关需求。但从长远来看,低成本模型将推动推理需求增长,对一线城市数据中心形成利好;

对于中国软件行业,AI模型成本的降低将降低应用程序运行AI功能的门槛,从供给侧改善行业环境。

如果阿里Qwen-2.5-max的性能确实展现出预期水平,加之其低成本优势与完整云生态,或引发DeepSeek之后的中国AI资产新一轮重估。

			
网编:睿文

鲜花(7)

鸡蛋(0)
12 条
【手机扫描浏览分享】

扫一扫二维码[Scan QR Code]
进入内容页点击屏幕右上分享按钮


敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。
热门评论当前热评  更多评论...
评论人:manyworlds[♂☆品衔R3☆♂][个人频道][个人动态] 2025年01月28日22:52 回复
台湾人的心思不就是小确幸吗,跟着美爹日爹蹭吃蹭喝
15  
评论人:雁过留声机[♂☆★声望品衔7★☆♂][个人频道][个人动态] 2025年01月28日22:43 回复
为什么民主的台湾有护国神山台积电无限量供应芯片,但是没有自己的大模型?是台湾人太傻逼还是台湾的制度太傻逼?值得反思
29  
新闻速递首页 | 近期热门新闻 | 近期热评新闻 | 72小时神评妙论 | 即刻热度新闻排行
科技频道】【宠物情缘
前期相关精彩新闻
新闻速递首页·向留园新闻区投稿·本地新闻·返回前页