12个国产大模型大战高考数学意外炸出个大bug -6parknews.com

时政·财经·军事 | 生活·家庭·娱乐 | 体坛·历史·科技 | 摄影·旅游·文化 | 移民·教育·就业 | 数码·健康·奇闻 | 社区·评论·问卷

留园网首页 · 新闻速递首页 · 【繁體閱讀】【网友评论:8 条】【热评新闻排行】【热门新闻排行】【即刻热度新闻排行】【 72小时神评妙论】　　

12个国产大模型大战高考数学意外炸出个大bug(组图)

新闻来源: 量子位于2024-06-08 14:15:44 提示:新闻观点不代表本网立场

继国产大模型挑战高考作文之后，是时候再战一下高考数学了。数学高考Ⅰ卷的题目，目前已经陆陆续续在网上有所公布（图片格式）。

那么现在，是时候考验国产大模型们的数学能力了。

有请“选手们”登场——

Kimi、通义千问、文心一言、豆包、智谱清言、百小应、讯飞星火、商量、腾讯元宝、天工、海螺AI、万知。

国产大模型 vs 高考数学选择题根据数学题目类型的不同，我们先来小试牛刀一下选择题。

测评的方式是将题目（图片格式）“喂”给国产大模型们，要求它们给出相应题目的答案：

查看题目，给出第1题到第8题的答案。

接下来，我们就来一同看下国产大模型们的表现。

Kimi

通义千问

豆包

智谱清言

百小应

讯飞星火

商量

腾讯元宝

海螺AI

万知

不难看出，很多国产大模型还未做数学题，先败在了AI识图这个步骤，无法生成答案。

（PS：有几位选手测试时因为无法识别，未能完成答题，因此没有放出结果。）

那么我们最后来看下“踢馆选手”——GPT-4o。

国产大模型 vs 数学大题鉴于一些国产大模型AI识图有点困难，我们这次直接先把这次高考的大题题目文字给copy出来，再让它们作答：

设n为正整数，数列 ( a1, a_2, cdots, a{4m+2} ) 是公差不为0的等差数列。若从中抽去项 ( ai ) 和 ( a_j ) (i

接下来，我们再来看下国产大模型们的表现。

Kimi

通义千问

文心一言

豆包

智谱清言

百小应

讯飞星火

商量

腾讯元宝

天工

海螺AI

万知

最后，还是有请“踢馆选手”——GPT-4o。

那么，你觉得国产大模型们，识图+解数学题，哪家比较好一点呢？

最后，关于AI智能助手，这里也有一份最新用户数据分析报告供你参考：

https://mp.weixin.qq.com/s/sYxbvown5qLBnEs7zIR6Bg

网编：和评

鲜花(0)

鸡蛋(1)

8 条

【手机扫描浏览分享】

扫一扫二维码[Scan QR Code]
进入内容页点击屏幕右上分享按钮

敬请注意：新闻内容来自网络，供网友多视角阅读参考，观点不代表本网立场！若有违规侵权，请联系我们。

暂时还没有出现上榜热评，快来“点”一个吧！

新闻速递首页 | 近期热门新闻 | 近期热评新闻 | 72小时神评妙论 | 即刻热度新闻排行
【科技频道】【宠物情缘】

前期相关精彩新闻

◎ 过界?张颂文宋佳摸胸片段港台重播引发大讨论(组图)

◎ 女神藏16年的美貌女儿要出道?四个孩子形同陌路(图)

◎ 仇日言论泛滥!腾讯、网易、抖音、微博展开整治(图)

◎ 93岁奶奶血管年龄20岁!长寿秘诀:洗澡有特殊习惯(图)

◎ 台湾女子帕劳被要求“脱光检查”台外事部门挨批(视频)

新闻速递首页·向留园新闻区投稿·本地新闻·返回前页

[ 留园手机网页版 ] [ 留园手机客户端 ] [ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ]

Copyright (C) All rights Reserved.