留园首页  新闻速递首页  热评新闻榜  新闻评论公告  72小时神评妙论  即刻热度新闻 
[25楼]评论人:尖头辣椒 [☆品衔R4☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 14:01:48 【回复】
DeepSeek解答先有鸡还是先有蛋,服务器繁忙,稍后再试
   
[24楼]评论人:Jau [★我不装WhatsApp★] [个人频道] [个人动态] 发送时间: 2025年02月13日 13:10:14 【回复】
 回复23楼:这不是我能误导的, 再说,事物的多样性,这是AI必须适应的,就像不同语言和不同说话方式一样。
你的答案很可是对的。就是这种在对错之间不停摇摆,是最可怕的。
我们现在所有的理论和设备,在我们目前的认识范围内, 其可用性最只要是体现在稳定性上。
   
[23楼]评论人:错错错错错 [★错错错错了吗★] [个人频道] [个人动态] 发送时间: 2025年02月13日 12:31:25 【回复】
 回复22楼:你在前面有没有在“误导”?
  1 1 
[22楼]评论人:Jau [★我不装WhatsApp★] [个人频道] [个人动态] 发送时间: 2025年02月13日 12:25:17 【回复】
 回复21楼:很正常,模型的不稳定性,这是更大缺陷。
2  1 
[21楼]评论人:错错错错错 [★错错错错了吗★] [个人频道] [个人动态] 发送时间: 2025年02月13日 11:47:43 【回复】
 回复20楼:为什么我用的结果跟你不一样?!
2  1 1 
[20楼]评论人:Jau [★我不装WhatsApp★] [个人频道] [个人动态] 发送时间: 2025年02月13日 10:56:40 【回复】
测试GPT:15.9和15.11比较那个大?
答案:15.11 比 15.9 大。因为在比较数字时,小数点后的数字从左到右依次比较,15.11 的第二位数字(1)大于 15.9 的第二位数字(9),所以 15.11 更大。
什么破玩意? 难道你不知道数学里小数点的概念吗?
===
测试DeepSeek:15.9和15.11比较那个大?

https://www.popo8.com/host/data/202502/13/2/33d57c1_type_3_size_373_91_end.jpg_b.jpg
这个更蠢,居然说:0.11大于0.9?来自6parkbbs.com留园手机网页版
2  1 
[19楼]评论人:大春哥 [☆★声望品衔7★☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 10:51:28 【回复】
教育局長指出,從明年開始,所有老師薪水減半,因為學生一定會用Al做作業,中小學老師以後也可以用Ai改學生習作
1   
[18楼]评论人:阿迹 [☆★声望品衔7★☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 10:35:37 【回复】
看完长舒一口气。这说明这些各种AI还不是真AI,还不会思考。只是检索、比对。活人还有活路。
1   
[17楼]评论人:樱桃儿熟了 [☆★品銜R19★☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 10:31:34 【回复】
新智元好像是一个台湾的反中自媒体。看过好几个它的文章,反正是反中的。
2   
[16楼]评论人:木头000 [☆品衔R4☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 10:06:36 【回复】
有一说一,在工作上AI真的挺好用的。尤其在写点儿东西打个草稿方面。 现在比较正式的报告跟email,直接让AI写第一版。
1   
[15楼]评论人:Jau [★我不装WhatsApp★] [个人频道] [个人动态] 发送时间: 2025年02月13日 9:55:09 【回复】
不得不去考虑,花费那么多资源, 这个“AI"真的是不是值得?
人类社会本来应该把有限的资源去发战经济和基础研究。
这才是人类社会进步的基础。
=====
早就说了,OPENAI也就那么回事,DEEPSEEK更不要吹牛。
不改变底层的”计算加存储“, AI和人类智能有天壤之别,
只能做些重复性的工作, 至于说人类大脑特有推理逻辑和智谋, 不可能达到。
至于最近五毛因为DS不可一世的闹腾,更是应该歇一歇了。
3   
[14楼]评论人:俺样 [★品衔R5★] [个人频道] [个人动态] 发送时间: 2025年02月13日 9:52:30 【回复】
一直都觉得它就是一个写小作文的,写个总结报告还行,哪有什么创新思维。
   
[13楼]评论人:liuyuanren88 [☆品衔R3☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 9:41:39 【回复】
不要吹DeepSeek的数学推理有多么厉害了,同样ChatGPT,Grok和Gemini也不行。
拿这道2004年上海市高中数学竞赛题测试一下。
在各位数码各不相同的10位数中,是11111的倍数的有多少个?证明你的结论。
没有一个回答正确,应该是3456个。
4   
[12楼]评论人:littlecell [品衔R2☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 9:39:29 【回复】
其实人本尊也差不多,学习大多数还是归纳总结记忆已有的知识加以运用,真能创新的都是极少天才

来自留园官方客户端

   
[11楼]评论人:顽童在线 [♂★★★声望勋衔13★★★♂] [个人频道] [个人动态] 发送时间: 2025年02月13日 9:36:26 【回复】
DeepSeek就是垃圾,下午弄了5个问题,都是服务器繁忙,稍后再试。只能说国外ai太流氓,你数学又没公开推理过程,DeepSeek当然只能蒸馏题目和结果了呀。
2  1  
[10楼]评论人:随意岁月 [★品衔R6★] [个人频道] [个人动态] 发送时间: 2025年02月13日 9:35:01 【回复】
不是传闻open ai的部分推理用中文吗
   
[9楼]评论人:ppplu [★皮皮皮鲁★] [个人频道] [个人动态] 发送时间: 2025年02月13日 9:28:38 【回复】
不识庐山真面目,只缘身在此山中?
AI靠大数据而不是靠所谓“推理”,这难道不是我们做为外行人士的常识认知么?
2   
[8楼]评论人:塔玛的隔壁 [★★声望品衔9★★] [个人频道] [个人动态] 发送时间: 2025年02月13日 9:10:40 【回复】
本来AI就不具备推理能力。只是记忆储存越来越丰富,很快会远超人类大脑,最后还是会以天量储存战胜人类的推理能力。
   
[7楼]评论人:dhy1998 [★品衔R5★] [个人频道] [个人动态] 发送时间: 2025年02月13日 8:49:05 【回复】
就是一个新东方培训:贼先偷题…..
1   
[6楼]评论人:和平奖 [♂☆品衔R4☆♂] [个人频道] [个人动态] 发送时间: 2025年02月13日 8:42:56 【回复】
 回复1楼:最后是谷歌一骑绝尘,文章最后强调还是谷歌
1   
[5楼]评论人:dididada [品衔R2☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 8:41:40 【回复】
DeepSeek好像用的是7B压缩过的模型 这个只能当作参考
1   
[4楼]评论人:不错的心情 [布衣] [个人频道] [个人动态] 发送时间: 2025年02月13日 8:36:19 【回复】
非常有意思的是, 这篇文章的作者这们:Kaixuan Huang, Jiacheng Guo, Zihao Li, Xiang Ji, Jiawei Ge, Wenzhe Li, Yingqing Guo, Tianle Cai, Hui Yuan, Runzhe Wang, Yue Wu, Ming Yin, Shange Tang, Yangsibo Huang, Chi Jin, Xinyun Chen, Chiyuan Zhang, Mengdi Wang
好像都是中国人。
2   
[3楼]评论人:zlr [品衔R2☆] [个人频道] [个人动态] 发送时间: 2025年02月13日 8:35:05 【回复】
要先开源,反正你的研究就是,这么有利于你,你怎么研究。
   
[2楼]评论人:不错的心情 [布衣] [个人频道] [个人动态] 发送时间: 2025年02月13日 8:32:09 【回复】
这个不是DS的问题,是所有AI的问题,
AI的推理认识能力严重不足。
AI是靠不断地纠错记忆来解决问题,不是靠推理。
这就是他知道0.9比0.11大,但是又认为15.9小于15.11.
8   
[1楼]评论人:文学少年 [★★声望品衔10★★] [个人频道] [个人动态] 发送时间: 2025年02月13日 8:26:34 【回复】
标题党。全部AI都翻车了。不过也是好事,大家都有机会来完善。
10  1 1 

用户名:密码:[--注册ID--]


新闻评论原文:DeepSeek数学大翻车?谷歌锤爆LLM:做题不会推理(图)
本文热评:1评论:文学少年[★★声望品衔10★★] 02月13日 8:26:34 9赞 1踩 1评  》》》查看1楼点评详情
标题党。全部AI都翻车了。不过也是好事,大家都有机会来完善。
获赞最多的网友评论,将自动推送到留园神评妙论荟萃  



[ 留园首页 ] [ 留园条例 ] [ 广告服务 ] [ 联系我们 ]

Copyright (C) 6park.com All rights Reserved.