昨天问了DeepSeek一个问题回答的没有chatGPT清楚准确!
None of these results are from deepseek.
the peom is most likely from ChatGPT or wenxin earlier versions.
不但deepseek 会说胡话,chatgpt也会,这也显示AI在实际运用中的不足,但不知道AI在克服这些缺陷后会不会成为灾难,它会看病,医生不需要了,它会写作文,作家不需要了,它会替小朋友做数学题,老师也不需要了
所以虽然必应AI用的也是GTP但是给你一个更严谨还是更有创造性的选项。另外,DeepSeek的创造性太激进了。我只是让他给我检查一下写的一段外语有没有错误,他直接过我重写了,还带标题和章节的。
孩子做作业查文献资料,发现chatGPT提供的所谓文献大部分都是虚构的......所以啊,找AI的做事要留一个心眼,不能全信。之前老师就告诉过,连维基词典的东西都是不能做为参考文献的,因为都不权威,都是人为编纂上去的(特别是台巴子把持的中文维基,胡说八道的更多)。
AI要拟人自然就会犯错,现在的这些霉国OpenAI、ChatGPT乏国Lucie、中国DeepSeek都是复制资料搜寻组合给出答案,若是只要正确答案那就是以前的搜索引擎。
从瞎掰犯错这点上看乏国Lucie才是最拟人的AI:
当被问及“牛蛋”时,Lucie竟回答称“牛蛋,也被称为鸡蛋,是由牛生产的可食用蛋,富含蛋白质和营养”。此外,在进行简单的数学运算时,如计算5乘以(3+2),Lucie给出的答案是错误的17,而非正确的25。更有甚者,Lucie还声称“山羊的平方根是1”。
就像1450網軍故意測試DeepSeek 時、一直用同一個錯誤的方式引導逼迫好幾次、
最後DeepSeek 給出1450詐騙蛆想要的答案、
之後1450詐騙蛆就歡欣喜慶的把這些放在網上撒謊說:看,DeepSeek
給錯誤的答案、Blablabla,
無耻!
来自留园官方客户端
我操,你们好歹还给了个答案,我问了5个问题,都是服务器繁忙,稍后再试。
这不就是人类的本性吗?不知道就乱扯哈拉一下,说明A l已经开始接近人类的思维了。
实际用一下就知道,什么是真,什么是假,幻觉率本身就是存在幻觉。 实际使用过程中, chatgpt/deepseek几乎每个答案都有扯淡的部分。
记住,他们是和人脑完全不同的智能思维模式,我也不知道他们到底会帮助人类还是毁灭人类
自从usaid关了,坛子里的狗粮少了很多啊,估计现在吃屎也吃不着了。
这里类似一个人只从网上得到信息,他自然不可能知道那些是真哪些是假
不管是那一個LLM都還不能全面取代人類。引用文章上,作者本來就應該多上心,不僅是正確性也包括適當性,在同樣相似內容的文獻裡選最適合的。AI 還有不少路要走。但是一定可以超越。雖然原理上未必是今天的AI。
chatgpt在文獻引用上也是問題多多,特別是chapgpt4版本。但chatgpto1就好很多,新的deep search看起來也很好。deepseek 用的是unsupervised learning.chatgpt很大程度上依靠supervised learning,後者成本高而且思維發散性就比較差。前者至少在機器學習的早期準確性會差。不奇怪。
回复14楼:留園五毛幹你娘又不想負責,想走旱路,由於準確率低還是走了水路,造了一個你。
我問D S要開天天眼必須有什麼先缺條決,它回答七天七夜不睡覺就可以了
哎,这一看就是不懂AI原理的人写的东西。。。 目前AI的本质上的行为,还是一个定位搜索出来的结果, 只不过通过LLM模型构建了一个认知知识空间,然后通过问题的解析,在这个认知知识空间内找出一个信息链是最匹配问题的,最后把这个信息链给处理包装一下反馈给用户。
这里就有很多可能发生问题的地方:
1. 问题解析出了偏差,最后结果肯定有偏差
2. 认知知识空间内的信息本身不全或者有误,导致结果不尽人意
3. 事实上AI提供的结果应该提供一个信心指数给用户,表示我这个结果是很有把握的,同时要对认知空间内的信息也要标识一个可信度, 这样用户大概知道说哦,这个答案值得自己采用或者要进一步核对。
4. AI必须提供一个结果大多数情况下,幻觉产生就不稀奇了,就好像办案人把嫌犯屈打成招,一定要提供供词。。。
用过AI的都知道这是人工智障通病
只有狗粮在high
哈哈哈,ChatGPT 还不是满嘴跑火车.. 算数都算不明白…
DeepSeek也不是什么都敢编的😁
![](https://www.popo8.com/host/data/202502/13/10/7cfff44_type_3_size_800_94_end.jpg_b.jpg)
来自
6parkbbs.com留园手机网页版
ChatGPT是一个极具极左和政治正确的模型。对性别,同性恋,多元性别的回答都极为挑战普通人的认知底线。
希望DeepSeek不要染上这个偏见,保持人类社会认知的基本底线。
回复22楼:所以在chatgpt基础蒸馏出来的东西怎么可能正确呢
很多数据已经ChatGPT污染了。早就发现ChatGPT伪造数据甚至网络链接。
诈骗岛有全球下载排名前100的app吗?让我们也学习一下
造假群体搞出来的玩意自然造假,老习,64都不知道,造假有啥奇怪。
DeepSeek的致命伤——说假话。……墙国属性😂
查了一下 Vectara's HHEM 2.1 chatgpt的成绩
chatgpt 3.5 是 1.9%
chatgpt 4 是 1.8%
用deepseek 查了一下《苦昼短》的作者,下面是查询结果:《苦昼短》的作者是**李贺**。李贺,字长吉,是“长吉体”诗歌的开创者,有“诗鬼”之称。他的诗作想象极为丰富,经常应用神话传说来托古寓今,所以后人常称他为“鬼才”,“诗鬼”。《苦昼短》是李贺的一首诗作,表达了诗人对人生苦短的感慨和对神仙长生的怀疑。
其实这真没什么,本来你丫写的文章就是你自己学习的过程,自己想偷懒造假,结果被一个更狠的玩了而已。再说ds最近太火了,以至于大家都忽略了这本来就是一个小成本制作。能有如此成绩是很不错了。可是却并不是完美的。而且很多人都忽略了ds只是性价比高而已,并不是真的最牛逼,最牛逼还是chatgpt。毕竟那是真金白银堆出来的。其实有这些声音也是好的,让大家降降温,认清一下自己的位置。然后继续默默努力让这个新生的软件越来越好才对。过度的吹捧没好处
来自留园官方客户端
Deepseek R1相对于 前代V3 三倍左右得错误率,不知道是不是成本优化的结果。拼多多化的降本增效总是有后遗症的。只是取舍的问题。
你们就相信DS是胡说八道。千万别用,千万只用ChatGPT最低版。
回复5楼:狗子们到底开了多少个马甲。咋这么喜欢开马甲的?蛆们都见不得光的?
DeepSeek也是和中央保持一致。立志于胡说八道,指鼠头为鸭脖。刺激粉红五毛兴奋点。
这并不是DeepSeek一家的毛病。去年8月,总部位于纽约的人工智能初创公司和机器学习监控平台Arthur AI就曾发布报告,比较了OpenAI、“元宇宙”Meta、Anthropic以及Cohere公司开发的大语言模型出现幻觉的概率。研究报告显示:这些大模型都会产生幻觉。
大洋彼岸最厉害的ChatGPT,也和DeepSeek一样“满嘴跑火车”。