谷歌Gemini“悄悄变强” 中文更是完成了超越!(组图)
新闻来源: 华尔街见闻 于2024-05-31 11:50:56 提示:新闻观点不代表本网立场
尽管亮相时被OpenAI压了一头,但谷歌一直在悄悄迭代Gemini大模型,和OpenAI最新大模型GPT-4o的差距已经显著缩小。最新测试结果显示,Gemini 1.5 Pro/Advanced在综合测试中排名第 2,逼近GPT-4o,轻量版Gemini 1.5 flash排名第9,超越 Llama-3-70b,接近GPT-4。相比4月份的版本,Gemini Pro和Flash的能力有明显加强。且上下文长度可以达到100万token,远远超出GPT-4的12.8万token。
![](https://web.popo8.com/202405/31/14/d6803f09c2type_png_size_640_127_end.jpg)
Gemini的中文能力更是惊艳,在中文测试中,Gemini Pro和Advanced双双超越GPT-4o,分别排在第一、第二位。
![](https://web.popo8.com/202405/31/10/62a3ededf0type_png_size_640_114_end.jpg)
此外,在Hard Prompts测试中,Gemini同样名列前茅。在Hard Prompts测试中,大模型需要面对那些更具挑战性的问题,Gemini 1.5 Pro在这一测试中排名第二,仅次于GPT-4o.
![](https://web.popo8.com/202405/31/7/d2e8d4935ctype_png_size_640_117_end.jpg)
从大模型置信区间(Confidence Intervals)来看,Gemini的测试结果也名列前茅。
![](https://web.popo8.com/202405/31/16/999bdf5f79type_png_size_640_135_end.jpg)
值得一提的是,两周前,在Google Gemini更新撞档GPT-4o发布时。Gemini因为羸弱的能力几乎引来了群嘲。根据多家科技博客的测评,即使谷歌已经对1.5 Pro进行了数月的改进,但从常识推理到多模态能力和代码能力,仍然无法与OpenAI最新的GPT-4o模型相媲美。唯一亮点就是更大的上下文窗口。
如今谷歌Gemini取得了如此神速的进步,显示出AI界届黄埔军校仍然有深厚的技术底蕴。
![](https://web.popo8.com/202405/31/14/d6803f09c2type_png_size_640_127_end.jpg)
Gemini的中文能力更是惊艳,在中文测试中,Gemini Pro和Advanced双双超越GPT-4o,分别排在第一、第二位。
![](https://web.popo8.com/202405/31/10/62a3ededf0type_png_size_640_114_end.jpg)
此外,在Hard Prompts测试中,Gemini同样名列前茅。在Hard Prompts测试中,大模型需要面对那些更具挑战性的问题,Gemini 1.5 Pro在这一测试中排名第二,仅次于GPT-4o.
![](https://web.popo8.com/202405/31/7/d2e8d4935ctype_png_size_640_117_end.jpg)
从大模型置信区间(Confidence Intervals)来看,Gemini的测试结果也名列前茅。
![](https://web.popo8.com/202405/31/16/999bdf5f79type_png_size_640_135_end.jpg)
值得一提的是,两周前,在Google Gemini更新撞档GPT-4o发布时。Gemini因为羸弱的能力几乎引来了群嘲。根据多家科技博客的测评,即使谷歌已经对1.5 Pro进行了数月的改进,但从常识推理到多模态能力和代码能力,仍然无法与OpenAI最新的GPT-4o模型相媲美。唯一亮点就是更大的上下文窗口。
如今谷歌Gemini取得了如此神速的进步,显示出AI界届黄埔军校仍然有深厚的技术底蕴。
网编:和评 |
|
7 条 | |||
|
|||||
敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。 | |||||
【科技频道】【宠物情缘】