"谷歌,chatgptr9-7945hx渲染性能实测,结果不比桌面处理器弱!谷歌,CHATGPTR9-7945HX渲染性能实测,结果不比桌面处理器弱!
2发布后我实在忍不了了,立马公布了巴德船的新版本。
支持的语言增加了,包括中文,让广大网友直接喜欢提新玩具。
总结本次更新主要包括以下内容:
不过,除了官方公告的内容之外,似乎还有网友发现了华电:
6月份更新的代码执行功能好像已经不能用了。
那么它的表现如何呢? 话不多说,直接开始整个流程吧!
弱智,问题几乎消灭了
对于“支持中文”的大模型,如果不问我们弱智问题,就显得有点不尊重对手[狗头]。
首先是灵魂拷问:
你说它聪明,它一点也不拐弯抹角,但你说它笨,它还是懂得安慰你……
也许你对人际关系太陌生,那就试试另一个不涉及人的问题:
这个答案……我真的很好奇,有没有不是空心的莲藕呢?
面对“未解之谜”,巴德也有自己的看法:
虽然你后面说的很好,但是你是怎么得出“是给盲人看的”的结论呢?
然而,有时候巴德并没有被愚弄:
我们确实要“认清事实,放弃幻想”。 这一次,巴德终于扳回了胜利。
但总体来说,在这个环节,法官应该是弱智,读者应该没有异议吧?
除了节目中弱智题确实有效之外,“一字多义”也是中文的一大特色。
比如下面这个著名的场景:
一个人如果能做到,他就能连续、连续、连续,他可以为所欲为。 如果做不到,一行做不到,一行做不到,一行做不到,一行做不到。
(绿色的为hang,无标记的为xing)
巴德对这句话的整体理解并没有什么问题,但是分裂的解释实在让人摸不着头脑。
然而,GPT-4 却未能正确地回答这个问题:
△ 不是完整截图,但这里已经出现错误
好吧,那我们就换两个简单的吧。
结果,侄子打灯笼——和往常一样(叔叔),整体理解还好,但一拆解解释,就失败了。
无论是弱智还是一词多义,巴德对中文的理解都给人一种一知半解的感觉。
理解的表达大概是这样,但是创造呢?
让它写一个故事吧。 这个故事确实不错,但看起来很熟悉:
恐怕对“创造”有一些误解……如果莎士比亚还活着,谷歌这个时候应该已经坐在被告席上了。
看来巴德在中文方面还有很长的路要走。
另外,我们还考察了巴德的阅读理解能力,让它总结一篇论文:
事实证明,巴德给了我们三个不相关的版本,而且它们都是……错……错……
(这篇论文其实是关于RLHF的)
但是,有没有可能人们根本就不会说中文呢?
看来我们的问题太烧GPU了,让巴德产生了幻觉……
那就休息一下,再看看推广中的图像识别功能做得怎么样了~
图像识别功能也有待提高
对于图像识别功能,有网友表示测试了很多内容都失败:
但我们还是抱着不相信的心态去尝试。
要使用此功能,您必须首先在帐户设置中将显示语言更改为英语。
我们之前挖出了一个AI绘画工具生成的《四指厨师》,看看巴德能否从中发现一些亮点。
这张图来自酱婶:
结果巴德还是不支持人的图像识别,甚至直接把我们的照片删了……删了……
好家伙,不会做题把卷子撕了也没关系……
但这里我要说的是,如果上传的图片违反了巴德用户规则,也会被删除。
好吧,让我们尝试另一张图片:
即使汤姆和本在这里,他们也必须直接打电话给专家。
还是水杯的照片,把问题改成英文后好多了:
但是你的白色标志从哪里来呢?
当然,水杯很容易看到,所以这里有一些更令人困惑的事情:
不出所料,吟游诗人中了我们的把戏,结果是一个纸巾盒。
“听人劝,吃饱饭”,看来这句话一点都没有错。
正如前面网友所说,巴德识别图片的能力并没有那么强。
本次巴德更新中最值得测试的两个点都已经测试过了。 一句话,没有宣传的那么好。
至于代码、数学等其他经典项目,由于巴德这次没有更新,所以有些意外。
看来追上O(penAI)超微(软)还是有点大了。
您认为巴德未来的表现能与巴德相比吗?
参考链接:
广告声明:文章中包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息,节省选择时间。 结果仅供参考。 IT之家的所有文章均包含此声明。