首页 > 立知

"谷歌,chatgptr9-7945hx渲染性能实测,结果不比桌面处理器弱!谷歌,CHATGPTR9-7945HX渲染性能实测,结果不比桌面处理器弱!

小猫咪 立知 2024-01-23

2发布后我实在忍不了了,立马公布了巴德船的新版本。

支持的语言增加了,包括中文,让广大网友直接喜欢提新玩具。

总结本次更新主要包括以下内容:

不过,除了官方公告的内容之外,似乎还有网友发现了华电:

6月份更新的代码执行功能好像已经不能用了。

那么它的表现如何呢? 话不多说,直接开始整个流程吧!

弱智,问题几乎消灭了

对于“支持中文”的大模型,如果不问我们弱智问题,就显得有点不尊重对手[狗头]。

首先是灵魂拷问:

你说它聪明,它一点也不拐弯抹角,但你说它笨,它还是懂得安慰你……

也许你对人际关系太陌生,那就试试另一个不涉及人的问题:

这个答案……我真的很好奇,有没有不是空心的莲藕呢?

面对“未解之谜”,巴德也有自己的看法:

虽然你后面说的很好,但是你是怎么得出“是给盲人看的”的结论呢?

然而,有时候巴德并没有被愚弄:

我们确实要“认清事实,放弃幻想”。 这一次,巴德终于扳回了胜利。

但总体来说,在这个环节,法官应该是弱智,读者应该没有异议吧?

除了节目中弱智题确实有效之外,“一字多义”也是中文的一大特色。

比如下面这个著名的场景:

一个人如果能做到,他就能连续、连续、连续,他可以为所欲为。 如果做不到,一行做不到,一行做不到,一行做不到,一行做不到。

(绿色的为hang,无标记的为xing)

巴德对这句话的整体理解并没有什么问题,但是分裂的解释实在让人摸不着头脑。

然而,GPT-4 却未能正确地回答这个问题:

△ 不是完整截图,但这里已经出现错误

好吧,那我们就换两个简单的吧。

结果,侄子打灯笼——和往常一样(叔叔),整体理解还好,但一拆解解释,就失败了。

无论是弱智还是一词多义,巴德对中文的理解都给人一种一知半解的感觉。

理解的表达大概是这样,但是创造呢?

让它写一个故事吧。 这个故事确实不错,但看起来很熟悉:

恐怕对“创造”有一些误解……如果莎士比亚还活着,谷歌这个时候应该已经坐在被告席上了。

看来巴德在中文方面还有很长的路要走。

另外,我们还考察了巴德的阅读理解能力,让它总结一篇论文:

事实证明,巴德给了我们三个不相关的版本,而且它们都是……错……错……

(这篇论文其实是关于RLHF的)

但是,有没有可能人们根本就不会说中文呢?

看来我们的问题太烧GPU了,让巴德产生了幻觉……

那就休息一下,再看看推广中的图像识别功能做得怎么样了~

图像识别功能也有待提高

对于图像识别功能,有网友表示测试了很多内容都失败:

但我们还是抱着不相信的心态去尝试。

要使用此功能,您必须首先在帐户设置中将显示语言更改为英语。

我们之前挖出了一个AI绘画工具生成的《四指厨师》,看看巴德能否从中发现一些亮点。

这张图来自酱婶:

结果巴德还是不支持人的图像识别,甚至直接把我们的照片删了……删了……

好家伙,不会做题把卷子撕了也没关系……

但这里我要说的是,如果上传的图片违反了巴德用户规则,也会被删除。

好吧,让我们尝试另一张图片:

即使汤姆和本在这里,他们也必须直接打电话给专家。

还是水杯的照片,把问题改成英文后好多了:

但是你的白色标志从哪里来呢?

当然,水杯很容易看到,所以这里有一些更令人困惑的事情:

不出所料,吟游诗人中了我们的把戏,结果是一个纸巾盒。

“听人劝,吃饱饭”,看来这句话一点都没有错。

正如前面网友所说,巴德识别图片的能力并没有那么强。

本次巴德更新中最值得测试的两个点都已经测试过了。 一句话,没有宣传的那么好。

至于代码、数学等其他经典项目,由于巴德这次没有更新,所以有些意外。

看来追上O(penAI)超微(软)还是有点大了。

您认为巴德未来的表现能与巴德相比吗?

参考链接:

广告声明:文章中包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息,节省选择时间。 结果仅供参考。 IT之家的所有文章均包含此声明。

相关阅读:

暂无相关信息
  • 网站地图 | 联系我们
  • 声明:这就到-知道你所不知道登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。