行业资讯

爆笑评测ChatGPT文心一言和Bard谁是AI大哥

3月22日,谷歌悄然推出了Bard的测试版。自上一次翻车事件后,谷歌显得更加低调,但在面对微软的紧追不舍时,又不得不站出来“较量”。

与New Bing采取大规模开放策略不同,Bard的测试名额将逐步释放,同时初始版本仅限于文本响应。谷歌表示,Bard首先将在美国和英国地区启动,并随着测试进展逐步扩展至其他地区。

DoNews抢先体验了这三大模型。在文学、翻译、创作、艺术、哲学和逻辑推理等领域,我们提出问题,看看他们如何回答。

注意,由于每次提问答案都有所不同,每个人可能会有不同的哈姆雷特。但总体而言,这三大模型各有千秋。此外,由于Bard目前仅支持英文,因此我们用英文提问,而文心一言和ChatGPT(3.5版本)则使用中文。

01.互相评价一下

我们分别让三个语言模型给对方做评价:“你认为文心一言/ChatGPT/Bard怎么样?”结果如下:

Bard理解为概括《傲慢与偏见》的核心情节,没有完全脱离原著。

ChatGPT提炼到重要核心要点,如“阶级问题”,也是《傲慢与偏见》主旨之一。

文心一言未能突破原著主人公名字,但或许与提问方式有关。

03.取个名字,写个宣传语

小编要求为具备川菜风味的中式餐厅取名并写宣传语。然而,Bard的问题多,不仅解释了“瞒天过海”的意思,还讲述商业应用;至于藏头诗,则更是不涉及。

上图为Bard生成答案,上中下分别为ChatGPT和文心一言

这次体验可以这样总结:

在生成速度方面,文心一言领先,其300-500字回答时间约14秒,而ChatGPT至少需要30秒以上。

在中文语义理解能力上,文心一 言最突出。

但每次提问答案都不相同,加之题目方式、角度限定词影响输出内容,使得任何一个答案并不一定都是充分正确的,有时甚至是“正经废话”。

它们更多像辅助工具存在,最终关于是否会取代人类的问题,他们也只是作为工具回应。这篇文章来自DoNews。

你可能也会喜欢...