谷歌悄然发布Bard测试版,试图与微软的ChatGPT抗衡
3月22日,谷歌推出了Bard的测试版本,这一举动被视为对微软ChatGPT的直接回应。自从ChatGPT公布后,全球范围内都在关注这三大语言模型之间的竞争。现在,它们各自都开放了测试,让我们来探索它们在文学、翻译、创作和其他领域中的表现。
首先,我们尝试用三个不同的方向出题:文学、翻译、创作等,并观察他们如何回答。由于每次生成答案都是独一无二的,所以有“千人千面”的感觉,但总体来说,每个模型都有其独特之处。此外,由于Bard目前仅支持英文,我们使用英文提问,而文心一言和ChatGPT(3.5版本)则使用中文。
互相评价
我们询问这些模型对对方进行评价:“你认为文心一言/ChatGPT/Bard怎么样?”结果显示,尽管Bard能维持正常对话,但它没有完全理解这个问题,并将其解释为概括《傲慢与偏见》的核心情节。而ChatGPT虽然也类似,没有完全脱离原著,但是它更突出了《傲慢与偏见》中重要的主题——阶级问题。
写一个小故事
接下来,我们要求它们写一个类似《傲慢与偏见》的小说的大纲。这一次,Bard依旧未能超越原著的情节,而ChatGPT则提炼到了小说中非常重要的问题,即“阶级问题”。不过,这些挑战似乎也让他们不得不再次回到原著的情节框架之中。
取名和宣传语
最后,我们请求它们为具备川菜风味的中式餐厅命名并撰写宣传语。不过,对于“瞒天过海”这一点,Bard的问题较多,它解释了商业应用上的意义而非藏头诗。但是,其余两者对于这个任务表达得更为简洁明了。
综上所述,可以总结出以下几点:
在速度方面,文心一言领先。
文心一言在中文语义理解能力上表现突出。
每次生成答案都不相同,因此会受到提问方式影响。
三大模型并不总是提供正确或充分正确答案,有时输出内容可能是一本正经废话。
然而,就像它们最后关于是否会取代人类的问题一样,他们更多地被看作辅助工具而存在。本篇文章由DoNews提供。