谷歌悄然发布Bard测试版,科技界再次掀起波澜
3月22日,谷歌在低调中推出了Bard的测试版本。自微软的ChatGPT成功上线后,谷歌不得不紧跟而出,以此来与竞争对手展开较量。在与New Bing不同的大规模开放策略下,Bard将通过逐步放出测试名额,并且初始版本将仅限于文本响应。首先面向美国和英国市场启动,其余地区随着测试进程的推进相继开放。
DoNews作为第一家试用者,对三大模型——Bard、ChatGPT(3.5版本)和文心一言进行了全面比较,我们分别在文学、翻译、创作、艺术、哲学和逻辑推理等领域提出问题,看看他们如何回答。
由于每次答案都有所不同,每个人的体验也就像《哈姆雷特》中的多种解读,但总体来说,每个模型各有千秋。值得注意的是,由于Bard目前仅支持英文,我们的问题是以英文提问,而文心一言和ChatGPT则使用中文。
01.互相评价
我们询问三个语言模型对彼此进行评价:“你认为文心一言/ChatGPT/Bard怎么样?”结果显示:
Bard虽然持续度正常,但未能理解限定词“写一篇类似《傲慢与偏见》的小说”,提供的大纲依旧基于《傲满与偏见》的情节。
ChatGPT没有完全脱离原著影子,但提炼到了核心要点,即“阶级问题”,也是小说主旨之一。
文心一言同样无法突破原著主人公名字,不过可能与提问方式有关。
03.取名并写宣传语
小编要求三个大模型为具有川菜风味的中式餐厅命名并撰写宣传语。不过,Bard的问题较多,它解释了“瞒天过海”的意思,并讨论了商业应用,但关于藏头诗则忽略了。
总结:
在生成速度方面,文心一言领先,其300-500字输出需14秒,而ChatGPT至少30秒。
在中文语义理解能力上,文心一言最为突出。
但每次答案都不相同,与提问方式及限定词相关。此外,不全正确或是“正经废话”也会出现。这三大模型似乎更适合作为辅助工具存在。