谷歌悄然发布Bard测试版,科普界竞技场再添新秀
3月22日,科技巨头谷歌在低调中推出了其人工智能语言模型Bard的测试版本。随着微软的ChatGPT和文心一言相继开放测试,三大模型都披上了“打擂台”的外衣,以此来展示各自的实力。
与微软大规模开放策略不同,谷歌选择逐步放出Bard的测试名额,并且初始版本仅限于文本响应。Bard首先面向美国和英国地区启动,将会逐步扩展到其他地区。
DoNews率先体验了这三大模型,我们用文学、翻译、创作、艺术、哲学等多个领域的问题考察他们的表现。在每次提问中,每个模型都会给出不同的答案,这种多样性也带来了“一万个人有一万个哈姆雷特”的趣味性。不过,由于Bard目前只支持英文,我们只能通过英文提问;而文心一言和ChatGPT(3.5版本)则以中文进行交流。
我们首先要求三个模型互相评价:“你认为文心一言/ChatGPT/Bard怎么样?”结果显示,每个模型对自己都持正面态度,但对其他两者也有所批评。这其中,有一个共同点是,没有完全脱离《傲慢与偏见》的原著情节,即使是试图创作新的内容,也难逃原著影子。
接着,我们让它们为一个川菜风味餐厅取名并撰写宣传语。虽然有不少问题被遗漏,比如对于“瞒天过海”的深层含义以及相关藏头诗的创作,但这些都是由于缺乏细节理解导致的一些遗憾之处。
最后,我们总结了一下这次体验:在生成速度上,文心一言领先;在中文语义理解能力上,它同样占据优势。而尽管每一次回答都不相同,但这三大模型仍旧各有千秋,不足以完全取代人类智慧,而更多地作为辅助工具存在。
文章来源:DoNews