谷歌悄然发布Bard测试版,科技界再次掀起波澜
3月22日,谷歌在低调中推出了Bard的测试版本。自微软的ChatGPT成功上线后,谷歌并未放弃竞争,它们意识到必须立即行动,以免被抛在技术发展的后面。与微软新推出的New Bing不同,Bard采用了更加谨慎的策略,将测试名额逐步开放,并且仅提供文本响应功能。在美国和英国首先启动之后,随着测试进展,Bard将扩展到其他地区。
DoNews作为第一批体验者,对这三大模型——ChatGPT、文心一言和Bard进行了深入探测。我们从文学、翻译、创作、艺术、哲学和逻辑推理等多个领域提出问题,看看他们如何回答。
由于每次提问都有不同的答案,我们发现“一万个人有一万个哈姆雷特”。不过,从总体上来看,每个模型都有其独到的优势。
由于目前Bard仅支持英文,我们以英文提问;而对于文心一言和ChatGPT(3.5版本),我们使用中文提问。
互相评价
我们让三个模型对彼此进行评价:“你认为文心一言/ChatGPT/Bard怎么样?” Bard虽然保持了正常对话,但似乎没有理解限定词“写一篇类似《傲慢与偏见》的小说”,因此它给出的大纲依旧是按照《傲慢与偏见》的情节来构建。而ChatGPT也没有完全脱离原著的情节,但它提炼出了核心要点,即“阶级问题”,这是《傲满与偏见》小说主旨之一。
取名及宣传语
小编要求三个模型为具备川菜风味的中式餐厅命名并撰写宣传语。不过,Bard的问题较多,它解释了“瞒天过海”的意思,但更多地讨论商业应用,而不是创造性的藏头诗。这使得我们的任务变得更加复杂,上图为Bard,大图为ChatGPT,小图为文心一言。
综上所述,可以总结如下:
在生成速度方面,文心一言远超出聊天机器人,其300-500字内容生成时间约14秒,而ChatGPT则需要超过30秒。
在中文语义理解能力方面,文心一言表现突出。
然而,每一次询问都会得到不同的答案,这取决于问题方式、角度以及限定词。此外,这些模型并不总是能提供完美正确或充分准确的信息,有时输出的是不完全正确或纯粹废话。
尽管如此,在回答是否会取代人类的问题时,他们更像是一种辅助工具存在而非替代品。本文章来源于DoNews