谷歌悄然发布Bard测试版,试图在AI大战中找回领先地位
3月22日,谷歌在低调中推出了Bard的测试版本。自微软的ChatGPT成功上市后,谷歌似乎意识到了必须在AI领域站出来与之竞争。然而,与新 Bing 的开放策略不同,Bard的测试名额将会逐步释放,同时初始版本仅限于文本响应。目前,该模型首先面向美国和英国用户,并计划随着测试进展而扩展至其他地区。
DoNews 在三大模型公开测试后进行了尝试性体验,我们分别从文学、翻译、创作、艺术、哲学和逻辑推理等方面提出问题,以评估它们的表现。在提问时,每个模型都有多种回答,这种多样性也许是他们最独特的特点,但总体来说,它们各有千秋。此外,由于Bard当前只支持英文,我们使用英文提问;而文心一言和ChatGPT(3.5版本)则使用中文。
互相评价
我们要求三个语言模型对“你认为文心一言/ChatGPT/Bard怎么样?”这句话做出评价。
对于这个问题,Bard似乎没有理解限定词“写一篇类似《傲慢与偏见》的小说”,因此它给出的答案仍然是概括《傲慢与偏见》的核心情节,而不是按照题目要求创作新的故事。
同样地,没有完全脱离原著的情节线索,但ChatGPT抓住了《傲慢与偏见》中的一个重要主题,即“阶级问题”。
写小吃餐厅宣传语
我们让三个模型为具有川菜风味的中式餐厅命名并撰写宣传语。
不过,对于这个请求,Bard的问题更多地围绕商业上的应用,如如何通过巧妙营销隐藏产品缺陷或不足,而非直接提供相关建议或者创意性的宣传语。
总结体验
总结起来,可以看到:
文心一言在生成速度上占据优势,在300-500字范围内可以迅速完成任务,而ChatGPT需要更长时间来生成相同数量文字。
文心一言在中文语义理解能力方面表现突出。
尽管每次提问都会得到不同的回答,但这些回答反映了每个模型独有的特点以及它们处理信息的一般方式。
虽然三大语言模型可能无法提供完美无瑕或绝对正确的答案,有时候输出也会是一段毫无意义的话,但它们作为辅助工具存在着其价值。在最后被问及是否能取代人类时,它们共同的声音也是如此:作为工具存在,是为了帮助人们工作,不是要替代他们。