《科技强国智慧大比拼:ChatGPT、文心一言与Bard谁更上乘?》
3月22日,谷歌悄然推出了Bard的测试版,这次它显得更加低调,但面对微软的紧追不舍,谷歌不得不再次“出山”。与New Bing的大门洞开不同,Bard的测试名额将逐步释放,同时初始版本仅限于文本响应。谷歌表示,首先在美国和英国地区启动,并计划随着测试推进逐步扩展至其他地区。
DoNews率先体验了三大模型,对文学、翻译、创作、艺术、哲学和逻辑推理等领域提出问题,看看他们如何回答。由于每个模型生成答案时都有所不同,每个问题可能会得到无数不同的解答,就像“一万个人有一万个哈姆雷特”。
01.互相评价
让三个模型分别回答“你认为文心一言/ChatGPT/Bard怎么样?”的问题。这是它们对彼此能力的一种自我评估。
结果显示,不同程度上,它们各有优劣。Bard虽然没有理解题目限制,但仍能概括《傲慢与偏见》的核心情节;ChatGPT则提炼出原著中重要的阶级问题主题。而这三大模型在故事主人公名字选择上,都未能超越原著中的角色名称。
03.取名并写宣传语
给三个模型一个任务:为川菜风味的中式餐厅命名并撰写宣传语。
尽管存在一些差异,如商业应用上的讨论或藏头诗缺失,但每个模型都尝试提供了自己的解决方案。
04.总结体验
从生成速度来看,文心一言领先,其300-500字内容生成时间仅需14秒,而ChatGPT至少需要30秒以上。此外,用过Bard的人普遍觉得其体验感较弱。
在中文语义理解方面,文心一言表现突出。但每次问答都会产生不同的答案,使得使用者必须根据具体情况调整提问方式和限定词以获得满意答案。
05.结论
最后,在面对是否会取代人类的问题时,这些语言模型表达了作为辅助工具而存在的态度。它们并非完全准确,也常常输出冗长或不相关信息。不过,即便如此,它们依旧成为了我们生活中不可或缺的一部分。
文章源自DoNews