《大评测!ChatGPT、文心一言和Bard谁更强?》
3月22日,谷歌悄然推出Bard的测试版,试图在与微软的竞争中找到立足点。不同于New Bing的大规模开放策略,Bard的测试名额将逐步释放,其初始版本仅支持文本响应。首先面向美国和英国地区启动,将随着测试进展扩至其他地区。
DoNews率先体验了三大模型,并对文学、翻译、创作、艺术、哲学和逻辑推理等领域提出问题,以探究他们回答的情况。由于每次生成答案都有所不同,我们尝试从不同的角度来看待这三个语言模型。
01.互相评价
我们要求它们就“你认为文心一言/ChatGPT/Bard怎么样”这一问题给出评价。Bard似乎未能完全理解这个限定词,只能提供类似《傲慢与偏见》的概要,而ChatGPT则提炼出了核心要点,即“阶级问题”。尽管三者都未能突破原著中的主人公名字,但ChatGPT稍显接近。
03.取个名字,写个宣传语
我们为川菜风味中式餐厅命名并撰写宣传语,但Bard的问题多虑商业应用,对藏头诗则不去涉及。
总结体验后,我们发现:
文心一言在生成速度上领先。
在中文语义理解能力上,文心一言尤其突出。
但每次提问都会得到不同的答案,不同方式会影响输出。
三大模型也可能输出并不完全正确或是“废话”。
最后,他们如同辅助工具存在,用以回答是否会取代人类的问题时,他们确实只是辅助工具而已。本篇文章由DoNews提供信息。