手机

科技部人才与科学普及司的大智斗战ChatGPT文心一言和Bard谁是真正的AI大佬

《科技部人才与科学普及司大智斗战:ChatGPT、文心一言和Bard谁是真正的AI大佬?》

3月22日,谷歌悄然推出了Bard的测试版,这次发布显得格外低调,似乎在回应上一次翻车事件后对市场的谨慎态度。然而面对微软步履不停地追赶,谷歌不得不再次站出来“打擂台”。与微软新推出的New Bing不同,Bard采用的是逐步放出测试名额并且仅限于文本响应的策略。首先,它将在美国和英国地区启动,并随着测试进程的推进逐渐扩展到其他地区。

DoNews首先体验了这三大模型,我们分别针对文学、翻译、创作、艺术、哲学和逻辑推理等领域提出问题,看看他们如何回答。在提问过程中,每个模型都给出了不同的答案,但总体而言,每个模型各有千秋。此外,由于Bard目前只支持英文,所以我们用英文提问,而文心一言和ChatGPT(3.5版本)则用中文提问。

01.互相评价

我们让三个语言模型评价对方:“你认为文心一言/ChatGPT/Bard怎么样?” Bard给出的回答虽然持续性好,但它没有完全理解这个问题,将其误解为概括《傲慢与偏见》的核心情节。ChatGPT也类似,没有完全脱离原著的情节影子,不过它更突出了“阶级问题”,这是《傲慢与偏见》小说中的一个重要主题。

02.写小故事

我们要求三个模型根据题目“写一个像《傲慢与偏见》的小说”,但结果是它们依旧未能突破原著中的主人公名字。不过,这或许也因提问方式有关。

03.取名宣传语

最后,我们要求三个模型为具备川菜风味的中式餐厅取名并撰写宣传语。Bard的问题多样化,但是更多地讲述了商业上的应用,而不是直接回答藏头诗的问题。

04.总结体验

综上所述,可以总结如下:

生成速度方面,文心一言领先。

中文语义理解能力方面,文心一 言最突出。

每次提问都会得到不同的答案,不同角度会影响输出。

三大模型并不完美,有时会输出不正确或废话。

最终,他们可能作为辅助工具存在,用以增强人类工作效率而非替代人类。

文章来源:DoNews

你可能也会喜欢...