科技部人才与科学普及司的大智斗战ChatGPT文心一言和Bard谁是真正的AI大佬

《科技部人才与科学普及司大智斗战：ChatGPT、文心一言和Bard谁是真正的AI大佬？》

3月22日，谷歌悄然推出了Bard的测试版，这次发布显得格外低调，似乎在回应上一次翻车事件后对市场的谨慎态度。然而面对微软步履不停地追赶，谷歌不得不再次站出来“打擂台”。与微软新推出的New Bing不同，Bard采用的是逐步放出测试名额并且仅限于文本响应的策略。首先，它将在美国和英国地区启动，并随着测试进程的推进逐渐扩展到其他地区。

DoNews首先体验了这三大模型，我们分别针对文学、翻译、创作、艺术、哲学和逻辑推理等领域提出问题，看看他们如何回答。在提问过程中，每个模型都给出了不同的答案，但总体而言，每个模型各有千秋。此外，由于Bard目前只支持英文，所以我们用英文提问，而文心一言和ChatGPT（3.5版本）则用中文提问。

01.互相评价

我们让三个语言模型评价对方：“你认为文心一言/ChatGPT/Bard怎么样？” Bard给出的回答虽然持续性好，但它没有完全理解这个问题，将其误解为概括《傲慢与偏见》的核心情节。ChatGPT也类似，没有完全脱离原著的情节影子，不过它更突出了“阶级问题”，这是《傲慢与偏见》小说中的一个重要主题。

02.写小故事

我们要求三个模型根据题目“写一个像《傲慢与偏见》的小说”，但结果是它们依旧未能突破原著中的主人公名字。不过，这或许也因提问方式有关。

03.取名宣传语

最后，我们要求三个模型为具备川菜风味的中式餐厅取名并撰写宣传语。Bard的问题多样化，但是更多地讲述了商业上的应用，而不是直接回答藏头诗的问题。

04.总结体验

综上所述，可以总结如下：

生成速度方面，文心一言领先。

中文语义理解能力方面，文心一言最突出。

每次提问都会得到不同的答案，不同角度会影响输出。

三大模型并不完美，有时会输出不正确或废话。

最终，他们可能作为辅助工具存在，用以增强人类工作效率而非替代人类。

文章来源：DoNews

你可能也会喜欢...

肆意人生路小说 - 逃离平凡的梦想之旅

数字图像处理技术在现代学术研究中的应用与展望

破案风云录我凭此冠绝京华