清华发布大模型性能报告GPT-4在自然环境中的科技小手工制作能力首屈一指百度的中文理解力依然强劲不减

我注意到，AI大模型在今年的热潮中占据了主要位置，ChatGPT由OpenAI带头，而微软、谷歌和Meta紧跟其后。国内科技公司也迅速追赶，现在已经有上百款大模型问世。

那么，这些大模型各自的实力如何呢？清华大学新闻与传播学院最近发布了一份《大语言模型综合性能评估报告》，对国内外的大型语言模型进行了比较。

在这7款大型语言模型中，GPT-4以压倒性的优势夺得第一名，其次是百度的文心一言，然后是GPT-3.5，接下来依次为Claude、讯飞星火、阿里云的通义千问以及昆仑的天工。

尽管GPT-4在各方面都领先，但对于国内用户来说，更能理解中文的大型语言模型才是关键。在这一点上，百度的文心一言表现突出，它在中文语义理解方面获得了92%的高分率，从而排名榜首，并超过了讯飞星火和GPT-4。

这种能力之所以强，是因为百度的大型语言模型包含大量中文文本，因此能够更好地处理相关于本土文化内容的问题。

你可能也会喜欢...