我注意到,AI大模型在今年的热潮中占据了主要位置,ChatGPT由OpenAI带头,而微软、谷歌和Meta紧跟其后。国内科技公司也迅速追赶,现在已经有上百款大模型问世。
那么,这些大模型各自的实力如何呢?清华大学新闻与传播学院最近发布了一份《大语言模型综合性能评估报告》,对国内外的大型语言模型进行了比较。
在这7款大型语言模型中,GPT-4以压倒性的优势夺得第一名,其次是百度的文心一言,然后是GPT-3.5,接下来依次为Claude、讯飞星火、阿里云的通义千问以及昆仑的天工。
尽管GPT-4在各方面都领先,但对于国内用户来说,更能理解中文的大型语言模型才是关键。在这一点上,百度的文心一言表现突出,它在中文语义理解方面获得了92%的高分率,从而排名榜首,并超过了讯飞星火和GPT-4。
这种能力之所以强,是因为百度的大型语言模型包含大量中文文本,因此能够更好地处理相关于本土文化内容的问题。