科技

清华发布大模型性能报告GPT-4首次亮相更懂中文的仍旧是百度科技论文范文在自然环境中的应用探究

我注意到,AI大模型在今年的热潮中占据了重要位置,ChatGPT作为OpenAI的代表人物,引领了这一趋势。随后微软、谷歌和Meta紧跟其步伐,而国内科技巨头也迅速响应现象,不断推出新的大模型。据说现在国内已经有上百款这样的模型问世了。

那么,这些大模型的实力又如何呢?不久前,我了解到清华大学新闻与传播学院发布了一份名为《大语言模型综合性能评估报告》的文件。在这份报告中,他们对国内外的一些大型语言处理系统进行了比较分析。

在7款被评估的大模型中,GPT-4以令人瞩目的成绩获得了第一名。而排在第二位的是百度研发的文心一言,其次是GPT-3.5,然后依次是Claude、讯飞星火、大连理工大学昆仑实验室开发的天工以及阿里云提供的通义千问。

尽管GPT-4在各个方面表现突出,但对于我们这些使用中文的人来说,更懂中文的大型语言处理器才更具实际意义。在这个领域内,比起其他竞争者,百度的文心一言表现得更加出色。它在部分中文语义理解方面取得92%高分率,一举夺得榜首。这背后可能与百度的大型语言模型训练集包含大量中文文本有关,因此能够更好地理解和处理相关于本土文化内容的问题。

你可能也会喜欢...