百度文心一言排第二！清华发布大语言模型排名

2023-08-10 11:01 由网易科技频道发表于 #资讯

近日，清华大学新闻与传播学院沈阳团队发布《大语言模型综合性能评估报告》，报告本次评估选取了ChatGPT、文心一言、通义千问等7个大语言模型，围绕生成质量、使用与性能、安全与合规三大维度，全面考察大语言模型中文语义理解、逻辑推理等20项指标。

在这7款大模型中，GPT-4获得了毫无悬念的第一，第二名是百度的文心一言，其次是GPT-3.5，后面就是Claude、讯飞星火、阿里云的通义千问及昆仑的天工。

但对国内用户而言，中文理解能力也是关键指标。综合来看，文心一言语义理解能力突出。在部分中文语义理解方面，文心一言以92%的得分率排名榜首，超越讯飞星火、GPT-4。

凭借知识增强的核心特色，文心一言对本土语言特性把握更精准，能够更好处理与本土文化相关的主题和背景，如诗歌、方言等，具备更强的国内落地空间。

在现在的日常生活中，由于电子产品的盛行和学习、工作压力的增大，导致越来越多的人变成了近视眼，而且逐渐趋于低龄化。很多人觉得近视眼不是很严重的疾病，日常的生活没有受到太大的影响。其实，近视眼和其他疾病一样，也有一些注意事项。阅读全文

今天是末伏第一天，难熬的三伏天终于进入尾声。那么末伏吃什么？末伏还热吗？末伏养生需要注意什么？和小编一起了解一下~阅读全文

海外博主@IdleSloth84_分享一张出现在Xbox应用的《使命召唤20：现代战争3》新海报，普莱斯、幽灵对峙反派马卡洛夫，大家一起看一下。阅读全文

据“海关发布”官方公众号报道，8月4日，拱北口岸所属闸口海关在查验中发现一起旅客携带大量内存条的走私案件。阅读全文

《生化危机8》蒂米特雷斯库夫人（八尺夫人）配音演员玛吉·罗伯逊接受了The Gamer的专访，谈及这一角色带给她生活的变化，以及这个…阅读全文

今日，PlayStation发邮件提醒，PSN夏日优惠仅剩最后一周，优惠活动截至8月16日。有想买游戏的可以去看一下。阅读全文

iPhone 15全新芯片终于确定了。最新iOS 17的代码中出现了iPhone 15对应的芯片信息，确认iPhone 15和iPhone 15 Plus两款机型将采用老…阅读全文

索尼《GT赛车》真人电影M站评分现已解禁，目前媒体均分仅47分。在18条影评中，好评数仅为5条，中评10条，差评3条。阅读全文

和很多玩家一样，《龙腾世纪》（Dragon Age）的编剧大卫·盖德在他的新工作室的首款游戏即将发布之前，在《博德之门3》中找到了安慰。阅读全文