清华大模型报告称，文心一言数学能力与Claude-3并列第一

Android社区发表于 2024-04-23T03:25:58Z 收藏文章

最近，由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架，正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型，结果显示：文心一言4.0表现亮眼，与国际一流模型水平接近，且差距已经逐渐缩小，名副其实为国内头部模型。

在语义理解中的数学能力上，文心一言4.0与Claude-3并列全球第一；GPT-4系列模型位列第四五，其他模型得分在55分附近较为集中，明显落后第一梯队；而在语义理解中的阅读理解能力上，文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

丽珠集团回应“涉及违规支出公关费用” ：内部正在调查，费用占比是行业正常水平

发布于：2023-08-08T01:20:42Z | 262次阅读 | 详细内容 »

美国芯片巨头英特尔与中方合作！将在深圳新建芯片创新中心

发布于：2023-08-03T01:48:25Z | 233次阅读 | 详细内容 »

工信部要求开展 App 备案，微信小程序完成备案后才可上架

发布于：2023-08-10T01:36:02Z | 213次阅读 | 详细内容 »

微信要做“小绿书”？知情人士：小范围内测，优化视频号图文发布及呈现

发布于：2023-08-03T01:46:26Z | 212次阅读 | 详细内容 »

X、马斯克寻求驳回有关前推特员工遣散费的诉讼

发布于：2023-08-03T01:54:03Z | 210次阅读 | 详细内容 »

家乐福被裁员工曝未拿到补偿金，此前通知补偿金打6折一次性发和全款分12期之间二选一

发布于：2023-08-01T01:18:01Z | 205次阅读 | 详细内容 »

OpenAI已注册GPT5商标

发布于：2023-08-03T01:55:09Z | 202次阅读 | 详细内容 »

特斯拉收购德国无线充电技术公司，未来或将投放相关产品

发布于：2023-08-03T01:54:41Z | 196次阅读 | 详细内容 »

全球勒索软件攻击创历史新高，美国是全球勒索软件攻击首要目标

发布于：2023-08-08T01:30:21Z | 194次阅读 | 详细内容 »

美交管局对特斯拉部分车型展开调查，特斯拉部分车型被曝转向失灵

发布于：2023-08-03T01:53:35Z | 193次阅读 | 详细内容 »

相关标签

所有标签

相关文章

王慧文病休53天，旗下OneFlow团队重新创业 8月以前 | 1次阅读

智己CEO现场怒怼！不满LS6和小鹏G6当对手 8月以前 | 1次阅读

董明珠回应落榜世界500强：总比爆雷的世界500强好 8月以前 | 1次阅读

阿里云上线 AI 视频生成工具 Live Portait：可一键让照片开口说话 8月以前 | 78次阅读

妙鸭相机将并入神力视界，阿里大文娱CTO郑勇：不是“搬家”是“回家” 8月以前 | 85次阅读

特斯拉上海超级工厂约40秒下线一台车，零部件本土化率超95% 8月以前 | 69次阅读

宁德时代发布神行超充电池，可实现充电10分钟行驶800里 8月以前 | 71次阅读

中科院博士被骗到缅甸已一年！女友：他负债几万，家里条件一般，以为去当翻译 8月以前 | 85次阅读

小鹏汽车否认收购玛莎拉蒂传闻：系谣言 8月以前 | 63次阅读

联想二季度净利润猛降66%，股价应声跳水 8月以前 | 80次阅读

业内人士：视觉中国对不同侵权主体采用差异化策略，老客由销售沟通新客发律师函 8月以前 | 70次阅读

恒大集团在美国申请破产保护 8月以前 | 56次阅读

劳斯莱斯首款纯电轿跑将在北美亮相 8月以前 | 89次阅读

realme印度前CEO确认加盟荣耀，即将推出手机新品 8月以前 | 88次阅读

OpenAI正在测试内容审核系统，一天可以完成六个月的工作 8月以前 | 80次阅读

谷歌百人“复仇者联盟”出击，将发对标GPT-4的大模型，26位研发主管名单流出 8月以前 | 77次阅读

OpenAI收购数字产品公司Global Illumination，为创立以来首笔公开收购 8月以前 | 80次阅读

海口规定：电动汽车充电服务费不得超过0.65元每度 8月以前 | 80次阅读

波音任命柳青为波音中国总裁 8月以前 | 88次阅读

业内人士谈图片复杂代理链：图片代理商越多摄影师分成越少 8月以前 | 67次阅读

扫一扫

在手机上阅读