中国信通院可信AI评测服务：大模型评估测试体系（2024）升级发布_AI评测,大模型_企业关注

今日热点更多

精彩视频更多

“向新出发智造未来”itc邀请您来当云厂长

华智智能安检门演示
2025-07-02
显示屏源头厂家——狄卫科技产品展示
2025-06-30

推荐展会更多

第十二届国际地下空间开发大会（IFUS 2025）

热搜话题更多

#第六届西部数博会

#新时代黄金赛道低空经济发展正当时

#我国部署建设10个国家数据要素综合试验区

新发产品更多

矿用/机井用MYJV22高压电缆3*25价
天津市电缆总厂橡塑电缆厂
￥11
小鼠胰岛素瘤β细胞 NIT-1细胞
通派（上海）生物科技有限公司
￥1
华睿1200万黑白全局9fps千兆网口相机
深圳市杰智通科技有限公司
面议
沥青流变性质试验仪
上海诚卫仪器科技有限公司
￥690000
沥青流变性质试验仪（测试仪）
上海程斯智能科技有限公司
￥490000
沥青流变性质试验仪测试标准
上海徽涛自动化设备有限公司
￥500000

中国信通院可信AI评测服务：大模型评估测试体系（2024）升级发布

2024年04月29日 09:21:27来源：中国信通院CAICT点击量：40894

导读2024年，“两会”政府工作报告中首次提到“人工智能 ”行动，人工智能被视为形成新质生产力的重要引擎。随着人工智能技术的快速演进，AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎，展现出巨大的发展潜力和应用前景。

　　【智慧城市网企业关注】2024年，“两会”政府工作报告中首次提到“人工智能+”行动，人工智能被视为形成新质生产力的重要引擎。随着人工智能技术的快速演进，AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎，展现出巨大的发展潜力和应用前景。AI大模型的应用领域广泛，包括但不限于办公、制造、金融、医疗、政务等，这些领域的创新和发展为AI大模型产业注入了强大的活力。当前，我国AI大模型产业呈现蓬勃发展的态势，通用大模型、行业大模型、端侧大模型如雨后春笋般涌现，并在多个领域取得了显著成果。

　　大模型是典型的人工智能平台赋能性技术，加快我国大模型技术创新和应用落地，需要加强大模型评测体系研究，搭建全量测试题库、自动测试平台和高效测试方法，降低研发和使用成本，满足大模型能力持续监测和能力迭代的要求，从而推动我国自主可控的大模型产业生态继续向前迈进。

　　中国信息通信研究院(简称“中国信通院”)长期研究大模型发展态势，自2022年3月启动大模型评测技术研究以来，根据产业发展不断优化迭代，已形成一套覆盖范围全、评测指标精、需求映射准的大模型评测体系。此次全新升级的“中国信通院可信AI评测服务——大模型评估测试体系(2024)”覆盖七大模块：大模型基础软硬件及集群系统、大模型能力基准测试、大模型平台、基础大模型、行业大模型、智能应用和大模型能力安全测试。

　　具体来说，评测体系一是为满足大模型训练及推理的软硬件系统、软硬件系统前沿技术能力以及当前我国AI软硬件兼容适配及能力迁移需求，提供多种能力验证服务；二是从综合能力、通用能力、行业和应用能力方面构建大模型基准测试体系；三是从大模型平台、基础大模型、行业大模型和大模型智能应用全链条提供产品评估服务；同时针对大模型各种服务形式，全方位开展MaaS安全、基准安全、模型安全、内容安全、数据安全和服务安全等评估，助力行业安全发展。

　　“中国信通院可信AI评测服务——大模型评估测试体系(2024)”作为业界专业面向大模型的可信AI测评体系，从技术、应用、安全等各方面对大模型相关产品进行评估测试，为“人工智能+”行业落地保驾护航。

　　规范行业发展，树立标杆应用。通过科学、客观的评测，有利于更好地理解和把握大模型技术的发展趋势，为政府部门提供科学依据，支持国家在人工智能领域的政策制定和顶层设计。通过有效筛选出高性能、高可靠性的大模型产品服务，并针对测试过的大模型标杆企业开展应用推广活动，树立可推广、可复制、高价值的标杆产品应用。

　　推动应用落地，加速产业化进程。不仅帮助供需各方评估和优化其模型性能，激发厂家优化迭代产品，有利于形成行业市场良性竞争环境；还可以通过提供测试指标、方法和工具，促进技术标准化，拓展大模型应用的广度和深度，加速产业化进程，实现技术、应用与产业的协同发展。

　　帮助用户了解产品，协助企业验收。一方面，大模型评测是一项重要的验收工具，可以帮助企业全面检验产品各项指标，并了解性能瓶颈和改进方向，不断优化模型结构和算法；另一方面，通过参与评测并与同行交流，企业能够获取更多的行业信息和优秀实践，提升技术水平和竞争力。

　　部分已通过评测企业(持续更新)

关键词 AI评测大模型

关于公布矿山领域机器人典型应用场景名单的通知

比亚迪通信信号携手中国电信融创“卫星＋汽车”新场景，联合推出汽车直连卫星业务

相关阅读更多

阿勒泰：多维发力赋能数字素养提升，激活发展新动能
数字经济蓬勃发展的时代浪潮下，阿勒泰地区积极探索创新路径，通过技能竞赛、专业培训、场景化宣传等多样举措，全方位推进数字素养提升工作...
数字素养大模型
2025-07-11
公司重要动态速览｜海康威视、科大讯飞、华为......
最近，知名企业发生了什么要闻？下面小编带大家一起回顾近期智慧城市领域公司的重要动态。
公司大模型
2025-07-11
权威机构发布中国安全智能体市场报告：安恒信息六大类全面覆盖
安恒信息在安全智能体领域的全面领先地位及其技术演进，反映了AI驱动下网络安全行业的变革趋势。以下从技术、市场及行业影响三个维度进行...
安恒信息大模型
2025-07-11
“雪浪工匠”大模型助力高端装备解决工程难题｜工赋上海·AI+制造
当前，通用大模型性能提升，应用成本下降，这拓展了制造业在大模型应用的发展空间。然而，通用大模型缺乏对工业复杂场景和专业知识的深度理...
大模型大模型制造
2025-07-11
小企业数字化转型城市试点丨襄阳“数智”引擎轰鸣这场推进会划重点了
7月4日，襄阳市召开全市中小企业数字化转型城市试点工作现场推进会。
数字化转型大模型
2025-07-10
《上海城市空间治理领域人工智能应用暨量子城市空间智能建设工作实施方案（2026—2027年）》印发
开展城市空间治理大模型研发。
人工智能大模型
2025-07-10

版权与免责声明：

凡本网注明“来源：智慧城市网”的所有作品，均为浙江兴旺宝明通网络有限公司-智慧城市网合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：智慧城市网”。违反上述声明者，本网将追究其相关法律责任。

本网转载并注明自其它来源（非智慧城市网）的作品，目的在于传递更多信息，并不代表本网赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品第一来源，并自负版权等法律责任。

如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。