YD/T 6522-2025
现行
标准号 YD/T 6522-2025
标准名称 面向应用场景的自然语言处理模型评估方法
发布日期 2025-08-19
实施日期 2025-12-01
归口单位 中国通信标准化协会
主管部门 工业和信息化部
行业分类 信息传输、软件和信息技术服务业
标准类别 方法标准
制定/修订 制定
备案号 102528-2025
国际标准分类号
中国标准分类号
代替标准
起草单位 中国信息通信研究院,北京百度网讯科技有限公司,之江实验室,南京新一代人工智能研究院有限公司,蚂蚁科技集团股份有限公司,腾讯云计算(北京)有限责任公司,上海商汤智能科技有限公司,中通服咨询设计研究院有限公司。
起草人 刘璟,吴华、张学强、张丹、董晓飞、曹峰,于佃海,黄丹丹,蒋晓琳,洪豆,刘昊,李弘宇,牛正雨,王历伟,刘家辰,刘海涛,蒋慧,吴庚,冯小芳。
标准简介及适用范围
YD/T 6522-2025《面向应用场景的自然语言处理模型评估方法》标准规定了面向应用场景的自然语言处理模型评估方法必须具备的国家强制标准,2025-12-01开始实施,起草单位为:中国信息通信研究院,北京百度网讯科技有限公司,之江实验室,南京新一代人工智能研究院有限公司,蚂蚁科技集团股份有限公司,腾讯云计算(北京)有限责任公司,上海商汤智能科技有限公司,中通服咨询设计研究院有限公司。。
本文件适用于构建自然语言处理模型评估数据集,适用于指导第三方测评机构对自然语言处理模型的评估、验收等工作。
被引用情况
| 标准号 | 标准名称 | 标准状态 | 实施日期 |
|---|---|---|---|
| YD/T 4392.2-2025 | 人工智能开发平台通用能力要求 第2部分:安全要求 | 现行 | 2025-12-01 |
| YD/T 4392.4-2025 | 人工智能开发平台通用能力要求 第4部分:大模型开发应用 | 现行 | 2025-12-01 |
| YD/T 6525-2025 | 智能对话平台开发与服务能力评估方法 | 现行 | 2025-12-01 |
| YD/T 4394.10-2025 | 自然语言处理技术及产品评估方法 第10部分:知识问答系统 | 现行 | 2025-12-01 |
| YD/T 6521-2025 | 基于深度神经网络的音频结构化框架 | 现行 | 2025-12-01 |
| YD/T 6520.5-2025 | 大规模预训练模型技术和应用评估方法 第5部分:模型运营 | 现行 | 2025-12-01 |
用户评价
暂无用户评价。您可以发表对本标准的看法:
专家解读