标准编号:T/CWAN 0175-2026

中文名称:焊接大语言模型的评价方法

英文名称:Evaluation method for welding large language model

发布日期:2026-01-07

实施日期:2026-02-01

团体名称:中国焊接协会

起草人

于兴华、孙震、冯消冰、武鹏博、马青军、尹立孟、陈玉华、王铭秋、林涛、刘晨曦、刘金龙、刘建国、邓军林、侯国清、朱斌海、范东辉、张大林、孙明辉、黄小宇、王永东、于修和、郝亮、李爱民、隋英杰、刘洋、于春洋、牛董山钰、方乃文

起草单位

北京理工大学(珠海)、山东大学、北京博清科技有限公司、中焊科技发展(哈尔滨)有限公司、天津市特种设备监督检验技术研究院、重庆三峡学院、南昌航空大学、上海中巽科技股份有限公司、江苏北人智能制造科技股份有限公司、天津大学、唐山松下产业机器有限公司、哈尔滨职业技术大学、北部湾大学、广西柳工机械股份有限公司、哈尔滨华德学院、中国兵器工业集团航空弹药研究院有限公司、南昌职业大学、福建省特种设备检验研究院、黑龙江科技大学、无锡合泰教育咨询有限责任公司、坤智大数据科技(哈尔滨)有限公司、威海职业学院、黑龙江工程学院

标准范围

本文件规定了焊接大语言模型(welding large language model, Weld LLM)的评价原则、评价维度与指标体系数据集构建方法、评测流程、评分与等级划分方法、检验记录要求,并提供了评价报告格式。

本文件适用于以自然语言处理为核心的焊接大语言模型的评价,包括通用型大语言模型在焊接领域的能力评估,以及面向焊接领域开发的专用大语言模型性能测试与验证。

本文件不适用于对非自然语言处理类的焊接人工智能系统(如基于规则的专家系统、单纯的图像识别算法)的独立评价,但可为此类系统与LLM融合后的整体性能评估提供参考。

标准预览图

下载信息


立即下载标准文件

大家都在看