标准编号:T/SAIAS 031-2025
中文名称:科学智能语料库建设导则
英文名称:Guidelines for the Construction of Artificial Intelligence for Science Corpora
发布日期:2025-07-24
实施日期:2025-07-25
团体名称:上海市人工智能行业协会
起草人
山栋明、黄海清、漆远、邹亮、程远、石伯明、丁晓东、熊飞宇、孔令和、张林峰、钟俊浩、曹荣根、施佳樑、邓思文、杨闻博、曹宇、饶雪、赵春昊、汤洁、李孟渚、李吉羊、张谦、张颖慧、宋纯锋、白磊、李萌、郑啟豪、王宇涵、李佳秾、唐诗翔、薛东雨、任昱宸、黄维然、冯恺睿、李昊、罗烨、唐波、志宇、魏文强、蔡晓晨、李永超、龚奎、史涛涛、王建、肖玲、胡顺波、刘国鑫、陆知雨、陈若曦、路少卿、堵炜炜、虞祝豪、朱莉琴、杨文恺、郑更河、华静、宋佳琪、汤凯锋、章伟、张驰、潘登、赵兴华、杜镇泽、胡兵、张洪、张伟、郭爱华、沈彦、肖红练、贺仁龙、郑茂宽、陈巧慧、孙雯、王娜、沈滨、杨华、周永星、胡银银、李建君、张火箭、段冲、李卫、陈翔宇、谭晓坤、郭汉杰、魏飞、陈磊、曲晓婷、林一琪
起草单位
上海库帕思科技有限公司、上海市人工智能行业协会、上海科学智能研究院、上海人工智能实验室、上海创智学院、上海算法创新研究院大模型中心、北京深势科技有限公司、鸿之微科技(上海)股份有限公司、上海商汤智能科技有限公司、联通(上海)产业互联网有限公司、中国电信股份有限公司上海分公司、联通数据智能有限公司、上海宝信软件股份有限公司、上海工业自动化仪表研究院有限公司、国创智造科技(上海)有限公司、上海阶跃星辰智能科技有限公司、东华大学、上海岩芯数智人工智能科技有限公司、国家管网集团储能技术有限公司、国家工业信息安全发展研究中心人工智能所、上海联影智能医疗科技有限公司
标准范围
本文件提供了建设科学智能模型训练数据内容、数据采集、数据清洗、数据标注、语料测试、语料使用和数据安全方面的技术指导方法。
本文件适用于科学智能语料库的研究、开发、维护、应用、评估等工作。其它与科学智能语料库建设相关的工作也可参照使用。