T/CSHB 0017-2024 生成式人工智能模型训练合规技术规范.pdf

0017,2024,CSHB,pdf,生成式,团体标准
文档页数:19
文档大小:373.2KB
文档格式:pdf
文档分类:团体标准
上传会员:
上传日期:
最后更新:

T/CSHB 河北省协会团体标准 T/CSHB0017-2024 生成式人工智能模型训练合规技术规范 Generative AI model training plies with technical specifications 2024-9-10发布 2024-9-10实施 河北省协会发布
目录 前言... 1范围 .2 2规范性引用文件 3术语和定义 4合规原则 5数据收集合规要求 5.1合规性审查. 5 5.2收集方式.. .6 5.3数据类别.. .6 6数据预处理合规要求 9 6.1数据预处理总体要求 9 6.2数据预处理安全技术要求 10 6.3数据标注合规要求. 13 6.4训练数据预处理合规要求.

14 6.5数据加密技术要求... 14 7模型训练与测试合规要求. 15 7.1模型训练. .15 7.2模型测试. ..15 7.3数据备份与恢复 16 8内容生成服务合规要求 16 8.1使用者尽责义务的告知, 16 8.2生成内容的审核 16 8.3生成内容的标识.. 16 8.4生成内容的异议审查机制 17 8.5使用者信息保护.. .17 8.6被人维权支持, 17
前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规 则》的规定起草.

请注意本文件的某些内容可能涉及专利.

本文件的发布机构不承担识别这些专利的责 任.

同时,本文件的归配播智算(河北)人工智能科技有限公司及参与起草的单位 共同,受国家法律、法规保护.

未经许可,任何组织或个人不得擅自复制、出版、 传播或用于其他商业用途.

如有需要,请联系本文件发布机构或相关单位获取授权.

本文件由配播智算(河北)人工智能科技有限公司提出.

本文件由河北省协会归口. 本文件起草单位:配播智算(河北)人工智能科技有限公司、浙江宇宙奇点科技有限公司、 配播(杭州)技术开发有限公司、杭州配播科技有限公司、唐山壹播人供应链管理有限公司、 唐山研岸教育科技有限公司、华北理工大学、河北省协会、华科企元(北京)标准化技 术发展有限公司、中德信息技术(天津)有限公司、昔科财税(河北)企业管理服务有限公 司、首科(河北)企业管理咨询有限公司.

本文件主要起草人:王大伟、张小飞、吴文建、周小明、丁振东、张晶、黄晓敏、张佳 旺、戎丽娜、解峰、安志军、张孟佑、胡君、刘伟、王海玲.

1范围 本文件规定了生成式人工智能在进行模型训练时应遵守的合规原则,给出了相应的合规 要求与规定.

本文件适用于指导生成式人工智能进行模型训练.

2规范性引用文件 下列文件中的内容通过文中的规范性引用面构成本文件必不可少的条款.

其中,注日期 的引用文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括 的修改单)适用于本文件.

GB/T4943.1信息技术设备安全第一部分:通用要求 GB/T5271.1-2000信息技术词汇第1部分:基本术语 GB/T5271.28-2001信息技术词汇第28部分:人工智能基本概念与专家系统 GB/T5271.29-2006信息技术词汇第29部分:人工智能语音识别与合成 GB/T5271.31-2006信息技术词汇第31部分:人工智能机器学习 GB/T29246-2023信息安全技术信息安全管理体系概述和词汇 GB/T29490-2023企业知识产权合规管理体系要求 GB/T32914-2023信息安全技术网络安全服务能力要求 GB/T32916-2023信息安全技术信息安全控制评估指南 GB/T35273-2020信息安全技术个人信息安全规范 GB/T35770-2022合规管理体系要求 GB/T41479-2022信息安全技术网络数据处理安全要求 GB/T41867-2022信息技术人工智能术语 GB/T42018-2022信息技术人工智能平台计算资源规范 GB/T42574-2023信息安全技术个人信息处理中告知和同意的实施指南 GB/T42755-2023人工智能面向机器学习的数据标注规程 GB/T43269-2023信息安全技术网络安全应急能力评估准则 GB/T43557-2023信息安全技术网络安全信息报送指南 TC260-PG-20202A移动互联网应用程序(App)收集使用个人信息自评估指南 TC260-003生成式人工智能服务安全基本要求 2
3术语和定义 3. 1 生成式人工智能generative artificialintelligence(AIGC) 具有文本、图片、音频、视频等内容生成能力的人工智能模型及相关技术.

3. 2 提供者provider 以交互界面、可编程接口等形式面向我国境内公众提供生成式人工智能服务的组织或个 人. 3.3 个人信息personalinformation 以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名 化处理后的信息.

[来源:GB/T42574-2023,定义3.1] 3. 4 敏感个人信息sensitive personalinformation 一旦泄露或者非法使用,容易导致自然人的人格尊严受到侵害或者人身、财产安全受到 危害的个人信息.

注:敏感个人信息包括生物识别、宗教信仰、特定身份、医疗健康、金融账户、行踪轨迹等信息,以 及不满14周岁未成年人的个人信息.

[来源:GB/T 42574-2023,定义3.2] 3.5 测试数据test data 用于评估最终机器学习模型性能的数据.

注:测试数据与训练数据无交集.

[来源:GB/T41867-2022,定义3.2.3] 3.6 模型训练modeltraining 利用训练数据,基于机器学习算法,确定或改进机器学习模型参数的过程.

[来源:GB/T 41867-2022,定义3.2.18] 3

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)