中华人民共和国新闻出版行业标准
CY/T284--2026
Functional requirements of automatic proofreading system for digital content
国家新闻出版署 发布
目次
前言..1范围...2规范性引用文件3术语和定义,4总体要求.4.1网页及文件格式要求 4.2服务方式要求..5基本框架..6预处理模块功能要求7支撑模块功能要求 27.1功能选择.7.2校对模型要求7.3校对规则要求.. 7.4校对词库要求.7.5校对知识库要求,8服务模块功能要求.8.1单一文件校对要求.8.1.1一般要求... 8.1.2校对功能要求,8.1.3校对结果呈现及处理要求8.2网站及新媒体内容安全监测功能要求 68.3批量特定场景校对要求9统计及报告模块功能要求 9.1结果统计要求,9.2结果报告要求.10隐私及安全要求11语言文字要求.12校对结果稳定性及响应时间要求参考文献..
前言
起草. 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别专利的责任.
本文件由全国新闻出版标准化技术委员会(SAC/TC527)归口.
本文件起草单位:蜜度科技股份有限公司、同方知网数字科技有限公司、江苏风凰电子音像出版社有限公司、北京外研在线数字科技有限公司、武汉理工数字传播工程有限公司、测绘出版社有限公司、智讯学术(北京)信息服务有限公司、广东教育出版社有限公司、上海东方报业有限公司、江苏风凰报 刊出版传媒有限公司、机械工业出版社有限公司、北京文华在线信息技术有限公司、上海家瑶网络科技有限公司、中国新闻出版研究院.
华、黄杨、韩菲、张庆国、林雪、史晏、张程程、程辉、陈伟平、吉晶、刘颖丽. 本文件主要起草人:张晓娟、龚婷、王瑞杰、黄肖俊、谢冰、宛楠、赵雪芳、吴芸、李爱莲、白立
数字内容自动校对系统功能要求
1范围
统计及报告模块、隐私及安全、语言文字等要求. 本文件提出了数字内容自动校对系统的总体要求、基本框架、预处理模块、支撑模块、服务模块、
本文件适用于面向新闻出版领域的数字内容自动校对系统的研发与应用.
2规范性引用文件
仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括的修改单)适用于本 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.其中,注日期的引用文件,文件.
GB/T7714信息与文献参考文献著录规则 GB/T15834标点符号用法GB/T16159汉语拼音正词法基本规则CY/T121学术出版规范注释
3术语和定义
下列术语和定义适用于本文件.
3.1
以数字形式存在的文本、图像、音额、视频等新闻出版内容资源. 数字内容digitalcontent[来源:GB/T40949-2021,3.1,有修改]
3. 2
自动校对automaticproofreading
对导向风险以及知识性、文字、标点、格式等方面差错,由软件工具自动进行识别,辅助进行的数字内容检测和校正活动.
4总体要求
4.1网页及文件格式要求
数字内容自动校对系统应支持解析网页(如HTML)、常用办公格式文件(如DOC、DOCX、UOF)、版式文件(如OFD、PDF)、流式文件(如ePub、TXT)等文件格式,校对其中的文字、图片、音频、视频等数字内容.
4.2服务方式要求
服务方式要求如下.
a)应提供互联网在线校对、局域网或专用网络校对:宜提供单机校对功能.b)应提供上传文件形式校对,宜提供办公软件插件形式校对,宜提供网站及新媒体内容监测功能及定制化场景校对.
5基本框架
数字内容自动校对系统由预处理模块、支撑模块、服务模块、统计及报告等模块组成,系统基本框架如图1所示,具体如下.