L79 ICS 35.100.01
YD 中华人民共和国通信行业标准 YD/T3444-2019
互联网流量分类样本获取方法 Sample acquisition requirements of internet traffic classification
2019-08-27 发布2019-10-01实施
中华人民共和国工业和信息化部发布
YD/T3444--2019
目次
前言..I 1范围... 2规范性引用文件. 3术语、定义及缩略语.. 3.1术语和定义. 3.2缩略语.. 4概述...2 5样本获取场景要求..2 5.1样本版本选择要求.2 5.2样本操作系统选择要求,2 5.3样本获取次数要求..2 5.4样本获取时间要求.2 5.5特殊业务类型应用样本获取要求,2 5.6样本获取环境要求, 6样本获取种类要求.3 7样本获取流程要求.3 8样本存储和命名要求.
YD/T3444-2019
前言
本标准是“互联网流量分类”系列标准之一。
该系列标准的预计结构和名称如下: 一互联网流量分类方法及编码规范; 一互联网流量分类样本获取方法; 一互联网流量分类样本标注方法; 一互联网流量分类识别输出格式要求; -互联网流量分类识别离线评测方法; -互联网流量分类识别在线评测方法。
本标准按照GB/T1.1一2009给出的规则起草。
请注意本文件的某些内容可能涉及专利。
本文件的发布机构不承担识别这些专利的责任。
本标准由中国通信标准化协会提出并归口。
本标准起草单位:国家计算机网络应急技术处理协调中心,中国科学院信息工程研究所。
本标准主要起草人:舒敏、颜靖华、夏葳、高昕、石俊峥、曹自刚。
Ⅱ
YD/T3444--2019
互联网流量分类样本获取方法
1范围
本标准规定了互联网流量分类样本获取方法,包括样本获取场景设置、获取流程、存储命名等要求。
本标准适用于流量分类系统,以及其他集成流量分类功能的网络设备。
2规范性引用文件
下列文件对于本文件的引用是必不可少的。
凡是注日期的引用文件,仅注日期的版本适用于本文件。
凡是不注日期的引用文件,其最新版本(包括的修改单)适用于本文件。
YD/T3443一2019互联网流量分类样本标注方法
3术语、定义及缩略语
3.1术语和定义 下列术语和定义适用于本文件。
3.1.1 互联网流量分类样本Internettrafficclassificationsample 包含指定协议或应用的互联网流量文件实体,可通过捕包程序获取流量样本。
3.1.2 捕包程序packagecaptureprogram 将网络中的包捕获下来并分析的应用程序。
3.1.3 操作系统operatingsystem 管理控制计算机或智能终端设备硬件与软件资源的程序,常见的操作系统包括Windows、Linux、 Android、iOS等。
3.1.4 应用版本applicationversion 为应用设置的版本标识,通常为英文和数字的组合。
YD/T3444-2019 3.2缩略语 下列缩略语适用于本文件。
BT Bit Torrent比特流下载 IP InternetProtocol互联网协议 NAT Network Address Translation网络地址转换 TCP TransmissionControlProtocol传输控制协议
4概述
流量分类样本获取的要求,包括流量分类样本获取场景、获取流程、命名存储三方面的要求。
样本获取场景包含样本版本、操作系统、获取次数、获取时间、特殊应用样本的获取方式以及获取 环境。
样本获取流程包含样本获取的步骤及注意事项。
样本命名存储包含样本存储方式及命名方式。
5样本获取场景要求
5.1样本版本选择要求 在确定需要获取的目标协议、应用流量样本后,至少应选择最新的两个版本进行获取。
对于发行版 本较多的协议或应用,例如BT,至少需选择市面上使用广泛的两个发行版本,并获取最新的两个版本 的流量样本。
5.2样本操作系统选择要求 对于每种协议、应用,应捕获主流操作系统下的流量样本。
如WindowsXP、Windows7、Android2.3 等。
5.3样本获取次数要求 为了保证所获取样本的真实性和全面性,针对每种协议或应用至少应获取10次。
5.4样本获取时间要求 为了保证所获取样本能充分体现协议或应用的特征,每次获取时间应不少于5min。
5.5特殊业务类型应用样本获取要求 5.5.1文件传输类 获取文件上传、下载类的pcap文件样本应不小于20MB。
2...