全网唯一标准王
ICS 35.020 L79 SJ 备案号: 中华人民共和国电子行业标准 SJ/T11615.2—2016 网络数据采集分析软件规范 第2部分:数据格式描述 Specification for network data collection and analysis software Part 2: Description of data format 2016-01-15发布 2016-06-01实施 发布 中华人民共和国工业和信息化部 SJ/T11615.2—2016 前 言 SJ/T11615《网络数据采集分析规范》系列标准分为4个部分: 第1部分:框架; 第2部分:数据格式描述; 第3部分:信息识别; 第4部分:服务要求。 本部分为SJ/T11615的第2部分。 本部分按照GB/T1.1一2009《标准化工作导则第1部分:标准的结构和编写》给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本部分由工业和信息化部软件服务业司提出。 本部分由全国信息技术标准化技术委员会归口。 本部分起草单位:中国电子技术标准化研究院、上海计算机软件技术开发中心、上海微趣网络科技 有限公司、东北大学、北大方正电子有限公司、北京拓尔思信息技术股份有限公司、上海市互联网信息 办公室、上海交通大学密西根学院、厦门理工学院计算机与信息工程学院。 本部分主要起草人:史睿、蔡立志、杨瑛、龚家瑜、刘振宇、胡芸、顾程、卢海英、许良奇、杨建 武、郭军、张思成、崔建峰、肖蕾、李冕。 II SJ/T11615.2—2016 网络数据采集分析软件规范第2部分:数据格式描述 1范围 SJ/T11615的本部分规定了网络数据采集分析软件的数据描述。 本部分适用于互联网数据采集和分析软件的开发商、信息化建设单位、最终用户、第三方监理或者 质量保障单位、评测单位等,用以指导在网络数据采集分析软件的设计、开发、运行和维护等各个阶段 的相关工作。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 SJ/T11615.1网络数据采集分析软件规范第1部分:框架 3术语和定义 SJ/T11615.1界定的术语和定义适用于本文件。 4 数据格式描述 4.1概述 本部分通过如下元素对互联网数据进行描述: a) 对象类是网络数据采集的具体对象; b) 属性是用来描述对象类的特征和性质; c) 行为是对象类实施或者被施加的动作的描述; (P 群体是具有相同属性或者相同行为对象类的聚集; e) 关联是描述对象类与对象类之间的相互作用,相互影响的状态,或者是对象类与群体之间的从 属关系; f) 时间线是附加于数据采集的过程之中,通过对对象类属性的连续采集,可辅助网络信息态势计 算。 图1描述了对象类与属性、对象类与对象类、对象类与关联、对象类与群体之间的关系。 1 SJ/T11615.2—2016 群体 群体 关联 +属性 1.. * 1. , * / - 《关键对象类》 《关键对象类》 - +持久属性 +属性 - <从属对象类》 +易变属性 +行为0 +属性 <从属对象类》 <从属对象类> 1 +属性 +属性 对象 对象 对象 注:矩形表示对象类,连接矩形的线表示类之间的关系。每个矩形(从上到下)包含相应类的名称、属性和方法/ 操作三个部分。本图主要描述类之间关系,因此每个矩形仅包含类的名称。在下面的条款中会列出并定义类的 属性。线旁的数字指明了关系的多样性:“1”指一个、“0..1”指0个或者1个、“1..*”指1个或者更多。带 有菱形的线表示整体和部分之间复合的关系,线的一端是整体,另一端是部分。 图1对象类、属性、行为、群体以及关系示意图 用户在使用本部分时,宜按照如下步骤进行数据定义: a) 确定需要采集和分析的目标; b) 定义需要采集和分析的关键对象类; c) 确定需要采集的关键对象类属性,必要时可将属性定义为从属对象类; (P 根据关键对象类之间的操作行为,定义关键对象类之间的关联; 定义需要进行分析的群体,对采集到的关键对象类以及关联按照所定义的群体属性进行聚类, 得到群体的统计数据。 本部分不对网络数据字段进行任何定义,用户可依据上述元素及需求自行定义具体字段。 4.2对象类 对象类可实施行为或者由另一对象类的行为来产生或者改变其属性值。 根据网络采集的目的不同,对于对象类的定义分为如下几类: 关键对象类,是网络数据采集及分析的主要对象。在本部分中,关键对象类用于表示关联两端 的节点。 b)从属对象类,是用于表示关键对象类中的某个复杂属性。 在网络数据采集过程中,应依据采集目的,预先确定采集关键对象类,而从属对象类则可以在定义 关键对象类属性时加以确定。 示例1:在新闻系统中,如果以研究用户所关注的新闻话题为日的,则关键对象类为新闻和用户,从属对象类可以 是新闻的附件(图片、视频等多媒体信息)等。 2 SJ/T11615.2—2016 示例2:在论坛系统中,如果以研究用户所关注的论坛主题为目的,则关键对象类为主题和用户,从属对象类可以 是主题的附件、回复等。 示例3:在博客系统中,如果以研究用户所关注的博客为目的,则关键对象类为博客和用户,从属对象类为博客的 附件等。 示例4:在微博系统中,如果以研究用户所关注的微博话题为日的,则关键对象类为微博和用户,从属对象类为微 博的附件(图片、视频等多媒体信息)。 示例5:在电子商务系统中,如果以研究用户所倾向于购买的商品为目的,则关键对象类为商品和用户。 4.3属性 属性用于描述对象类的一系列性质。属性的值可以是任意的类型,或者可以是另一个对象类。一个 属性对应一个值或者一个集合, 多个属性。属性的值可以是同一对象类不同对象的集 合,该类属性称之为集合属性。 属性包含持久属性和动套属性两 持久属性 当作为持久属 动态属性 描迷了对象类 关注程度,例如闻的点击数、 购买的商品数等。对 动态属性的 采集分析应当加 间标注。 集合属性可以是持久属,例微携的附件;也可以是态属性,例如新闻的评论、论坛主题的 回复等。 电子商务属 时录B。 示例1: 对象类, 功态属性可! 个人签名、好友数、 最近访问IP 示例2: 类,其持 属性可以是ID、标题、 点击数、评论数等。 风于 示例3:对 其持久属性可以是ID、标题、内容、作者、发表时间 URL等 动态属性可以是点击数、 回帖数,最后回复时间管 示例4:对于博客对象类,其持久属性可以是ID、标题、内容、URL、作者、 发表时间等;动态属性可以是点击率、 评论数等。 示例5:对于微博对象类 等。 示例6:对于商品对象类,其持久属性可以知 描述等,动态属性可以是购买数、评价数等。 4.4行为 行为是对象类所进行动作的描述。行为应由对象类实施,可创建对象类、改变该对象类或其他对象 类的属性或者确立对象类之间的关联。 对行为的采集宜通过对象类的属性以及关联来体现。网络数据采集与分析软件应根据数据采集的目 的来确定需要采集的行为。 一个行为可以有多种结果,具体的结果体现应依据采集目的来定义。例如在微博系统中,如果需要 研究微博的影响力和热门程度,则需采集微博的转发数、评论数,以及发表该微博用户的粉丝数;如果 需要对用户进行收听推荐,则需采集用户与用户之间的关注关联、用户与微博之间的转发关联、评论关 联等。 3 SJ/T11615.2—2016 示例1:在新闻系统中,用户可以通过点击新闻、评论新闻等行为来改变新闻的点击量,建立用户对象类与新闻对 象类之间的关联。 示例2:在论坛系统中,用户可以通过发表主题、点击主题、回复主题等行为来改变主题的点击量,建立用户对象 类与主题对象类之间的关联。 示例3:在博客系统中,用户可以通过发表博客、点击博客、评论博客等行为来改变博客的点击量,建立用户对象 类与博客对象类之间的关联。 示例4:在微博系统中,用户可以通过关注用户、发表微博、转发微博、评论微博等行为来改变用户粉丝数、微博 转发数、评论数,建立用户对象类与用户对象类、用户对象类与微博对象类之间的关联。 示例5:在电子商务系统中,用户可以通过浏览商品、购买商品、收藏商品、评论商品等行为来改变商品的点击数、 购买数、收藏数,建立用户与商品之间的关联。 4.5关联 关联是出行为造成的对象类与对象类之间相互作用的状态。依据关联两端对象类以及行为的不同, 相同的关键对象类之间可以同时具有多个关联,应对每一类关联建立对应的数据结构。例如,用户购买 了商品,两者之间建立了购买关联,包含购买日期、价格等属性;同时该用户又评价了商品,建立了评 价关联,包含评价得分、具体评价内容等属性。 关联中的属性定义方法与对象类相同,具体可参见4.3。 示例1:在新闻系统中,新闻对象类和用户对象类可产生评论关联。 示例2:在论坛系统中,主题对象类和用户对象类可产生回复关联。 示例3:在博客系统中,博客对象类和用户对象类可产生评论关联。 示例4:在微博系统中,微博对象类和用户对象类可产生转发关联、评论关联;用户对象类与用户对象类可产生关 注关联。 示例5:在电子商务系统中,商品对象类和用户对象类可产生购买关联、评价关联。 4.6群体 群体是依据同一类对象类集合的某个属性抽象得到的对象类聚集,可包含一个或者多个对象类。 个群体所包含的所有对象类应包含至少一个相同的属性或者相同的行为,但是相同的对象类可以 从属于不同的群体。 依据采集目的的不同,群体可以替代关键对象类,作为关联的一端。例如,某一

.pdf文档 SJ-T 11615.2-2016 网络数据采集分析软件规范 第2部分 数据格式描述

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
SJ-T 11615.2-2016 网络数据采集分析软件规范 第2部分 数据格式描述 第 1 页 SJ-T 11615.2-2016 网络数据采集分析软件规范 第2部分 数据格式描述 第 2 页 SJ-T 11615.2-2016 网络数据采集分析软件规范 第2部分 数据格式描述 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-08-24 05:07:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。