SJ/T 11615.3-2016 网络数据采集分析软件规范 第3部分:信息识别

SJ电子行业标准

SJ/T 11615.3-2016.Specification for network data collection and analysis software Part 3: Information identification.
1范围
SJ/T 11615的SJ/T 11615.3规定了网络数据采集与分析软件中分析模块信息识别部分的具体要求。
注:本部分所界定的网络数据指互联网上由网民参与创造与传播的数据,可包括:新闻及评论、论坛、博客、微博以及电子商务数据。
SJ/T 11615.3适用于互联网数据采集和分析软件的开发商、信息化建设单位、最终用户、第三方监理或者质量保障单位、评测单位等,用以指导在轻数据来来子性的改计:开发、运行和维护等各个阶段的相关工作。
2规范性引用文件
下列文件对于本文件的应用是必不可少的凡是注日期的引用文件,仅柱日期的版本适用于本文件。凡是不注日期的引用文件,其政新版本(包括所有的修改单)适用于本文件
GB 13000 -2050信息技术通用多八位编码字符集(UCS)
GB 18030- 9005信息技术中文编码字符
SJ/T 11615.21 网络数据采集分析软件规范 第部分:框
3术语和定义
SJ/T 11615. 1评定的术语和定义适用于本文件。
4信息识别概述
信息识别是信息接收者定的目的出发,运用已有的钢识利学信息的真伪性、有用性进行辨认与甄别的过程。信息识别应合信息抽取、数据整合和自己加工模快。
5信息抽取
5.1 抽取要求
信息抽取的要求如下:
应支持结构化、半结构化、非结构化的数据源;
b)单机应支持GB~TB级数据管理,集群应支持TB级的海量数据管理:
c)应支持采集内容的自动排版:
d)应支持 自动排重功能:
e)应支持GB 18030- -2005强制部分,并应与GB 13000- -2010相关内容建立映射关系;
f)应支持中英文字词混合输入。文章源自标准下载网-https://www.biao-zhun.cn/92452.html

SJ/T 11615.3-2016 网络数据采集分析软件规范 第3部分:信息识别

SJ/T 11615.3-2016 网络数据采集分析软件规范 第3部分:信息识别

下载信息
最近更新2022-1-10
下载地址
文章源自标准下载网-https://www.biao-zhun.cn/92452.html
如果觉得本站不错,就请站长喝个咖啡吧,谢谢您的支持!