主中心
首页
当前位置:首页-法规标准

农业科学数据检查和质量控制管理办法

作者:未编辑 来源:国家农业科学数据中心(热带作物) 发表时间:2017-12-29 点击:
【字号:   打印

一、目的

为快速检查农业科学数据共享平台中共享数据、服务及共享平台建设的质量,使数据库的质量控制、检查和管理工作做到科学性、规范性,提出并制定本《农业科学数据库质量控制检查规范》。该规范适用于农业科学数据集成时各种数据的质量评价,也适用于数据生产者或提供者描述和评价一个数据集在产品规定的指标内的质量信息。

二、数据检查和质量控制的主要依据

“子课题任务书”以及“配套的系列技术规范和标准”是实施数据库质量控制和检查的主要依据。

三、数据库的质量评价体系

1. 数据库结构的科学性、规范性

根据都柏林核心元素集、MARC标准,元数据规范,以及数据库专业特点等要求,重新审查数据库字段的设置。由于数据库类型较多,重点审查必选字段的完备性等,主要依据课题制定的“农业科学数据元数据标准”。

2. 数据库内容的正确性、合理性

数据是否符合本课题规定的选题范围(选题是否合理、内容是否有超出、遗漏、重复等问题),数据内容是否反映事实和真实,是否标明了数据的时效和适用范围以及是否按规定完成任务等等。主要依据为课题承担单位签订的“子课题合同书”。

3. 数据著录的一致性、规范性、完整性

重点审查著录内容的一致性(即同一数据集的科技基础数据必须保持一致,不能出现矛盾),著录的完备性(在数据库中应完整地给出一个对象的相关数据,某些对象的某些方面可能暂没有数据的或没有定义的应表明‘暂缺’或‘不适用’),数据内容的词法、句法的正确性(不应出现错别字符和不符合句法的语句)以及数据内容的表达是否符合国际、国内和行业的标准术语(赞无标准的应尽量按照行业习惯给出标准名称,如术语书外文翻译得到,应给出原文信息)。主要依据课题制定的“数据库著录规范”。

4. 数据库的计量标准

对数值型数据库要严格控制计量单位,计量单位要根据国家标准做出采用的具体说明。尤其是有统计要求的字段,计量单位一定要一致。对描述性字段的计量单位要尽可能统一。

5. 数据库的标引质量

根据质量控制小组提交的信息分类范畴和代码规范,标引信息范畴名称和代码(增设相应字段和标注内容)。根据国家标准文献主题标引规则审查主题词或关键词标引的科学性。主要依据课题制定的“数据标引规范”。

6. 数据库的特殊字符处理

数据库内容中的上下角标、数学公式以及其他特殊字符,目前无统一标准可循,但是每个库要一致,要有规范说明(质量控制小组尽快提交规范的特殊字符处理规定,这次检查,为制定特殊字符处理规范作技术准备)。主要依据课题制定的“数据格式标准”。

7. 数据库中的图形、表格的处理规范

目前库中的图形、表格采用外接方式,重点审查链接图形表格的关联词的标引质量。主要依据课题制定的“数据格式标准”。

8. 数据库文档的规范性

依据农业科学数据汇交计划和汇交验收凭证审核数据库文档是否齐全、格式是否规范,包括:数据说明(记录条数、数据量)、数据库描述(数据的种类和范围、数据库结构、数据字典、数据的质量说明、数据的保护期限、数据的科学价值和使用领域、其他)、数据使用说明(数据格式、查询方法、其他)、相关软件(查询、更新、下载、其他)以及应用情况(应用单位或个人、服务方式、应用证明、其它)等。

四、质量控制检查工作程序

1. 首先成立由5~7人组成的“数据质量控制检查小组”。人员构成包括课题负责人、数据库领域专家以及农业专业人员。

2. 成员组人员对数据进行定期或不定期的质量检查或抽查。由于数据库类型很多,根据数据库群的分布,质量控制小组又分成由2~3人组成的工作组,分别负责某一类数据群的质量检查。

3. 数据检查采用随机抽查方式,原则上数据库的记录在1000条以内的抽查30%;在1001~2000条之间的抽查20%;在2001~3000条之内的抽查15%;在3001~5000条之内的抽查12%,在5001~20000条之间的抽查10%;大于20001条记录的抽查2000条。

4. 质量检查组采取集中、封闭性工作模式,在3~4天内完成任务,每个工作小组对检查结果写出审查意见。

5. 集中一天时间汇总审查意见,并上交课题组织和管理部门,同时将审查结果反馈给各个之课题主持人对数据库进行及时修正。


(责任编辑:sjfzxadmin)