引言
“农业科学数据库”对所收录的数据采取两种标引形式,一是分类标引,二是主题标引。
1 分类标引
分类标引是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程,即对主题分析的结果赋予分类号检索标识的过程。“农业科学数据库”依据“农业科学数据库范畴分类表”对其收录的数据进行分类标引,见附表(“农业科学数据库范畴分类表”)。
1.1 “农业科学数据库范畴分类表”编制的基本原则 分类法是文献进行分类标引最主要的工具。《中国图书资料分类法》是为文献信息标引、存贮、检索而编制的大型检索语言工具书。其分类体系是以当代学科分类为基础,类目的确立和类目序列体现思想性、科学性和实用性,符合我国社会、经济、科技发展的特点。目前在国内有96.1%的各类情报与信息单位、图书馆、资料部门以该分类法为依据,进行文献信息的分类标引。有鉴于此,“农业科学数据库”的建库人员以《中国图书资料分类法》(第四版)为基本依据,结合考虑该库所采集数据在学科和专业方面的特点,以及进行信息组织和检索、建立网络信息分类目录的实际需要,编制了适合该库使用的“农业科学数据库范畴分类表”。
1.2 分类标引的基本程序
1.2.1 浏览文献 阅读题名、文摘或提要,必要时浏览全文,以明了文献的主要内容。
1.2.2 主题分析 对文献的特征进行分析,明确文献的中心内容,特别是文献的研究对象及其学科和专业性质等。
1.2.3 查表归类 根据文献主题的学科和专业性质,在“农业科学数据库范畴分类表”中选出与之相符的类目,确定分类号码。
1.3 分类标引的基本规则
1.3.1 以文献内容学科或专业属性为主要分类依据。
1.3.2 保持同类文献相对集中 相同学科专业的文献应选取同一类号。
1.3.3 不能单凭文献题名分类 除文献题名外,还应根据文摘、提要,甚至浏览全文来确定文献学科内容之深度、广度,以将其归入最准确的类目。
1.3.4 正确处理单主题、多主题文献分类 单一主题的文献应归入该主题的学科专业;多主题文献则在分析其各主题相互关系后,按其中最能代表文献内容本质或内容中起主导作用的主题学科归类。
1.4 分类标引的质量要求 分类标引质量的基本要求是准确性和一致性。
1.4.1 分类标引的准确性 分类标引的准确性一是指主题分析要准确、全面、充分地分析出文献研究的对象及其学科专业属性,准确地判断主要内容与次要内容,这是文献得以准确归类的前提。二是指归类要准确。根据文献主题分析的结果,将其归入“农业科学数据库范畴分类表”恰当的类目中,以保证获得分类标识的准确性。
1.4.2 分类标引的一致性 分类标引的一致性是指标引员对同一主题内容文献标引的一致程度。包括不同标引员之间标引的一致性;同一标引员在不同时间标引同一主题文献时赋予标识的一致性。提高分类标引的一致性,有助于集中同一主题内容文献,有助于提高检全率和检准率。
2 主题标引
主题标引是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程,即对主题分析的结果赋予主题词检索标识的过程。“农业科学数据库”基本参照“中华人民共和国国家标准 文献主题标引规则”(GB 3860-83),对其收录的数据进行主题标引。主题词主要选自《农业科学叙词表》。
2.1 主题标引方法
2.1.1 主题分析
2.1.1.1 文献的审读
审读是标引过程的首要步骤,其目的在于了解和判断文献所论述的中心内容和研究的对象,进而,确定文献的主题。
审读文献时,通常应依据文献的题名(书名或篇名)、前言、结论,目次,图表以及文献所附的文摘,简介、参考文献等,必要时应该浏览全文,但切忌仅依据题名进行主题分析。
2.1.1.2 主题的类型与结构
主题的类型,依据文献内容可分为单主题和多主题两种。单主题包括单元主题和复合主题(即多元主题),多主题则由几个单主题组成。
主题构成的因素及其序列可分为:主体因素(研究对象,材料,方法,过程,条件等)、通用因素、位置因素,时间因素、文献类型因素等五种。
在对文献进行主题分析的过程中,除需确定主题的类型与结构外,尚需剖析主题的中心部分、动态部分和限定修饰部分,以便对文献内容所涉及的主题概念进行精选与取舍。
2.1.1.3 主题分析的要求
(1)在精选主题概念时,应充分考虑读者的检索要求,分析选定对读者有实际意义的主题概念。
(2)对文献内容的主题分析,其范围与深度,应与文献内容保持一致。
(3)应充分考虑主题分析的全面性、专指性,最大限度地满足查全和查准的需要。
2.1.2 主题词的选定
对文献进行主题分析之后,标引人员应把分析出的有关主题因素的概念,依据如下标引规则和组配规则,转换为词表的主题词。
2.1.2.1 标引规则
(1)要直接地、客观地反映出文献所论述的事物或研究的对象与问题,切忌标引人员掺杂个人观点。
(2)选定的词,一般必须是词表中规定使用的主题词(即正式主题词),书写形式要与词表中的词形相—致。
(3)选词时,必须首先考虑选用最专指的主题词。一般不得用上位主题词或下位主题词标引。
(4)当没有专指的主题词时,则应选用最直接相关的几个主题词组配标引。
(5)如果组配仍无法达到要求时,应选定最直接的上位主题词标引。必要时,可选择一个适当的自由词标引。
(6)如上位主题词仍不合用时,可建议增补新的主题词。
(7)当某一主题概念,在词表已规定有组代主题词时,则应选用组代的几个主题词进行组配标引,不得另选其他主题词标引。
(8)自由词标引 对于词表没能及时收录的、具有较高检索价值的新术语、新概念,可作自由词标引;对于一些专指概念而主题词组配又不易于表达或容易产生歧义的词,可作自由词标引。
2.1.2.2 组配规则
在选用主题词进行组配标引的过程中,标引人员应遵循下列各项组配规则:
(1)组配标引时,应优先考虑概念组配,当给定检索语言不能进行概念组配时,才进行字面组配。所谓概念组配,是指几个相组配的主题词之间在概念上必须具有某种逻辑关系或语法关系。既不是单纯的字面组合,也不是随意进行组配。概念组配包括概念相交和概念限定两种逻辑关系。
(2)为防止多标识组配错误,必须选用与文献主题关系最密切,最邻近的主题词进行组配。切勿采用太泛指的主题词组配。
(3)组配不能越级组配。当能用某主题词来组配时,则不能用其上位或下位主题词组配。
(4)组配的结果,要求概念清楚、确切,只能表达一个主题意思。
凡组配的结果能同时表达几个主题时,可以改用下述办法标引:改用该主题概念的上位主题词标引;或改用靠词标引,或考虑增补新的专指主题词标引。
2.2 主题标引的质量要求
2.2.1 专指性(亦称专指度)
专指性是指主题标识与文献主题概念的相符程度。较高的专指度,有助于提高检准率,满足用户对特定主题文献的查找。
2,2.2 网络性(亦称标引深度、全面性)
标引深度指一篇文献被赋予主题词的平均数量。较高的标引深度有助于提高查全率。机检系统容量大,检索功能比较完善,检索速度也较快,因此要进行深标引,全面揭示主题内容,增加检索点,使读者从不同的角度检索到所需文献,提高查全率。
2,2.3 一致性
一致性是指标引人员对同一主题内容文献标引的一致程度。标引的一致性可以指不同标引人员之间的一致性,也可以指同一标引人员本身的一致性,即在不同时间标引同一主题文献所给主题词的一致程度。一致的主题标引可以使相同主题概念的文献集中在相同的检索标识之下,保证检索结果的查全与查准。
参考文献
1 中国高等学校自然科学学报研究会,中华人民共和国新闻出版署编.中华人民共和国国家标准 文献主题标引规则(GB 3860-83).编辑作者常用国家标准.北京:中国标准出版社,1990.129~130
2 中国图书资料分类法编辑委员会编.中国图书资料分类法(第四版).北京:科学技术出版社,2000.1194
3 侯汉清,马张华主编.主题法导论.北京:北京大学出版社,1991.352
4 冯彦平.文献分类标引的一致性要求.南京人口管理干部学院学报,2002,18(4):61~64
5 刘晓云.图书分类标引的质量控制.广东广播电视大学学报,2001,(3):77~79
6 李育嫦.网络环境下的主题标引工作.大学图书情报学刊,2003,21(1):73~75