实物地质资料信息采集
2020-01-19 · 技术研发知识服务融合发展。
(一)信息采集目的
实物地质资料馆藏机构通过进行数据分析和用户需求分析,多角度、全方位、科学采集信息,合理设置检索点,满足用户快速搜寻信息的需求,提高查全率和查准率。
用户的检索方式有3种:①文献检索,如我国保存了哪些卡林型金矿的实物地质资料,这些资料在哪里;②数据检索,用户需要的是确切数据,如紫金山铜金矿矿床规模(储量等);③事实检索,用户需要的是特定事实,如我国实物地质资料保存状况等。
(二)信息采集要求
采集信息要考虑以下两个方面的因素。
(1)用户类型:当前在各个社会活动领域中,实物地质资料的主体用户群体是地质勘查人员,科学研究人员、管理决策人员和矿权营销人员;在上述各类用户中,根据行业和专业又可细分为不同的小类,如科学研究人员包括了诸如岩石学、地层学、古生物学、矿床学等等不同专业的专家,不同专业用户无论在范围、层次还是质量上有不同的信息需求。
(2)信息层次:实物地质资料的信息是多层次的,如时间地层单位有界、系、统和阶4个层次;构造分区有全球构造分区、一级构造分区、二级构造分区;成矿带有Ⅰ、Ⅱ、Ⅲ级之分等。
用户类型多样性和信息的多层次性对实物地质资料信息内容的采集提出了较高的要求。
针对第一个方面要求,在信息采集时,必须考虑不同领域、不同阶层、不同专业用户的需求,采集多维多元数据。尽管现实的数据可能不全,但应该尽最大努力补齐这些数据,这也是在实物地质资料采集时要求其相关资料完备的一个原因。如西藏某图幅的一块斜辉辉橄岩标本,其原始记录除了必要的描述性信息(图幅名称、产地、所在剖面、采样位置、采样时间、采样人等)和简要的数据信息(岩石名称、岩性描述等)外,缺少侵入时代、岩体名称、构造位置等信息,对于岩石学研究来说,显然已有的信息是不够的。通过相关报告和文献的研究,确定了侵入期为喜马拉雅期,构造位置为雅鲁藏布江断裂带南侧,这样就丰富了这块标本的信息内容,在用户以侵入时代为检索点搜寻喜马拉雅期岩石标本时,就能快速地查到它。
针对第二个方面要求,在信息内容采集时,必须考虑信息层次的深度。这种深度影响着信息检索的准确性。一般来说,信息表述的层次越深,查准率越高。例如,用户需要查询山西大同早石炭世地层标本时,如果在信息采集时,采集层次定得过浅,地区定在省级,时间地层单位定在系级,用户的检索结果就包括了所有山西石炭纪地层,从数量上看,与用户的需求相关性偏差太大,影响了查询准确性,降低了查询效率。
(三)信息采集对象
采集对象是指实物地质资料信息描述的对象,它是信息承载的最小单位,同时也是最小信息资源标识。信息资源查询的结果最终是这个最小标识,通过这个标识,用户就找到了所需资料的存放位置。采集对象选择是有层次的,采集对象也是有大小的。层次和大小的选择依赖于用户检索的需要、依赖于资料的内容特征、依赖于仓储条件与设备条件。
从用户的角度来看,不同的用户有不同的要求。如果仅仅以单个矿区为研究对象,分析矿区资源潜力的用户,则对资料的检索需求仅仅是了解该矿区的实物地质资料有多少,存放在什么地方,保管利用条件如何,这种需求只要把一个矿区作为一个采集对象即可。对于地层学家来说,如果想了解某一地质时期地层岩石组合,则对资料的检索需求可能是某一标准剖面某一组的地层标本有多少、存在什么地方,这时就得把一个标准剖面甚至一块标本作为一个采集对象。
从资料的内容特征来看,内容单一的可以在较高层次上适当扩大采集对象,内容复杂多样的应在较低层次上尽量缩小采集对象。例如,“三峡水库引水工程秦巴段地壳稳定性调查评价”项目,施工了一个601.66 m的钻孔,全孔岩心均采自大竹山沟燕山期花岗岩体内,岩性单一,均为角闪二长花岗岩,仅有风化程度和粒度的细微差别,信息采集时,以整个项目作为一个采集对象,对应一份信息描述记录表。再如1∶25万苏吾什杰幅区调项目,国家库保管了7条剖面的296块标本,它们分别代表了该区不同时代、不同构造部位的地层和侵入岩,这些标本每一块都有其独特的地质意义,如其中的一块榴辉岩标本是高压区域变质作用的产物,代表了该区强烈的区域变质事件,反映该区经历强烈的板块运动,如果以一个图幅为对象采集信息,该信息有可能被掩盖,不能被迅速检索到,针对这种情况,需要以单块标本作为信息采集对象。
从仓储条件来看,不同的库房有不同的基本保管单位。国家实物库主要以岩心箱为基本保管单位保管岩心,以一个货位为一个存储单元,每个货位可容纳12个或18个不同规格的岩心箱,实物地质资料的出入库以一个货位为单位。当用户需要这个货位一段岩心或一块标本时,必须将整个货位的实物地质资料全部取出。从库房管理的角度,一个岩心箱或一个货位的实物可以作为一个信息采集对象。
从设备条件来看,信息采集对象的大小要与设备的数据处理能力相匹配。一般情况下,采集对象越小,采集的信息量就越多,同时对设备的存储能力、数据处理能力的要求越高。
(四)信息采集步骤
(1)确定采集对象:通过对资料信息内容的认真分析,从用户检索信息的需求出发,结合资料保管情况,分不同的层次确定采集对象单元的大小。从而保证采集的信息有不同的层次和不同的详略程度。
(2)准备信息源:信息源即进行信息采集时描述信息的来源和出处。实物地质资料采集的信息源主要来自实物及相关资料以及实物整理信息、入库保管信息等。
(3)填写信息采集表格:从实物地质资料信息多维多元性考虑,该表格是多维表格,数据项设置主要考虑各专业的需要。
(4)实物表面信息采集:主要指的是实物表面图像扫描和立体照相。目前国家实物库开展了岩心表面彩色扫描,提取了岩心表面图像。
(5)数据存储:指的是将采集的信息录入或导入实物地质资料信息系统。
2024-10-16 广告