浅谈数字化成果地质资料服务系统建设工作实践
2020-01-15 · 技术研发知识服务融合发展。
陆 浩1余运坤2
(1. 浙江省地质资料档案馆;2. 杭州瑞利声电技术公司)
摘 要 主要介绍了浙江省地质资料档案馆开展数字化成果地质资料服务系统建设工作中建设背景、建设目标、系统框架、关键技术、系统功能和应用效果等方面的建设实践。
关键词 数字化 成果地质资料 服务系统 建设
0 引言
浙江省地质资料档案馆作为省级地质资料馆藏机构,近年来从地质资料管理、图文地质资料数据库建设、社会多元化服务等多方面下工夫,在认真贯彻和加强地质资料服务体系建设、提升地质资料的现代化管理与服务能力、强化地质资料提供全社会一站式服务方面进行了一些尝试,对数字化成果地质资料服务建设工作开展了一些有益的实践。
1 背景
浙江省从 2001 年起开展地质资料图文数字化工作以来,馆藏成果地质资料图文数字化工作进展迅速,截至 2011 年年底,馆藏的 8429 种成果地质资料中,共有数字地质资料 8079 种,其中数字化地质资料4896 种,汇交有电子文档的地质资料 3183 种,馆藏地质资料的数字化率已达 95.8%;馆藏地质资料图文数字化意图基本成型,到 2012 年底,将实现全库地质资料图文数字化。届时,馆藏的成果地质资料中,图文数字化地质资料将有 5500 余种,为数字化成果地质资料服务系统的建设奠定了坚实的数据基础,也为开展此项工作提供了可能。
数字化成果地质资料服务系统建设,从管理角度看,实现了资料和档案信息的一体化管理,为地质资料管理提供了先进的技术手段,减少了工作人员繁重、重复性处理的工作量,降低了管理成本,提高了地质资料公共服务体系的信息管理水平。从利用角度看,可以直接利用网络方便查询和在线图文浏览,节约了时间和费用,大大提高了效率。从社会效益方面看,积极采用信息技术促进提升资料档案管理理念和改进资料管理手段,更有效地提高了信息资源的利用,促进了地质资料的社会化服务作用。
2 建设目标
在认真贯彻落实《国务院关于加强地质工作的决定》和国土资源部《关于建立健全地质资料网络服务体系的通知》精神,坚持“科学、高效、务实”的工作方针,遵循“统筹规划、统一标准、分步实施”的指导原则,以“资料管理法制化、馆藏管理标准化、地质资料数字化、管理现代化、服务社会化”为建设目标,以网络为基础、以内容为重点、以数据为核心、以系统为手段,建立数字化成果地质资料服务系统,实现按地质资料图文数字化规范形成和符合汇交地质资料要求的电子文本内容全文检索与定位,极大方便用户查询所需资料,解决地质资料查询不便的根本性问题,提高检索能力和服务能力,为建设“浙江省数字地质资料馆”的宏伟目标开展有益的探索和实践,逐步实现覆盖我馆业务管理、资料管理、资料利用和资源服务,实现资料汇交、整理、验收、保管、利用、销毁全过程档案生命周期管理,尤其是提高地质资料数字化、网络化、流程化一站式服务水平。
3 系统框架
数字化成果地质资料服务系统建设,采用 .net 开发平台 B/S(Brower/Server)架构,实现省厅、地质馆各部门业务信息化处理和无纸化办公,集地质资料汇交、接收、验收、入库、目录著录、检索、借阅、加工处理,以及三维虚拟库房展示体验于一体,根据需要能够形成相应的业务统计分析报表。
第八届全国地质档案资料学术研讨会文集
具体各功能模块说明,请见第 5 节描述。
4 关键技术
4.1 流程自定义
为适应业务管理和服务需求,系统提供强大的流程管理模块,采用完全符合 WFMC 工作流标准的工作流引擎,实现用户自定义各种流程表单、自定义流程步骤、流程动态干预、作业监控、流程审批。实现串行流、并行流、协作流三类复杂流程定义。
4.2 表单自定义
系统提供智能表单管理,采用 .net2.0+HTML 开发,实现“零编码”功能,轻松完成业务数据定义(表单:提供创建和管理智能表单的功能,包含表单权限、表单验证表达式、绑定流程等;表单字段:管理表单字段信息,包括字段的类型、验证信息、计算表达式、数据信息、控件类型等),满足复杂变化要求。
4.3 双层 PDF 文件技术
为了更好地利用地质资料资源,提高数据利用率,采用双层PDF技术(PDF文件的每一页都包含两层,上层是从纸质文件扫描的原始图像,下层是用 OCR 软件对扫描图像进行识别后产生的文字结果),保留资料原始版面效果(包括公章、签名),实现对下层的文字信息选择、复制、检索等功能。与普通 PDF文件相比,双层 PDF 同时兼顾视觉效果和检索方便性,极大地方便了电子资料的管理和利用。
4.4 全文检索技术
全文搜索引擎,是通过索引服务器全文管理并建立多种格式的文档(纯文本、htm 格式、office 系列文档格式,以及隐藏于文档中的不可见的属性等)和扫描文档检索机制,用户只要提供关键词或其组合,采用图文全文搜索引擎进行全文搜索,可快速查找到所需的扫描文档。
4.5 大容量文件传输技术
基于地质资料图件容量大的特点,基于 .net2.0 采用 HTTP 协议进行加密传输,无需任何客户端配置,可上传小于 1G 的文件,提供进度条显示实时上传进度。
4.6 三维虚拟现实技术(Web 3D)
Web 3D 技术是虚拟现实技术的一种实现形式,是基于 internet 的、依靠 VGS(一种基于浏览器的三维网页实现方法)实现的桌面级虚拟现实技术。它主要包括建模技术、显示技术、三维场景中的交互技术三大部分。
5 系统功能
数字化成果地质资料服务系统功能模块,包括业务管理、采集管理、资料管理、资料利用、三维库房、信息发布、运行维护等。
第八届全国地质档案资料学术研讨会文集
5.1 业务管理
接收管理,详细记录各单位汇交的地质资料明细,包括移交日期、移交内容、补交内容、移交人员、通讯方式,备注;生成资料汇交表,允许多次移交。
验收管理,安排人员对各汇交资料核对,检查汇交内容、质量、数量,对不符合要求的资料予以退回完善。
分类管理,提供馆藏资料分类,可以按工作程度、报告类别等多种分类形式管理。
收费管理,对提供各单位或个人的服务,按章收取适当的费用。系统记录每次服务对象、服务内容、数量,以及费用。支持多项组合统计,生成收费项目汇总表。
手机短信,对汇交资料审核后的结果(修改通知、补交通知、通过通知)第一时间告知单位移交人员,提高信息传递效率。
单位维护,完成资料汇交单位信息管理,具体包括单位名称、法人、通讯地址、邮编、资料员、联系电话、传真、E-mail。
5.2 数据采集
数据著录,应提供表格式操作界面,有添加、删除、修改、复制、移动和设定数据格式等功能,自动生成资料编码(允许修改),能有效地减少著录的工作量,提高录入效率。
资料审核,对用户自行录入、批量导入的临时库中的资料数据进行审核,修补。
临时库管理,用于暂存多种方式采集的各类数据,资料员逐一校对,对符合要求的数据审核入预归档库管理。
批量导入导出,提供多种方式导入导出功能,方便与其他系统交互,满足使用。
5.3 资料管理
预归档库管理,建立资料三审工作机制,临时库数据经校对后进入二审预归档库管理阶段,设定资料的密级、保管期限等信息。
资料库管理,通过审核无误的地质报告、资料等重要档案数据集中,对每份资料的封面、正文、审批、附图、附件、附表及其他资料等七大类系统的全面管理。支持关键字检索、分类检索、高级检索、全文检索、递进检索等多种查询方式,生成数据汇总报表,并以柱状图、饼状图等显示。
全文管理,由系统自动建立文件内容索引库,对汇交的电子资料(.doc、.exl、.ppt、.pdf 等格式)和按地质资料图文数字化规范制作的已经数字化地质资料文件(双层 PDF 格式)实现全文内容管理,通过全文全息搜索引擎,高速检索文件。
特殊介质管理,对光盘、软盘、磁盘、录音带、录像带等磁介质资料实施统一管理,包括名称、摘要、数量、内容、移交单位、移交时间、备注等。
授权管理,对资料库档案严格操作权限管理,按密级要求对资料的目录、封面、正文、审批、附图、附件、附表、全文等开放,内网系统各部门用户权限设定后,归档的资料自动符合工作权限查询和利用,无需逐一授权。要求系统提供缺省授权、标准授权、密审授权、临时授权四类授权管理方式。
流程监控,对用印管理,资料的工作权限申请,借阅、复印、打印办理等程序动态监控,必要时管理员可以进行干预、调整。管理员可以清楚了解每一流程的状态、当前流程步骤、操作人员、流程周期、发起人、审批人等。
关联管理,要求对有必然关系的两个或多个文件建立人工关联,查询时自动罗列所需文件的关联文件,方便用户了解有关内容。
借阅管理,为管理员提供资料的借阅申请、办理、催还、续借、归还等过程管理,记录申请人、审批人、经办人、办理时间、催还通知、续借次数、归还等总体情况,便于备查。
库房管理,主要是针对库房内硬件的资源管理,做到系统数据和库房内实物信息内容一致,记录设备的采购时间、供应单位、供应商评价、设备使用年限、责任人、年检信息、报废到期预警等重要内容。
销毁管理,对符合销毁条件的资料文件启动工作流程,经领导审批后销毁处理。系统保留销毁历史记录。
5.4 资料利用(内网)
目录检索,提供用户馆藏资料目录级检索,了解资料的基本信息,知晓有无电子原文件和扫描文件等。有权限的用户可以直接在网上全文浏览,没有操作权限者可依据工作需要提出申请。
全文检索,为用户提供资料内容全文检索,录入关键字可以找到具体的文件,快速列出符合查询要求的文件,并显示具体文件的文件编码、文件标题、责任单位、移交人、经办人、库位号、借阅信息等数据。
递进检索,对符合查询条件的结果,进行二次检索,方便用户更快获取所需文件资料信息。
借阅申请,用户因工作需要对资料启动借阅流程,支持单份资料、多个资料一次性借阅申请。系统保留包括公开的和涉密的借阅申请详细记录,对于涉密地质资料需求,要求用户递交介绍信、身份证原件及复印件、《涉密地质资料借阅复制证书》等材料扫描进入系统记录,审核通过后为用户提供服务,建立涉密地质资料利用台账。
复制管理(含电子文档复制和纸质资料复印),系统登记用户资料的复制服务,录入每次复制时间、复制内容、数量、费用、经办人、备注,对于涉密地质资料,自动建立所复制涉密地质资料的详细表单并打印后由利用人签字确认。可以查询某一时间段、某一用户、某一份资料的复制情况。
打印管理,系统登记用户资料的打印服务,录入每次打印时间、内容、数量、费用、经办人、备注。可以查询某一时间段、某一用户、某一份资料的打印情况。
订单服务,由系统登记用户单位通过电话、传真、邮件、邮寄等多种方式订购的地质资料订单信息、服务费用。对于公开的地质资料采取复制方式,采用邮寄送交用户。
专题服务,用户通过内网平台、外网向我馆提出特殊要求的地质资料利用服务需求,递交必要的材料审核后,安排与用户协商并签订服务协议。
信息统计,要求系统提供数据著录统计、分类统计、年度归档统计、历年统计、借阅统计、复制统计、打印统计、订单服务和专题服务统计等,并以图形化界面展示利用情况。
5.5 三维虚拟库房展示
采用 WEB 3D 技术将资料馆库房 1∶1 建模,提供馆内人员网上虚拟漫游,可对来访单位生动形象地介绍馆藏设备和资料库结构,其具备多感知性、沉浸感、交互性、真实性等特点,给人“身临其境”之感。与此同时,库房的温湿度数据和门禁数据直观在线显示,极大地提高了了解库房在用条件效率,避免意外发生。
5.6 信息发布
资料管理员结合工作实际,将符合社会化查询要求的资料(资料目录、资料全文)对外发布,供网络化查询、浏览。
5.7 运行维护
为保障系统运行,灵活设置系统的部门机构、用户、角色、权限,提供用户自定义资料档案的编码和工作流程,保留系统登陆和数据操作的详细日志。功能包括:部门管理、用户管理、功能设定、权限管理、流程管理、编码设置、数据备份、日志管理和系统接口。
6 应用效果
地质资料服务系统建设是一项长期、复杂的系统工程,依托信息网络技术开发软件系统,为我们的管理和服务工作带来便捷。通过近两年时间的摸索和实践,我们已初步实现成果地质资料汇交、接收、验收、入库、保管、利用、销毁等的一体化、一站式、全景化管理。特别是在借阅利用服务方面,为社会企事业单位或个人直接进行自助查询和浏览资料提供了快速通道,减少了办手续等候时间,提高了服务效率,得到了借阅单位和人员的一致好评。
6.1 目录查询检索效果
在如今资料借阅服务的过程中,外单位用户进入系统,根据需求输入关键词即可轻松找到相应资料;可以通过“递进检索”缩小查询范围,快捷获取资料信息 ,资料目录显示一目了然。通过较长时间的使用体验,用户普遍反映系统能够方便、简捷地查找资料,不会出现繁琐或重复查找、不方便查询检索等现象。
6.2 资料借阅利用效果
用户普遍认为,从完成目录检索,到提出“申请借阅”,用户可批量选择待借资料目录,审批通过后进入独立的浏览界面,报告和大图互动查看方便。系统人机界面协调,符合通用的电脑使用习惯,即使一开始不熟悉如何使用,略加熟悉,自然会用,查阅方便。按照资料管理规定,公开性资料系统提供在线浏览,并能集中提供多份资料,节约了时间,提高了查阅效率,对用户的工作具有很大的帮助及意义。
经过近两年的应用,用户对系统给予了充分肯定,认为系统运用方便,特别对刚到一个新的工作区域,需要大范围多种类查阅资料时显得尤为便利,系统较好地解决了同时查询大量资料的需求,资料目录和内容全文阅读方便,图件数据清晰,参照对比资料实用,快速查阅有效信息。
6.3 下载复制效果反馈
用户认为系统下载功能实用,对所需资料只要打勾和点击“下载”,不需要麻烦工作人员找出电子光盘,导出数据再刻盘的步骤操作,避免浪费时间,下载后导出数据即可刻盘,极大地方便了用户复制需求。
7 几点结论
(1)通过引进系统管理新手段,提高了浙江省馆的地质资料管理服务的现代化水平,工作质量提升明显。
(2)通过系统的开发利用,使地质资料图文数字化的成果得到充分利用,体现了地质资料图文数字化工作对提升地质资料服务现代化、重要且深远的意义。
(3)通过系统的开发利用,使地质资料实现优质高效的服务有了一个坚实的落脚点和平台,为国土资源部提出的地质资料要作为地质工作服务社会经济发展的有效载体提供高效服务进行了有益的实践,为今后继续推进地质资料现代化建设积累了经验,探索了路子。