时间:2023-03-20 16:21:11
序论:在您撰写数字档案论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
【摘要题】数字信息化
【关键词】数字档案/信息安全/互联网
【正文】
1.数字档案网络化应用的安全问题
数字档案的产生、移交、归档、管理和利用都是基于互联网、专用网和局域网环境下进行。系统的应用模式主要采用两种方式(即基于浏览器的Browser/Server结构和基于客户服务器模式的Client/Server结构),这两种方式都可以实现网上对档案信息的转换、存贮和访问。在数字档案的归档、管理和服务利用等过程中,档案数据的安全问题往往表现在多个层面。
1.1网络级安全。是指支撑系统运行的物理设备的安全问题,包括网络基础建设如网络布线、网络联接、局域网和广域网环境的构建、设备的选型及其各个环节安全策略的考虑。往往会根据需要采用适当的防火墙设备及网络管理软件来确保局域网的内外用户的访问权限和网络上数据包的检测与过滤;选用可靠的硬件安全设备保证整个系统的稳定运行,如双机热备份、磁盘阵列等设备的采用来保证一台服务器出现故障而不会导致整个系统的瘫痪问题,等等。网络级安全策略是整个系统得以安全运行的基本保障,这是需要在系统规划阶段严格把关的重要内容之一。
1.2数据级安全。主要是指涉及到系统存贮的档案数据的安全问题,包括操作系统、数据库管理系统、档案数据存贮、数据备份、数据格式的转换以及各类电子文件的保管和异地存贮策略等,以防止数据版本的更新、数据格式的转换、硬件设备的意外损坏、存贮介质的老化、失效、自然灾害等造成的数据丢失、数据损坏甚至是计算机系统的破坏和瘫痪。操作系统和数据库管理系统的安全问题虽说主要是取决于软件供应商所开发的商品化软件的稳定性和安全的保障问题,但对于建立网络化档案管理信息系统,首要考虑的是选择什么样的操作系统来确保应用系统的安装和运行,目前主流的操作系统有Unix、Windows和Linix,他们各自有其优越性,安全问题也各有特点,关键是如何选择满足用户实际需求的操作系统和数据库管理系统。当然考虑档案元数据的存放规则和保管策略也是本阶段非常重要的问题之一,如数据库的分布式或集中式存放模式、数据的异地备份、电子数据格式的定期升级和保存介质的更换等,需要一定的保管制度来约束。这些都是在系统设计和具体实现的过程中需要综合考虑的关键因素,也是档案应用系统能够安全运行的根本保障。
1.3应用级安全。是指档案管理信息系统在实际应用操作的过程中应考虑的基本问题,主要取决于档案部门所采用的应用系统的用户模型的定义模型和使用规则。一般情况下,档案管理信息系统的用户模型分多个层次、多个角色、多种功能或多种形式混合使用,来分别定义用户权限。系统常常按功能权限划分为系统管理、数据操作和数据浏览等3大类用户:每类用户角色的定义可以按照各业务职能的实际需求,对其操作权限和操作功能进行定义,如单位领导、部门领导、普通业务员等。但不论采用哪种用户模型,要求应用级的安全至少包括两项功能,一是对系统中各个功能模块的操作权限的定义,另一个是对系统数据的分层管理和操作权限的定义。比如,两个不同的用户可以操作同一个功能模块,但所能看到的数据只能是本用户所在单位的数据,而不应看到另一个用户所在单位的数据,这是网络版档案管理信息系统的基本操作需求;再如上级领导能够看到下级人员所操作的数据,而下级人员则无权看到上级领导权限范围内的数据。
2.网络基础环境的安全技术方案
网络基础环境的安全建设是防止系统外部非法用户和不安全数据包侵犯的主要措施,常常采取的主要方法是物理隔离、应用防火墙以及身份认证等安全技术。防火墙技术是实现内外网的隔离与访问控制的最基本、最流行、最经济的、也是很有效的措施之一,这里以防火墙为例来讨论数字档案的网络基础环境的安全解决方案。
2.1防火墙安全解决方案。
防火墙是多个网络之间的安全隔离网,其基本原理是设置安全策略,控制(允许、拒绝、检测)出入网络的数据包,它本身具有较强的抗攻击能力,可以实现以下几种安全功能:一是限制未被授权的用户进入内部网络,过滤掉不安全的数据包;二是防止入侵者接近本系统的防御设施;三是限定内部网络用户访问特殊站点;四是为监视Internet安全提供方便。清华大学档案馆防火墙安全运行结构采用了三台对外提供服务利用的服务器,都部署在非军事管辖区(DMZ区),服务器通过特定的端口对外提供服务,如Web服务的8085端口,数据服务的1528等,避免了外界用户对服务器其他端口访问的可能性。如果少数的档案室需要数据服务器特别指定用户,可以采用防火墙用户认证及用户规则来限制,这样除了经过已认证的用户外,所有本局域网以外的用户在访问内部网络时都需要通过防火墙进行过滤和筛选,具体使用时可以通过对客户端IP地址或者网卡的MAC地址进行判断和识别,以及通过对可疑数据包的检测进行过滤,以保证整个网络系统的安全运行。
这种链接方式是采用了防火墙的路由模式来实现的。档案馆内部的办公PC统一使用内部定义的网址如192.168.X.X,为私有IP,通过防火墙的NAT功能访问互联网,保证了安全性。外界不能直接访问到档案馆内部的PC,减少被攻击的可能性;提高了可管理性,所有PC都可以实现MAC地址绑定,可以针对需要控制内部用户的上网时段和访问内容。
2.2网络安全管理的人文策略。
硬件设备和网络管理软件是保证网络安全运行的基本手段,同样加强网络的安全管理,采取科学有序的管理策略也是非常重要的人为因素,往往诸多的不安全因素恰恰反映在组织管理和防范不当等方面,因此必须引起足够的重视。
系统管理员采用双人负责制和任期有限的基本原则,防止人员流动或缺岗造成损失,避免职位垄断或由于时间过长。
安全级别确定应根据工作的重要程度来确定,根据确定的安全等级,确定安全管理的范围。
制定的机房管理制度:对于安全等级要求较高的系统,要实行分区控制,限制工作人员出入与己无关的区域。出入管理可采用证件识别或安装自动识别登记如门禁系统,采用磁卡、身份卡等手段,对人员进行识别、登记管理。
制定严格的操作规程:操作规程要根据职责分离和多人负责的原则,各负其责,不能超越自己的管辖范围。
制定完备的系统维护制度,如数据保护,数据备份等工作计划。重要数据维护时要首先经主管部门批准,并有安全管理人员在场,随时将出现故障的原因、维护内容和维护前后的情况要详细记录。
制定应急措施,保证紧急情况下,如何尽快恢复的应急措施,使损失减至最小。建立人员雇用和解聘制度,对工作调动和离职人员要及时调整相应的授权。
3.档案管理信息系统的安全方案
数字档案信息的录入和维护主要依靠管理信息系统所提供的各项功能来完成,由于用户角色的不同,权限的差异,要求应用系统能够提供一套完整的用户安全管理策略,以保证档案信息的完整性和安全性。档案管理信息系统的安全管理主要体现在3个方面。一是要采用成熟先进的计算机应用系统运行结构:二是对系统用户按照工作需要进行角色和等级的区分;三是对档案数据的安全管理级别如保密、开放等状态按照档案法规定和实施细则进行多级安全管理,以区别不同类型用户的访问。
3.1应用系统的体系结构。
三层Browser/Server体系结构有着多层数据安全机制、日常维护工作量小、对客户端的运行环境要求也比较低(只要有浏览器即可)、客户端物理位置可以灵活设置等诸多优点,因此采用三层B/S的系统结构无疑是一个先进且明智的选择。安全防护措施有三级,即防火墙安全措施、应用系统的身份认证安全措施以及数据库管理系统的安全模型,
3.2应用系统用户权限管理:
系统用户权限的管理和角色分配与档案管理的业务功能、操作流程、档案数据的管理层次密切相关。一般情况下用户分3大类,即管理级用户、业务级用户和浏览级用户。管理级用户负责系统整体数据备份,日常维护,系统模块设置、公共字典维护、用户定义及用户权限设置等;业务级用户负责各个业务岗位上数据的录入、修改、删除、统计、检索等功能,该类用户对系统中的数据具有完全的存取访问权限,每个用户的操作功能和访问数据内容的权限将根据其业务职能的不同而有所区别;浏览级用户主要是通过Internet网查询已经开放的档案信息,绝不允许对系统中的数字进行修改和删除。无论是哪一类用户,他在访问系统的过程中主要是通过严格的身份认证技术来保证系统的安全性。因此系统用户的安全管理也是非常重要的。各业务人员在操作过程中切不可将密码帖在机器上,或者设置非常简单的密码,这些都是不利于安全管理的常见错误做法。
1.1基于管理能力和技术水平的人为风险
除了基于计算机技术特性的档案数据风险,数字档案管理者的管理能力和管理水平也是要加以重视的一项风险因素。由于我国档案数字化建设是近些年才逐步发展起来的,因此,与之相关的法律、法规并不完善。在档案数字化进程中,从电子文件的形成到归档保存,都应该有严格规范的程序管理、科学统一的标准体系和业务管理制度,而现实上却并非如此。一般来说,档案数据灾难发生的可能性微乎其微,这样就造成了档案管理人员的麻痹大意和侥幸心理,还由于防范数字档案风险的成本较高,出于经济方面的考虑,很难为了提高数字档案的安全性投入过高的资金。此外,因为档案管理系统是多用户、多管理的系统,如果管理不善或者管理人员的操作失误,很可能导致数字档案载体的损害及误删除、误覆盖、恶意篡改、越权访问等安全事故的发生。
1.2基于自然灾害的档案数据风险
对于那些突发的灾难,如火灾、雷电、水灾、飓风、地震等,一旦发生,其破坏程度非常高,范围广,而且几乎没有预见性,很难进行预防,因此,无论是对实体档案还是数字档案来说,其破坏程度都是难以估量、极具毁灭性的。
2数字档案安全管理策略
2.1构建行之有效的数字档案安全管理机制
首先,要贯彻前端控制思想。在数字档案安全预防措施中,前端控制是重要内容,实现事前预防、未雨绸缪,把灾难控制在萌芽状态。在建设数字档案馆的设计之初,就要对档案馆的抵御灾难方面的设计重点考虑,并且合理制定数字档案的操作规程,进一步完善应急预案、抢救预案等配套措施。为了防止由于软硬件升级过快所带来的读取问题,在选择设备时,要选择技术成熟度高的档案管理软件和普及程度高的数字档案存贮介质。对于档案技术力量进行合理配置和储备,不断地对数字档案运行环境进行优化。通过前端控制的方法,可以有效地提高数字档案保存和维护的稳定性。其次,要开展日常维护、灾难备份、恢复和抢救等活动在内的全程管理。全程管理贯穿数字档案整个生命周期,通过有效的全程管理,对数字档案安全实现全程监测。最后,要对数字档案安全管理机制进行后续监督和评价。划定数字档案安全评价系统的范围,选择适当的评价方法和评价指标,对有关数据进行收集、统计、分析,根据评价结果,不断地进行改进,从而提高数字档案信息安全管理体系的有效性,提高具体过程的效率,让数字档案信息更加保密、完整、易于使用。
2.2加强数字档案管理的人力资源建设
要建立健全安全审查制度、岗位安全考核制度、安全培训制度,加强安全管理制度的培训和考核。数字档案是由人来进行管理的,因此提高档案人员的个人素质、业务能力以及提高安全意识是档案管理工作的重心。只有安全意识提高了,档案人员才会对数字档案工作真正重视起来,杜绝麻痹大意的思想,自觉遵守各项规章制度。对于管理操作数字档案信息内容的档案员,尤其要加强安全保障技术的培训。
2.3采用安全有效的技术手段与措施
2.3.1对数字档案进行异质转换所谓数字档案的异质转换,就是把数字信号转换成文字、图像、声音等信号,把数字档案转换成纸质档案、缩微胶卷、声像档案等,即异质转换或异质备份,对于重要的数字档案,这是对其长期、安全防护的有效途径。因为其脱离了数字信号的局限性,读取时不再过多地依赖设备和技术,读取方便,因此适合长期保存。经过异质转换的档案,脱离电子设备和环境,信息安全性提高,不易丢失。信息被"固化"到新的载体上,不仅避免的人为篡改的可能性,还可以对母本信息的真实性加以检验,甚至可以用来作为校正其母本的真实版本或可靠版本,成为真正意义上的档案。2.3.2对数字档案进行迁移新型信息存取设备对旧型档案载体的不完全兼容性导致了必须采取数字档案迁移的措施。计算机设备和软件正以飞快的速度进行升级、换代、淘汰,几年甚至几十年后,现在使用的设备就会被完全淘汰,不复生产,最终消失。以此,必须处于淘汰期的旧电子档案信息存取设备进行储备,用于迁移或载体转换时读取旧型档案载体上的信息。此外,新/旧信息存取接口转换设备也是要考虑的一项,如IDE/SATA接口转换器,接口转换设备可以有效延长旧型信息存取设备的生命周期。2.3.3对数字档案进行同质备份建立由数据备份系统、备份数据处理系统和完善的灾难恢复计划组成的备份与恢复系统。天灾人祸的发生难以预见,但是可以通过一系列措施,将灾害的破坏程度降到最低,甚至完全避免。数字档案信息的备份就是一个行之有效的措施,通常采取静态备份和同步备份相结合的方式。静态备份用以保证历史信息的完整,可以离线异地保存历史记录。同步备份用以保护当前系统的所有数据,适用于硬盘数据恢复、网络数据恢复、数据库修复等灾难数据恢复。2.3.4加强信息安全新技术的应用数字档案安全包括很多方面,其中最重要的就是档案信息的安全性和完整性。完整性即是要防止数字档案信息被篡改或丢失,安全性则是要防止内容被非法用户获取。电子签名技术和数据加密技术是保障档案信息内容安全的有效手段。电子签名技术能够可靠地保证自形成时起,内容保持完整、未被更改。目前最成熟的电子签名技术就是“数字签章”;加密技术主要涉及加密、解密算法和密匙,数据加密技术可以保障数字档案信息的安全性和保密性。
3结语
人是推动数字档案建设发展的动力,也是影响数字档案信息安全的关键因素之一,数字档案信息管理人员的安全意识、安全技能等将直接影响数字档案信息的安全。当前,影响数字档案信息安全的人为不当因素主要有:一是管理人员安全意识淡化。不少从事数字档案信息管理的人员对安全管理的重要性认识不足,过分依赖安全技术,认为只要配置了安全防护策略、安装了防火墙和杀毒软件,就能保证数字档案信息的安全,而没有意识到在确保数字档案信息的安全中,技术因素只降低安全风险,人的安全意识才是最重要的因素。二是管理人员对新技术应用能力的不足。区别于传统档案管理,对数字档案信息的管理更多的要借助计算机应用软件来完成,这些应用软件能够大幅度提高办公效率,但在使用过程中难免会出问题,如果操作人员缺乏应用的处理能力,将会造成数据信息的丢失,从而数字档案信息的安全。
2数字档案信息标准尚不健全
目前,影响数字档案信息安全最大的瓶颈问题就是标准的不健全,造成这一问题原因主要有:首先,从横向上看,部门与部门、单位与单位之间的藩篱,影响标准的统一性。国家档案局虽然出台了《档案管理软件功能要求暂行规定》、《全国档案信息化建设实施纲要》、《电子文件归档及电子档案管理规范》等文件标准,但总体来看,这些标准要求相对比较宽泛,缺乏可操作性,并允许各单位根据实际情况进行再次开发设计,降低了统一的规范性要求。不少单位就自搞一套,而相互间兼容性又不够,导致数字档案管理系统的通用性、共享性较差,无法实现单位间档案信息的无缝交流,甚至出现“信息孤岛”现象,如若该单位发生灾害等情况时,档案信息很难恢复重建,严重影响数字档案信息的安全。其次,从纵向上看,不少单位为追求上项目、造声势,开发出管理软件没有充分考虑信息技术发展带来的影响,一些看似当前管用、可用的管理系统,若干年后很难保证还可以继续使用,若要重建或并入其它系统,原有档案信息的格式多种多样,很难保证在新系统中全部继续可用。
3数字档案信息网络系统自身的安全漏洞
各种信息网络系统都不同程度地存在有一些漏洞,给信息管理带来安全隐患,数字档案网络系统也不例外,其自身的安全漏洞严重影响着数字档案信息的安全。其一是网络通信协议的安全漏洞。多数档案信息网络是依托开放的网络平台,所使用的网络通信协议如TCP/IP协议等,也是大家所熟悉的,但这些协议大多带有安全漏洞。其二是各类软件的安全漏洞。档案信息网络所采用的系统及应用软件,在开发过程中不可避免地都会存在一些漏洞,有些甚至被故意安置一些后门,这些后门和漏洞极易被黑客所利用,造成对数字档案信息的扩散、盗取、篡改等,严重时可导致整个系统的崩溃与瘫痪。其三是感染病毒。为方便信息查询和利用,档案信息网络系统都提供有用户登录功能,有的还能自行下载保存档案信息,这也为计算机病毒的传播提供了便捷途径,加之有些系统的防病毒措施不完善,很容易造成病毒的快速传播,给数字档案信息系统造成较大的安全威胁。
4存储介质的选择及保存环境不当
数字信息存储技术快速发展,使得存储介质的存储容量不断翻新,而不同类型的档案信息对介质的要求也不一样,因此存储介质的选择成为了其中的关键。如何选择存储介质,也没有绝对的标准,为了能使数字档案信息长期安全地保存,应根据数字档案信息自身的特殊要求,正确选择符合实际、质量过硬的存储载体。但有些单位在选择存储介质时,没有全面考虑档案信息的自身要求,更多由于受经济承受能力的制约,选择一些所谓"质优价廉"的产品,对存储在其中的档案信息造成极大威胁。存储数字档案信息的载体多为光电介质或磁电介质,这些载体对环境的适应力较差,受温度、湿度、磁场强度等外部因素影响较大。因此,保存数字档案信息的载体对物理环境的要求比传统档案保存环境更加苛刻,应满足恒温、恒湿、避免腐蚀性气体、远离静电及磁场干扰等条件。但不少单位缺少这样的环境条件,只能将这些载体置于普通环境中,这就加快了其老化速度,容易出现各种故障,使存储在其中的信息读取不出来。
5数字档案信息管理法规的不完善
1.宏观管理模式
(1)集中管理模式。数字档案馆档案信息资源建设的集中式管理式档案工作域信息资源建设发展方面具有关键作用。一是通过集中管理模式能够使得数字档案馆的信息资源建设具有一定的计划性使档案馆档案信息资源成为一种资源整体捉进其合理利用与开发二是数字档案馆通过集中式管理模式能够对其信息资源建设进行有效控制监督档案馆各级信息资源建设的具体行为规范工作流程保证数字档案馆信息资源的可持续发展。但是集中式管理模式在一定程度上使得档案信息资源建设缺乏一定的创新性。
(2)分散管理模式。数字档案馆档案信息资源的分散管理模式具有较强的灵活性和适用性。通过分散管理模式能够调动不同地区数字档案馆信息资源建设的积极性充分发挥自身优势加强档案信息资源建设工作。同时数字档案馆采用分散管理模式为信息资源建设提供了个性化发展的渠道提高了档案信息资源建设工作中的创新工作效力但是分散管理模式同样有着信息资源分散、信息系统不兼容、共享交换不方便的问题。
2.微观管理模式
(1)内外结合模式。数字档案馆信息资源建设的内外结合模式指的是数字档案馆根据其自身信息资源不足的现实情况积极寻找其他外部信息资源与其共同完成信息资源建设的一种模式。内外结合管理模式的核心是数字档案馆通过整合内部与外部的信息资源共同完成档案信息资源建设工作。数字档案馆信息资源建设采用内外结合的管理模式不但能够克服集中管理与分散管理的弊端还能够取两者长处使档案信息资源的建设具有较强的适应性。一是通过充分利用数字档案馆现有的信息资源使其人力资源、物品资源能够得到良好利用提高档案馆信息资源建设的质量;二是利用内外结合的管理模式河以借鉴外部信息资源建设的信息技术、专业人才等,弥补数字档案馆在信息资源建设过程中的不足加强档案馆工作人员业务培训加快信息资源建设步伐。
(2)专项建设模式。数字档案馆信息资源建设的专项建设模式指的是将其建设力量集中在某一个具体领域方面,由此集中力量解决数字档案馆信息资源建设过程中遇到的棘手问题尽可能找到问题的突破口。因此专项建设模式更适用于数字档案馆信息建设的最初时期或者用于专业性较强的数字档案馆信息资源建设中。
二、数字档案馆档案信息资源建设管理流程
数字档案馆档案信息资源建设是一项长期持续的工作包括总体分析、制订计划和一些具体业务共同构成。为了能够有效控制管理数字档案馆信息资源建设工作必须对其进行建设规划役计建设流程。第一阶段数字档案馆信息资源建设的前期准备阶段包括建设总体分析和建设整体规划两个方面。该阶段主要是对数字档案馆信息资源建设的环境、条件等进行系统分析提出可行性研究报告为数字档案馆的信息资源建设进行整体规划同时进一步细化具体业务的建设计划。第二阶段数字档案馆信息资源建设的具体业务的实施管理包括信息需求分析、获取数字信息资源、信息鉴定、信息组织、信息存储、信息开发和信息维护更新等环节。该阶段数字档案馆信息资源建设的最终目的是控制整个过程保证其信息资源的建设目标能够实现。第三阶段数字档案馆信息资源建设的总体评估和验证阶段包括数字档案馆建设绩效评估和信息反馈两个方面,该阶段工作的最终目的是对其信息资源建设的实现流程、开发利用程度进行有效评估脸证数字档案馆信息资源建设工作是否已经达到最初目标总结建设过程中的经验与问题将信息资源建设过程中遇到的问题进行反馈。
三、数字档案馆信息资源建设的策略构建
1.深入开发档案信息资源
第一加强科学合理的成本投入。科学合理的成本投入是保证数字档案馆档案信息资源正常开放与利用的前提。档案馆信息资源的建设与应用是需要一定的人力、物力和资金的投入加果没有合理的成本投入数字档案馆信息资源建设与开发就会受到各种阻碍,难以提高信息资源产品的品质和档次但是成本的投入也不能盲目增加而是要根据数字档案馆的实际建设情况而定。因此数字档案馆信息资源的建设与开发要保证有一定的成本投入同时避免资源浪费的问题出现。第二朋确信息产品特点。信息产品的特点与特色是数字档案馆信息资源建设过程中的取胜关键。档案信息产品在社会中具有较强的特性例如原始性、不可复制性等由此数字档案馆信息资源的建设与开发工作更应该抓住这一特点朋确档案信息产品的特色提高档案信息产品的品质与价值。第三实施联合开发。数字档案馆信息资源建设与开发工作是一个整体过程对于档案信息产品的标准规范、专业人员的配备与使用等方面都提出了较高要求。但是大部分数字档案馆都无法满足以上这些要求需要经过多方机构的整体协调加强档案馆之间、档案部门与其他机构之间的联系实施联合开发建设,以此提高数字档案馆信息资源建设的步伐。
2.不断更新档案信息资源
随着档案信息产生和冗余信息价值的消失以及信息技术和生产设备的不断提高数字档案馆信息资源建设仍然需要持续更新主要包括以下三个方面片是添加新的档案信息主要是及时将最新的信息资源加入到数字档案馆信息资源建设开发工作中这也是档案信息资源的重新建设不断添加档案信息资源,能够提高数字档案馆信息资源开发的适应性和可用性。二是及时清除已经失去利用价值的档案信息由于数字档案馆信息资源建设占用的存储空间有限不能够满足随时增加新的信息资源因此需要及时清除已经失去价值的档案信息。而且这些老化无效的档案信息如果不能够及时清除不但会影响数字档案馆信息资源建设的运行速度还阻碍了用户使用系统查找信息资源的行为。但是清除失去价值的档案信息需要经过严格的审查和鉴定并对其进行详细记录。三是数字档案馆信息资源管理系统的更新是随着信息技术的发展而不断进行的肖数字档案馆原始的信息系统无法满足实际工作需求时,就需要对信息资源管理系统进行一次更新本质上是将原始信息资源系统进行转换。
3.科学合理的存储信息资源
档案信息的合理存储是数字档案馆信息资源建设函待解决的问题,由于要充分考虑到档案信息存储与提取的便捷性和安全性,以及档案信息长期有效存储的问题,在数字档案馆信息资源建设过程中要重点规划信息存储问题通过有效的信息技术手段和保障措施加强档案信息的存储效率。首先要制订完善合理的信息资源存储方案在数字档案馆信息资源存储建设中其信息技术手段包括分布式管理、数据挖掘、模糊识别、信息检索等由于信息技术的发展是持续的,因此,不可能建设一种完全合理的信息资源存储方案。但是数字档案馆应该充分考虑其建设环境和条件积极寻找科学合理的信息资源存储方案,以最大限度满足数字档案馆的现实需求这也是其信息资源建设过程中必须要综合考虑的问题。其次要遵循数字档案信息存储的标准和规范。数字化建设提出以来信息领域对于数字信息标准的研究方面也取得了一定进展。因此数字档案馆信息资源建设在对信息存储进行合理规划时要充分考虑到数字档案信息的存储标准和规范为后期档案信息资源的共享与交流提供有力的支持和保障。最后数字档案馆档案信息存储要选择适当的存储载体。载体是存储档案信息的实体。数字档案信息与传统档案材料相同其存储、保存、提取都与载体密不可分。数字档案信息存储的品质与性能是影响档案信息安全应用的关键因素油此数字档案馆在信息资源建设过程中对于档案信息的存储要采用性能稳定、安全可靠的信息载体。
四、总结
【摘要题】数字信息化
【关键词】数字档案馆/问题
【正文】
随着现代信息技术的迅速发展和大量电子文件的产生,数字档案馆的研究和建设成为我国档案界关注的热点。数字档案馆与传统档案馆相比,有着丰富的数字化资源、海量的存储、便捷的检索、快速的传输、高度的开放、信息的共享等优点,使传统的档案馆望尘莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我们应该清醒地认识到数字档案馆存在的缺陷,数字档案馆的建设还存在着诸多的难点和问题亟待深入研究解决。如果对存在的问题视而不见,或掉以轻心,必将给未来的档案事业留下巨大而无法弥补的遗憾。
1数字档案的凭证价值问题
档案的基本价值有两方面,凭证价值和参考价值,而尤以凭证价值最为重要,虽然,“目前人们对数字化档案具有参考价值这一点已无疑义,然而,由于一系列技术和立法问题还未解决,数字化档案目前还不具备法律凭证效力”[1]这无疑使数字档案的作用大打折扣。因此,确认数字档案的凭证价值就成为数字档案馆建设中无法回避的难题。目前,主要存在以下几方面的问题:
1.1认识上的问题。数字档案不具备“白纸黑字”的直观性,必须依赖特定的计算机设备加以解读。数字档案完全脱离了以往人人对档案“原件”的认识,从而引起人们对其原始性、可靠性的怀疑。而且,有些数字档案即使载体保存完好,内容亦可能在无形中丢失,它不像纸质档案那样载体与内容“一损俱损,一荣俱荣”。数字档案与以往其他载体的档案都不一样,从甲骨档案到简牍档案再到纸质档案,只是载体的耐久性有差别,并没有改变其直观性,而数字档案的非人工识读性与其他载体的档案有着质的区别。要确认数字档案的凭证价值,恐怕不仅仅是改变观念的问题,要真正认识数字档案,确认其凭证价值,可能还需要走很长的路。
1.2技术上的问题。数字档案是高新技术的产物,它给人们带来极大便利的同时,也给人们留下了困惑与难题。其一,数字档案具有易复制、修改、删除的特点,使得档案“原件”的概念变得难以确认。其二,计算机硬、软件技术不断更新换代,迫使数字档案必须不断适应新的“生存环境”,不断地变换载体、格式,因而无法通过载体、格式的鉴定来判定其原始性。其三,数字档案不再具有特定的字迹,人们可以根据需要以不同的字体、字号将其输出,传统的字迹鉴定技术无法分辨数字档案的原始性。其四,数字档案对背景信息和元数据具有很强的依赖性。“电子文件的背景信息常常与文件内容信息相分离保存,一旦失去背景信息,文件的内容即便仍有意义,但也不再具有凭证价值。元数据是电子文件、电子档案所特有的,“元数据由于其隐含性而易被忽视,而元数据一旦丢失或破坏,电子文件的原始性就会改变。”[2]
1.3管理制度上的问题。“传统档案之所以具有凭证价值,在一定程度上取决于严格的管理制度”,而目前“从电子文件的生成到归档都缺乏十分规范的程序化管理,缺乏严格而科学的标准体系和业务管理制度,一些标准、制度虽已制定,但全面推行尚需时日”[3]而且也有一定的难度。
2数字档案信息的长期存取问题
数字档案信息的长期存取问题是数字档案馆建设的一个具体而又棘手的难题。“据报道,美国航空航天局在20年前发射的‘海盗’号火星探测器上的计算机中,已经有20%的数据完全丢失,还有大约4000卷的统计数据因存储的格式模糊无法读出,程序员也无法保证将其恢复”。[4]数字档案信息长期存取所面临的主要问题有:
2.1存储的介质材料。“现代介质的存储设备还不可能解决计算机数据存储问题”。[5]一般说来,磁盘的寿命是3~5年,光盘也不过30年左右,与能保存千年以上的纸质载体相比,其寿命相差甚远,而且它还要受到温度、磁场、记录存储格式、硬件配置等多方面的影响,10年前还经常使用的5.25英寸的软盘,现在已经没有一台普通电脑可以读出来。
2.2机读语言格式。“计算机语言平均每三个月就会问世一种,而语言之间的互换大部分存在问题。很难想象,若干年以后,我们用现行的机器语言描述的数据,还能百分之百的还原”。[6]
2.3对设备的依赖。数字档案必须依赖于计算机设备才能读出,这个特征对其长期存取带来很多问题:“如设备发生故障、系统瘫痪,电子文件就读不出来;电子文件对其它设备环境的不兼容性,使其只能在某种设备上处理,而不能在其它设备上处理;不同软件环境形成的电子文件存贮在载体上,有时难以互换;电子文件加密后,不解密就无法识别;技术设备更新时,不及时解决格式转换问题,也无法读取等等”。[7]
3数字档案的失真问题
“档案数字化工作的生命线在于其能够保持档案原貌”。[8]然而,“就目前的研究水平而言,还难以保质保量地完成馆藏档案数字化的任务。如已研制出的OCR扫描输入技术,其平均识别率是95%。这对于追求最大程度真实性的档案来说无疑是致命弱点”。[9]数字化的主要方式是扫描加工,在这一过程中造成数字档案失真的原因还有以下几个方面:其一,技术参数选择不当。针对不同色调、纸质和字迹,有时需调整不同的技术参数,如分辨率、明暗度、对比度等,选择不当会直接影响扫描的质量,造成信息丢失、图像模糊或产生额外信息,客观上造成档案原貌的改变。其二,工作失误。档案扫描是大量的重复劳动,难免有时失误。如扫错档案或打错顺序,或存错,或在建索引时链接错误等,如不及时发现,将直接导致数字化档案失真。其三,转换过程中的失真。在进行数字档案的迁移或在提供利用时,往往需要将扫描后形成的图像文件转换成另一种格式的文件,如果格式选择不当,同样会导致数据发生变化。
4数字档案信息的安全问题
安全问题是计算机网络世界最为头痛的难题,也是数字档案馆中的重大难题之一。数字档案馆虽然被称之为“馆”,但它的存在更仿佛是一个巨大的没有警察的自由市场,给不法分子带来可乘之机,主要表现为:其一,计算机病毒。网络信息安全的最主要的敌人就是计算机病毒。“国外有人估计,现在计算机病毒的传染每两个月增加1倍。网络病毒的泛滥已对计算机网络系统构成严重的威胁”。[10]其二,计算机黑客。由于网络的加密性和匿名性,使入侵者难以被发现。黑客对信息资源的攻击,不仅仅是好奇和自我挑战,程序设计高手可以篡改系统控制参数。其三,有窃取行为的间谍活动,窥视其机密信息进行复制或扩散。其四,有意破坏,摧毁系统的信息处理功能或破坏电子通讯装置。其五,人为或偶然事故造成的威胁。如工作人员操作失误而产生的不可预知的事件、网络系统软件硬件的故障、电子系统故障引发的系统问题等,所有这些,都使数字档案信息的安全变得十分“脆弱”。
5数字档案馆建设的诸多技术问题
数字档案馆完全是高新技术、电子设备和计算机网络技术支撑起来的产物,离开了高新技术的支撑,就没有了数字档案馆。但是高新技术也给数字档案馆带来了致命的弱点,真是“成也萧何,败也萧何”。诸多的技术问题成为制约数字档案馆建设的难点。
5.1数字化设备技术条件。网络系统中的硬件技术之一是必须有足够的带宽,以保证快捷地传输文本、语音、图像、影像档案,以便实现多网互连、高速互访,实现跨平台、跨系统、跨语种的互相转换和链接。毫无疑问,足够的带宽条件和用户对网络信息传输的需求将一直是一对矛盾体。
5.2技术难题。数字档案馆是以信息源、网络、数据库为基础的,其相关技术是较复杂较先进并且不断发展的,它几乎囊括了计算机网络技术所需要解决的所有问题,技术密集。如数字化图像的存储与压缩、数据组织技术、信息检索技术、多语言平台互换互访技术、海量信息存储与调配技术等,既是计算机网络技术的难关,也是制约数字档案馆建设发展的难题。此外,“数字档案馆的建设和运行需要解决一些特殊问题,为此必须开发应用一系列新技术,如:身份认定、智能检索、信息隐蔽、数字水印、电子签章、操作跟踪、信息加密等,其中有很多技术有创新性”。[11]这些技术也都是不容易解决的问题。
5.3技术过时问题。在飞速发展的IT业中,电脑硬件、操作系统、应用软件及存储载体等不断地被新产品所替代,IT产品是真正的“短命鬼”。虽然绝大多数新产品承诺向下兼容,但其兼容的“代”数在跨越若干年后,旧的数字信息就很难被新的硬件设备和软件系统读出。“技术过时”的阴影一直会笼罩着数字信息。专家们提出的解决方案是数据迁移,但迁移却存在着一个致命弱点,就是每次迁移总会丢失一定的相关信息,这些丢失的信息积累起来会造成数字档案信息无法准确恢复原貌。
6数字档案馆建设的标准化问题
数字档案馆建设的目的是要使地区档案馆、全国档案馆乃至全世界的档案馆连成一个整体,以实现档案信息资源共享。这个整体性的数字档案馆事实上是一种基于网络环境下的数字化档案信息资源共享的社会档案馆系统,是一个面向对象的分布式的网状结构模式,是由一个个相对独立的数字档案馆实体组成的。要对这分散在各地的数字档案信息资源进行组织控制,就必须要有彼此兼容的硬件环境,要有一致的文件格式、统一的著录标引标准、数据描述标准、元数据标准、全文数据库标准等等,这些标准也仅仅是几个主要的标准。“而实际上,在数字档案馆建设中,标准化是一个体系,是一个系统,因此对于我们来说,如何结合我国实际,迅速建立起一个适合我国数字档案馆建设的标准化体系是摆在我们面前的一个迫切需要解决的新问题”。[12]然而,要解决这个问题并不容易,我们面临着很多问题:其一,一个严峻的事实是我国档案信息系统没有相应的具体标准可遵循;其二,有些标准规范要超出档案工作的范围,如综合数据处理格式就需满足跨行业、跨部门的要求。如何统一是一个很麻烦的问题;其三,与整个档案工作的标准相衔接的问题;其四,与国际通用标准的接轨问题;其五,由于计算机技术更新速度非常快,每次技术设备的更新,都会对原标准产生相应的影响,因而必须不断适时修订标准。
7数字档案馆建设的投入与产出问题
数字档案馆建设存在着投入与产出不协调的问题。如果我们把数字档案馆与数字图书馆作比较,会对这个问题看得更清楚。数字档案馆建设投入的费用是巨大的,而且它的建设费用要远远高于数字图书馆的建设费用。由于图书有复本,许多图书馆保存的图书都一样。因而国家图书馆和省市图书馆的部分图书数字化后,其他图书馆特别是中小型图书馆完全可以坐享其成,不必再花费资金重复建设。而档案馆则不行,全国各个档案馆保存的档案几乎都是孤本,因而档案馆在用于档案数字化的费用上要比图书馆多,如,仅档案馆进行数字化档案目录的“工作量约是图书馆的35倍”。[13]但是档案馆的利用人次与图书馆读者的人数相比却少得多,“以北京市档案馆和国家图书馆(原北京图书馆)为例,前者年利用人次约四五千人,后者一年的读者数不少于二百万人”。[14]两者相差400倍。“即使一、二史馆和中央档案馆三个国家档案馆的年平均利用人次也不过5960人次”,[15]三个馆加起来与国家图书馆相比仍相差100多倍。档案馆的利用长期处于低谷已是不争的事实,就是建成数字档案馆后,这种情况也不会改变多少,因为档案信息有保密和时效的限制,有利用者的限制,并不会增加太多的利用者,更不可能赶上数字图书馆的读者人数。事实上,传统档案馆本来就存在着投入与产出不协调的问题,只不过未引起人们的关注,但是,数字档案馆的建设却拉大了这种不协调的距离,使这个问题凸现出来。它也成为摆在数字档案馆建设面前很难解决的问题。
8数字档案中的经济问题
与其说数字档案馆是高新技术支撑起来的,不如更实际地说是由巨额资金支撑起来的,因为所有的高新技术和设备都将由资金来兑现。数字档案馆的建设与利用,不论对于档案部门还是利用者,都有很重的经济负担,经济问题可能是困扰数字档案馆建设的根本性难题之一。
8.1档案部门方面的问题。
8.1.1数字档案馆建设的费用问题。数字档案馆的建设费用是巨大的,开发一个稍具规模的数字档案馆系统,不论是购买软件和硬件,还是开发专用软件,还是馆藏档案的数字化工作,都需要花费可观的人力、财力和时间,这些都需要有强大的经济实力做后盾。而数字档案馆的建设说到底,仍是以政府投入为主。但国家的综合国力不可能在短期内发展到较高的水平。因此,资金短缺是建设数字档案馆的最不好解决的难题。档案馆是公益性和社会性的部门,也不能走“以文养文”、“以馆建馆”之路,即便是想走此路也走不通,正如上文所述的数字档案馆存在着投入与产出的巨大反差,即使对利用者收费,数字档案馆也根本不可能收回投资成本。数字档案馆建设的巨额费用对于本来就经费紧张的档案部门来说是有相当难度的。而对中西部欠发达地区的大部分市、县档案馆来说,连维持日常工作的经费都成问题,建设数字档案馆恐怕在相当长的时间内都是可望而不可及的。
8.1.2数字档案馆的使用和维护费用问题。虽然数字档案馆的建设费用巨大,但它并不是一劳永逸的。它的维护和使用的费用并不少于初建的费用。数字档案馆就像一个“无底洞”,需要不断地投入大量资金来维持其正常运转。
8.1.2.1平时正常的使用和维护费用。数字档案馆是靠技术支撑起来的,平时正常的使用和维护也需要很大一笔资金才能维持,如通信费、数据使用费和设备维护费等都需要不断地支出,且费用不低。
8.1.2.2设备更新费用。现代信息处理技术发展迅猛,其软硬件更新非常快,而在市场经济利益的强大动因驱使下,更加快了这种更新速度,“录制、存贮信息的设备、方法及软件随着新产品、新方法的问世,正以5-9年的周期更新,新产品、新方法的不断问世,必将导致原有设备及软件的淘汰”[16]。数字档案馆要维持正常使用,也必须不断地更新设备和软件,但要更新设备和软件,却又要花费大量的资金,而且是每隔几年就要又投入一次。
8.1.2.3数字档案信息长期存取使用的费用。正如上文所述数字档案信息长期存取是数字档案馆的一个具体而棘手的难题。而数字档案馆又必须使用数字档案信息,专家们给出了一个不得已而为之的方案,就是不断地使数字档案信息迁移转录。但是迁移转录的费用是相当可观的和不可预知的。一般档案馆能否承受这不断迁移转录所需的费用,也是一个既不可预见又不容易解决的难题。
8.1.3向利用者收取数字档案信息利用费的问题。档案法规规定档案馆向社会提供利用档案,可以收取费用。数字档案馆建设投资大,收取一定的费用也是应该的。但是,如何制定收取利用费的收费制度,如标准、数量、缴纳程序等,也是数字档案馆建设的难题之一。
8.2利用者方面的问题。利用者的经济承受能力,也是影响和制约.数字档案馆建设发展的问题之一。数字档案馆需上网阅览,从目前我国上网所需资费来看,每小时的费用是发达国家的10多倍,而用户的平均收入又低于发达国家的若干倍。我国80-90%的用户认为网络收费过高,通信费难以承受。再一点是下载档案信息的打印费用,尽管并不是要将所有下载的档案信息打印出来,就是部分打印也需要承受可观的打印费。如果再加上数字档案信息使用费,这些费用加在一起,将会相当高。必将影响利用者对数字档案馆的使用,也将使数字档案馆的建设失去应有的作用和意义;
9数字档案馆法律法规方面的问题
数字档案馆建设中会涉及到许多法律问题,而这些法律问题恰恰又是亟待解决而又难以一时解决的问题。
9.1档案法规方面的问题。面对数字档案馆产生的新情况、新特点.档案法规中的一些内容已不适应,而要解决起来仍有一定的难度。如对利用者的身份认证问题,在网上进行借阅限定和身份认证不仅增加技术难度,而且还要增加开支。而对外国利用者来说,由于限制得更严格,在网上操作更加困难。数字档案馆是开放的,是不受国界限制的,数字档案馆建设的初衷就是实现档案信息的社会共享。但如果取消身份认证,那么就等于中外利用者都一样没有限制。因此,真要修改完善档案法规,兼顾到方方面面,还是有相当的难度。
9.2著作权、知识产权、隐私权的保护问题。在数字档案馆的环境下,由于档案信息通过网络进行传递,它极容易被获取、被复制、被传播,对利用者控制的难度加大。原来意义上的著作权、知识产权、隐私权的保护方式对权利人已无法提供有效的保护,著作权、知识产权和隐私权很容易被侵犯。因此,如何对档案著作权、知识产权和隐私权进行有效保护成为数字档案馆建设面临的一大挑战。从技术上说,真正切实可行的保护技术,目前尚属于极其薄弱的环节。从完善相应法律法规方面说,目前进展缓慢,尚有许多难题不易解决。
9.3数字档案的法律效用问题。对于数字档案的法律效用问题,它是数字档案馆建设中一个不能回避的特殊难题。要想让它得到法律的认可,恐怕还需要相当长的时间。而“如果电子档案的法律凭证问题得不到解决,数字档案馆的数字化馆藏也就失去了利用的价值、存在的意义”。[17]
10数字档案馆的基础理论问题
数字档案馆的建设必然要受到数字档案馆理论研究的影响和指导。目前,对数字档案馆的研究还处于起步阶段,许多认识不相同,统一尚需时日。而且有关数字档案馆的一些基础理论问题,都是一些不易解决的难题。
10.1数字档案馆的概念问题。自从数字档案馆概念出现以来,“关于数字档案馆的认识并不统一,其定义就有数十种之多,势必会造成对数字档案馆建设方向把握上的不一致”。[18]观点不一样,建设的数字档案馆就不一样,建设的难易程度、工作流程、服务功能、配套措施、系统边界和社会影响等等也都会截然不同”。[19]而统一认识或基本统一认识都非一日之功。但这个问题不解决,将对数字档案馆的实践产生不利影响。
10.2数字档案馆的系统边界问题。“数字档案馆支持以网络连接的相关档案部门的数字化馆藏,能够提供分布于不同地区的档案信息。然而信息网络的一个重要特征就是链接,这种在技术上可以无限链接的情况下,就涉及到了系统的边界问题”。[20]数字档案馆系统边界的界定决定着数字档案馆所拥有的功能特性。同时也决定着数字档案信息在信息中的地位。然而,“在图书馆情报学界,人们讨论数字化图书馆时有种倾向,认为因特网就是一个数字图书馆,任何人都可以到这个无所不包的图书馆中查阅文献、学习知识、合作交流甚至著书立说。这就把数字图书馆的地址空间和信息资源空间定位很广,其系统边界也无所不包。它不仅包括了书目文献管理、信息网络信息资源的组织与作用,甚至包括档案馆和博物馆的信息内容,因此建设规模异常庞大”。[21]数字图书馆的这种“扩张”,使本来就处于“弱势”地位的档案信息的地位更加岌岌可危,如果不对数字档案馆的系统边界给以恰当的界定,并采取相应的技术措施,那么,在不久的将来,数字档案馆将会消失在数字图书馆的海洋里,成为数字图书馆的一部分。
10.3数字档案的概念问题。数字档案是数字档案馆生存的基础。但是目前对数字档案概念的认识却并不统一和清晰。其一,对数字档案概念的研究并未引起档案界太多的关注;其二,一些对数字档案概念的认识,大部分都是以传统的档案概念为基础的,仍旧把数字档案当作电子文件的转化物来认识,无非是传统档案概念在数字时代的翻版。这里暂不说传统的以文件为属概念的档案概念本身就有许多可商榷的地方。单说在数字信息时代文件的概念、档案概念和其他信息的概念都会受到影响而发生变化,它们之间有互相融合的趋势。如何区分它们将变得越来越困难。在数字时代的信息网络环境下,数字文件、数字档案、数字图书、数字情报、数字资料、数字文献筹有什么不同?如何区分它们?如果不能把数字档案从这些其他数字信息中区分出来,那么数字档案的概念的存在就将走向消亡,而在数字档案概念基础上建立起来的数字馆大厦也将随之倾覆。因此,必须把数字档案概念从其他数字信息中区别出来,数字档案馆才能生存。但这是一道摆在我们面前的并不容易找到答案的难题。
【参考文献】
1阎会勤.新世纪档案工作展望.档案学通讯,2001;6
23景红.电子档案凭证价值探析.档案与建设,2000;10
456李玉安.数字图书馆建设的十大难题.图书馆学刊,2002;3,
7徐义全.电子文件的特性与长期保存.档案学研究,2000;1
8吴志宏.数字化档案的隐忧:数据失真.北京档案,2002;12
9谭zhēng@①培,数字档案馆论纲.档案学研究,2001;5
1016范开宏.数字图书馆之忧思.图书与情报,2002;1
11邱晓威.数字档案馆及其建设模式.中国档案,2001;10
12段荣婷.我国数字档案馆的研究与建设.中国档案,2002;6
13刘东斌.数字档案馆与数字图书馆的比较研究.档案管理,2003;2
14求实.档案馆与图书馆利用对比分析及对策.北京档案,1999;9
15国家档案局综合科教司.从统计数字看1991年度全国档案事业的发展状况.档案学研究,1993;1
17谭zhēng@①培.数字档案馆建设面临的问题及其对策.浙江档案,2002;3
18朱蒙生.传统档案馆向数字档案馆跨越所面临的问题.中国档案,2003;3
【关键词】数字档案馆/问题
【正文】
随着现代信息技术的迅速发展和大量电子文件的产生,数字档案馆的研究和建设成为我国档案界关注的热点。数字档案馆与传统档案馆相比,有着丰富的数字化资源、海量的存储、便捷的检索、快速的传输、高度的开放、信息的共享等优点,使传统的档案馆望尘莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我们应该清醒地认识到数字档案馆存在的缺陷,数字档案馆的建设还存在着诸多的难点和问题亟待深入研究解决。如果对存在的问题视而不见,或掉以轻心,必将给未来的档案事业留下巨大而无法弥补的遗憾。
1数字档案的凭证价值问题
档案的基本价值有两方面,凭证价值和参考价值,而尤以凭证价值最为重要,虽然,“目前人们对数字化档案具有参考价值这一点已无疑义,然而,由于一系列技术和立法问题还未解决,数字化档案目前还不具备法律凭证效力”[1]这无疑使数字档案的作用大打折扣。因此,确认数字档案的凭证价值就成为数字档案馆建设中无法回避的难题。目前,主要存在以下几方面的问题:
1.1认识上的问题。数字档案不具备“白纸黑字”的直观性,必须依赖特定的计算机设备加以解读。数字档案完全脱离了以往人人对档案“原件”的认识,从而引起人们对其原始性、可靠性的怀疑。而且,有些数字档案即使载体保存完好,内容亦可能在无形中丢失,它不像纸质档案那样载体与内容“一损俱损,一荣俱荣”。数字档案与以往其他载体的档案都不一样,从甲骨档案到简牍档案再到纸质档案,只是载体的耐久性有差别,并没有改变其直观性,而数字档案的非人工识读性与其他载体的档案有着质的区别。要确认数字档案的凭证价值,恐怕不仅仅是改变观念的问题,要真正认识数字档案,确认其凭证价值,可能还需要走很长的路。
1.2技术上的问题。数字档案是高新技术的产物,它给人们带来极大便利的同时,也给人们留下了困惑与难题。其一,数字档案具有易复制、修改、删除的特点,使得档案“原件”的概念变得难以确认。其二,计算机硬、软件技术不断更新换代,迫使数字档案必须不断适应新的“生存环境”,不断地变换载体、格式,因而无法通过载体、格式的鉴定来判定其原始性。其三,数字档案不再具有特定的字迹,人们可以根据需要以不同的字体、字号将其输出,传统的字迹鉴定技术无法分辨数字档案的原始性。其四,数字档案对背景信息和元数据具有很强的依赖性。“电子文件的背景信息常常与文件内容信息相分离保存,一旦失去背景信息,文件的内容即便仍有意义,但也不再具有凭证价值。元数据是电子文件、电子档案所特有的,“元数据由于其隐含性而易被忽视,而元数据一旦丢失或破坏,电子文件的原始性就会改变。”[2]
1.3管理制度上的问题。“传统档案之所以具有凭证价值,在一定程度上取决于严格的管理制度”,而目前“从电子文件的生成到归档都缺乏十分规范的程序化管理,缺乏严格而科学的标准体系和业务管理制度,一些标准、制度虽已制定,但全面推行尚需时日”[3]而且也有一定的难度。
2数字档案信息的长期存取问题
数字档案信息的长期存取问题是数字档案馆建设的一个具体而又棘手的难题。“据报道,美国航空航天局在20年前发射的‘海盗’号火星探测器上的计算机中,已经有20%的数据完全丢失,还有大约4000卷的统计数据因存储的格式模糊无法读出,程序员也无法保证将其恢复”。[4]数字档案信息长期存取所面临的主要问题有:
2.1存储的介质材料。“现代介质的存储设备还不可能解决计算机数据存储问题”。[5]一般说来,磁盘的寿命是3~5年,光盘也不过30年左右,与能保存千年以上的纸质载体相比,其寿命相差甚远,而且它还要受到温度、磁场、记录存储格式、硬件配置等多方面的影响,10年前还经常使用的5.25英寸的软盘,现在已经没有一台普通电脑可以读出来。
2.2机读语言格式。“计算机语言平均每三个月就会问世一种,而语言之间的互换大部分存在问题。很难想象,若干年以后,我们用现行的机器语言描述的数据,还能百分之百的还原”。[6]
2.3对设备的依赖。数字档案必须依赖于计算机设备才能读出,这个特征对其长期存取带来很多问题:“如设备发生故障、系统瘫痪,电子文件就读不出来;电子文件对其它设备环境的不兼容性,使其只能在某种设备上处理,而不能在其它设备上处理;不同软件环境形成的电子文件存贮在载体上,有时难以互换;电子文件加密后,不解密就无法识别;技术设备更新时,不及时解决格式转换问题,也无法读取等等”。[7]
3数字档案的失真问题
“档案数字化工作的生命线在于其能够保持档案原貌”。[8]然而,“就目前的研究水平而言,还难以保质保量地完成馆藏档案数字化的任务。如已研制出的OCR扫描输入技术,其平均识别率是95%。这对于追求最大程度真实性的档案来说无疑是致命弱点”。[9]数字化的主要方式是扫描加工,在这一过程中造成数字档案失真的原因还有以下几个方面:其一,技术参数选择不当。针对不同色调、纸质和字迹,有时需调整不同的技术参数,如分辨率、明暗度、对比度等,选择不当会直接影响扫描的质量,造成信息丢失、图像模糊或产生额外信息,客观上造成档案原貌的改变。其二,工作失误。档案扫描是大量的重复劳动,难免有时失误。如扫错档案或打错顺序,或存错,或在建索引时链接错误等,如不及时发现,将直接导致数字化档案失真。其三,转换过程中的失真。在进行数字档案的迁移或在提供利用时,往往需要将扫描后形成的图像文件转换成另一种格式的文件,如果格式选择不当,同样会导致数据发生变化。
4数字档案信息的安全问题
安全问题是计算机网络世界最为头痛的难题,也是数字档案馆中的重大难题之一。数字档案馆虽然被称之为“馆”,但它的存在更仿佛是一个巨大的没有警察的自由市场,给不法分子带来可乘之机,主要表现为:其一,计算机病毒。网络信息安全的最主要的敌人就是计算机病毒。“国外有人估计,现在计算机病毒的传染每两个月增加1倍。网络病毒的泛滥已对计算机网络系统构成严重的威胁”。[10]其二,计算机黑客。由于网络的加密性和匿名性,使入侵者难以被发现。黑客对信息资源的攻击,不仅仅是好奇和自我挑战,程序设计高手可以篡改系统控制参数。其三,有窃取行为的间谍活动,窥视其机密信息进行复制或扩散。其四,有意破坏,摧毁系统的信息处理功能或破坏电子通讯装置。其五,人为或偶然事故造成的威胁。如工作人员操作失误而产生的不可预知的事件、网络系统软件硬件的故障、电子系统故障引发的系统问题等,所有这些,都使数字档案信息的安全变得十分“脆弱”。
5数字档案馆建设的诸多技术问题
数字档案馆完全是高新技术、电子设备和计算机网络技术支撑起来的产物,离开了高新技术的支撑,就没有了数字档案馆。但是高新技术也给数字档案馆带来了致命的弱点,真是“成也萧何,败也萧何”。诸多的技术问题成为制约数字档案馆建设的难点。
5.1数字化设备技术条件。网络系统中的硬件技术之一是必须有足够的带宽,以保证快捷地传输文本、语音、图像、影像档案,以便实现多网互连、高速互访,实现跨平台、跨系统、跨语种的互相转换和链接。毫无疑问,足够的带宽条件和用户对网络信息传输的需求将一直是一对矛盾体。
5.2技术难题。数字档案馆是以信息源、网络、数据库为基础的,其相关技术是较复杂较先进并且不断发展的,它几乎囊括了计算机网络技术所需要解决的所有问题,技术密集。如数字化图像的存储与压缩、数据组织技术、信息检索技术、多语言平台互换互访技术、海量信息存储与调配技术等,既是计算机网络技术的难关,也是制约数字档案馆建设发展的难题。此外,“数字档案馆的建设和运行需要解决一些特殊问题,为此必须开发应用一系列新技术,如:身份认定、智能检索、信息隐蔽、数字水印、电子签章、操作跟踪、信息加密等,其中有很多技术有创新性”。[11]这些技术也都是不容易解决的问题。
5.3技术过时问题。在飞速发展的IT业中,电脑硬件、操作系统、应用软件及存储载体等不断地被新产品所替代,IT产品是真正的“短命鬼”。虽然绝大多数新产品承诺向下兼容,但其兼容的“代”数在跨越若干年后,旧的数字信息就很难被新的硬件设备和软件系统读出。“技术过时”的阴影一直会笼罩着数字信息。专家们提出的解决方案是数据迁移,但迁移却存在着一个致命弱点,就是每次迁移总会丢失一定的相关信息,这些丢失的信息积累起来会造成数字档案信息无法准确恢复原貌。
6数字档案馆建设的标准化问题
数字档案馆建设的目的是要使地区档案馆、全国档案馆乃至全世界的档案馆连成一个整体,以实现档案信息资源共享。这个整体性的数字档案馆事实上是一种基于网络环境下的数字化档案信息资源共享的社会档案馆系统,是一个面向对象的分布式的网状结构模式,是由一个个相对独立的数字档案馆实体组成的。要对这分散在各地的数字档案信息资源进行组织控制,就必须要有彼此兼容的硬件环境,要有一致的文件格式、统一的著录标引标准、数据描述标准、元数据标准、全文数据库标准等等,这些标准也仅仅是几个主要的标准。“而实际上,在数字档案馆建设中,标准化是一个体系,是一个系统,因此对于我们来说,如何结合我国实际,迅速建立起一个适合我国数字档案馆建设的标准化体系是摆在我们面前的一个迫切需要解决的新问题”。[12]然而,要解决这个问题并不容易,我们面临着很多问题:其一,一个严峻的事实是我国档案信息系统没有相应的具体标准可遵循;其二,有些标准规范要超出档案工作的范围,如综合数据处理格式就需满足跨行业、跨部门的要求。如何统一是一个很麻烦的问题;其三,与整个档案工作的标准相衔接的问题;其四,与国际通用标准的接轨问题;其五,由于计算机技术更新速度非常快,每次技术设备的更新,都会对原标准产生相应的影响,因而必须不断适时修订标准。
7数字档案馆建设的投入与产出问题
数字档案馆建设存在着投入与产出不协调的问题。如果我们把数字档案馆与数字图书馆作比较,会对这个问题看得更清楚。数字档案馆建设投入的费用是巨大的,而且它的建设费用要远远高于数字图书馆的建设费用。由于图书有复本,许多图书馆保存的图书都一样。因而国家图书馆和省市图书馆的部分图书数字化后,其他图书馆特别是中小型图书馆完全可以坐享其成,不必再花费资金重复建设。而档案馆则不行,全国各个档案馆保存的档案几乎都是孤本,因而档案馆在用于档案数字化的费用上要比图书馆多,如,仅档案馆进行数字化档案目录的“工作量约是图书馆的35倍”。[13]但是档案馆的利用人次与图书馆读者的人数相比却少得多,“以北京市档案馆和国家
图书馆(原北京图书馆)为例,前者年利用人次约四五千人,后者一年的读者数不少于二百万人”。[14]两者相差400倍。“即使一、二史馆和中央档案馆三个国家档案馆的年平均利用人次也不过5960人次”,[15]三个馆加起来与国家图书馆相比仍相差100多倍。档案馆的利用长期处于低谷已是不争的事实,就是建成数字档案馆后,这种情况也不会改变多少,因为档案信息有保密和时效的限制,有利用者的限制,并不会增加太多的利用者,更不可能赶上数字图书馆的读者人数。事实上,传统档案馆本来就存在着投入与产出不协调的问题,只不过未引起人们的关注,但是,数字档案馆的建设却拉大了这种不协调的距离,使这个问题凸现出来。它也成为摆在数字档案馆建设面前很难解决的问题。
8数字档案中的经济问题
与其说数字档案馆是高新技术支撑起来的,不如更实际地说是由巨额资金支撑起来的,因为所有的高新技术和设备都将由资金来兑现。数字档案馆的建设与利用,不论对于档案部门还是利用者,都有很重的经济负担,经济问题可能是困扰数字档案馆建设的根本性难题之一。
8.1档案部门方面的问题。
8.1.1数字档案馆建设的费用问题。数字档案馆的建设费用是巨大的,开发一个稍具规模的数字档案馆系统,不论是购买软件和硬件,还是开发专用软件,还是馆藏档案的数字化工作,都需要花费可观的人力、财力和时间,这些都需要有强大的经济实力做后盾。而数字档案馆的建设说到底,仍是以政府投入为主。但国家的综合国力不可能在短期内发展到较高的水平。因此,资金短缺是建设数字档案馆的最不好解决的难题。档案馆是公益性和社会性的部门,也不能走“以文养文”、“以馆建馆”之路,即便是想走此路也走不通,正如上文所述的数字档案馆存在着投入与产出的巨大反差,即使对利用者收费,数字档案馆也根本不可能收回投资成本。数字档案馆建设的巨额费用对于本来就经费紧张的档案部门来说是有相当难度的。而对中西部欠发达地区的大部分市、县档案馆来说,连维持日常工作的经费都成问题,建设数字档案馆恐怕在相当长的时间内都是可望而不可及的。
8.1.2数字档案馆的使用和维护费用问题。虽然数字档案馆的建设费用巨大,但它并不是一劳永逸的。它的维护和使用的费用并不少于初建的费用。数字档案馆就像一个“无底洞”,需要不断地投入大量资金来维持其正常运转。
8.1.2.1平时正常的使用和维护费用。数字档案馆是靠技术支撑起来的,平时正常的使用和维护也需要很大一笔资金才能维持,如通信费、数据使用费和设备维护费等都需要不断地支出,且费用不低。
8.1.2.2设备更新费用。现代信息处理技术发展迅猛,其软硬件更新非常快,而在市场经济利益的强大动因驱使下,更加快了这种更新速度,“录制、存贮信息的设备、方法及软件随着新产品、新方法的问世,正以5-9年的周期更新,新产品、新方法的不断问世,必将导致原有设备及软件的淘汰”[16]。数字档案馆要维持正常使用,也必须不断地更新设备和软件,但要更新设备和软件,却又要花费大量的资金,而且是每隔几年就要又投入一次。
8.1.2.3数字档案信息长期存取使用的费用。正如上文所述数字档案信息长期存取是数字档案馆的一个具体而棘手的难题。而数字档案馆又必须使用数字档案信息,专家们给出了一个不得已而为之的方案,就是不断地使数字档案信息迁移转录。但是迁移转录的费用是相当可观的和不可预知的。一般档案馆能否承受这不断迁移转录所需的费用,也是一个既不可预见又不容易解决的难题。
8.1.3向利用者收取数字档案信息利用费的问题。档案法规规定档案馆向社会提供利用档案,可以收取费用。数字档案馆建设投资大,收取一定的费用也是应该的。但是,如何制定收取利用费的收费制度,如标准、数量、缴纳程序等,也是数字档案馆建设的难题之一。
8.2利用者方面的问题。利用者的经济承受能力,也是影响和制约.数字档案馆建设发展的问题之一。数字档案馆需上网阅览,从目前我国上网所需资费来看,每小时的费用是发达国家的10多倍,而用户的平均收入又低于发达国家的若干倍。我国80-90%的用户认为网络收费过高,通信费难以承受。再一点是下载档案信息的打印费用,尽管并不是要将所有下载的档案信息打印出来,就是部分打印也需要承受可观的打印费。如果再加上数字档案信息使用费,这些费用加在一起,将会相当高。必将影响利用者对数字档案馆的使用,也将使数字档案馆的建设失去应有的作用和意义;
9数字档案馆法律法规方面的问题
数字档案馆建设中会涉及到许多法律问题,而这些法律问题恰恰又是亟待解决而又难以一时解决的问题。
9.1档案法规方面的问题。面对数字档案馆产生的新情况、新特点.档案法规中的一些内容已不适应,而要解决起来仍有一定的难度。如对利用者的身份认证问题,在网上进行借阅限定和身份认证不仅增加技术难度,而且还要增加开支。而对外国利用者来说,由于限制得更严格,在网上操作更加困难。数字档案馆是开放的,是不受国界限制的,数字档案馆建设的初衷就是实现档案信息的社会共享。但如果取消身份认证,那么就等于中外利用者都一样没有限制。因此,真要修改完善档案法规,兼顾到方方面面,还是有相当的难度。
9.2著作权、知识产权、隐私权的保护问题。在数字档案馆的环境下,由于档案信息通过网络进行传递,它极容易被获取、被复制、被传播,对利用者控制的难度加大。原来意义上的著作权、知识产权、隐私权的保护方式对权利人已无法提供有效的保护,著作权、知识产权和隐私权很容易被侵犯。因此,如何对档案著作权、知识产权和隐私权进行有效保护成为数字档案馆建设面临的一大挑战。从技术上说,真正切实可行的保护技术,目前尚属于极其薄弱的环节。从完善相应法律法规方面说,目前进展缓慢,尚有许多难题不易解决。
9.3数字档案的法律效用问题。对于数字档案的法律效用问题,它是数字档案馆建设中一个不能回避的特殊难题。要想让它得到法律的认可,恐怕还需要相当长的时间。而“如果电子档案的法律凭证问题得不到解决,数字档案馆的数字化馆藏也就失去了利用的价值、存在的意义”。[17]
10数字档案馆的基础理论问题
数字档案馆的建设必然要受到数字档案馆理论研究的影响和指导。目前,对数字档案馆的研究还处于起步阶段,许多认识不相同,统一尚需时日。而且有关数字档案馆的一些基础理论问题,都是一些不易解决的难题。
10.1数字档案馆的概念问题。自从数字档案馆概念出现以来,“关于数字档案馆的认识并不统一,其定义就有数十种之多,势必会造成对数字档案馆建设方向把握上的不一致”。[18]观点不一样,建设的数字档案馆就不一样,建设的难易程度、工作流程、服务功能、配套措施、系统边界和社会影响等等也都会截然不同”。[19]而统一认识或基本统一认识都非一日之功。但这个问题不解决,将对数字档案馆的实践产生不利影响。
10.2数字档案馆的系统边界问题。“数字档案馆支持以网络连接的相关档案部门的数字化馆藏,能够提供分布于不同地区的档案信息。然而信息网络的一个重要特征就是链接,这种在技术上可以无限链接的情况下,就涉及到了系统的边界问题”。[20]数字档案馆系统边界的界定决定着数字档案馆所拥有的功能特性。同时也决定着数字档案信息在信息中的地位。然而,“在图书馆情报学界,人们讨论数字化图书馆时有种倾向,认为因特网就是一个数字图书馆,任何人都可以到这个无所不包的图书馆中查阅文献、学习知识、合作交流甚至著书立说。这就把数字图书馆的地址空间和信息资源空间定位很广,其系统边界也无所不包。它不仅包括了书目文献管理、信息网络信息资源的组织与作用,甚至包括档案馆和博物馆的信息内容,因此建设规模异常庞大”。[21]数字图书馆的这种“扩张”,使本来就处于“弱势”地位的档案信息的地位更加岌岌可危,如果不对数字档案馆的系统边界给以恰当的界定,并采取相应的技术措施,那么,在不久的将来,数字档案馆将会消失在数字图书馆的海洋里,成为数字图书馆的一部分。
10.3数字档案的概念问题。数字档案是数字档案馆生存的基础。但是目前对数字档案概念的认识却并不统一和清晰。其一,对数字档案概念的研究并未引起档案界太多的关注;其二,一些对数字档案概念的认识,大部分都是以传统的档案概念为基础的,仍旧把数字档案当作电子文件的转化物来认识,无非是传统档案概念在数字时代的翻版。这里暂不说传统的以文件为属概念的档案概念本身就有许多可商榷的地方。单说在数字信息时代文件的概念、档案概念和其他信息的概念都会受到影响而发生变化,它们之间有互相融合的趋势。如何区分它们将变得越来越困难。在数字时代的信息网络环境下,数字文件、数字档案、数字图书、数字情报、数字资料、数字文献筹有什么不同?如何区分它们?如果不能把数字档案从这些其他数字信息中区分出来,那么数字档案的概念的存在就将走向消亡,而在数字档案概念基础上建立起来的数字馆大厦也将随之倾覆。因此,必须把数字档案概念从其他数字信息中区别出来,数字档案馆才能生存。但这是一道摆在我们面前的并不容易找到答案的难题。
【参考文献】
1阎会勤.新世纪档案工作展望.档案学通讯,2001;6
23景红.电子档案凭证价值探析.档案与建设,2000;10
456李玉安.数字图书馆建设的十大难题.图书馆学刊,2002;3,
7徐义全.电子文件的特性与长期保存.档案学研究,2000;1
8吴志宏.数字化档案的隐忧:数据失真.北京档案,2002;12
9谭zhēng@①培,数字档案馆论纲.档案学研究,2001;5
1016范开宏.数字图书馆之忧思.图书与情报,2002;1
11邱晓威.数字档案馆及其建设模式.中国档案,2001;10
12段荣婷.我国数字档案馆的研究与建设.中国档案,2002;6
13刘东斌.数字档案馆与数字图书馆的比较研究.档案管理,2003;2
14求实.档案馆与图书馆利用对比分析及对策.北京档案,1999;9
15国家档案局综合科教司.从统计数字看1991年度全国档案事业的发展状况.档案学研究,1993;1
17谭zhēng@①培.数字档案馆建设面临的问题及其对策.浙江档案,2002;3
18朱蒙生.传统档案馆向数字档案馆跨越所面临的问题.中国档案,2003;3
1.档案保管方式不同。传统的项目图纸等实物档案,按照卷册号有序地存放于库房的档案排架上,依照档案库的防火、防霉、防盗等规定进行保管。数字档案的安全保管建立在数据中心的系统安全管理、设备操作管理、访问权限管理、数据备份管理等一系列的安全管理措施之上,侧重于防病毒、防攻击、防灾害等数据安全管理,其安全性明显高于传统档案。
2.档案利用方式不同。传统档案利用需要设计人员亲自到档案馆借阅,且受限于实体档案的数量、档案的借阅情况、档案馆的开馆时间等,利用率较低。数字档案充分利用网络数据传输的便捷性和实时性,随时为用户提供浏览或下载档案服务。数字档案的使用率远远高于纸质档案,使档案充分发挥出其自身的价值。但是,数字档案的频繁访问也对档案系统的健壮性、数据结构的合理性、档案编研的科学性,提出了更高的要求。
二、在电力工程设计中加强数字档案管理的对策
1.加强档案管理业务平台建设。档案管理服务于电力工程设计工作,所以,数字档案管理平台不是孤立的,而是与协同设计平台集成于同一工作平台。电力设计院的设计人员与档案管理人员,都使用该平台进行设计和档案管理等工作,并通过该平台实时在线沟通。在协同设计平台上设计完成的电力工程,其电子档案基于网络审核合格后,由档案管理人员负责接收、整理和网上归档。应用档案管理业务平台实现在线档案收集,保证了电子文档的真实性、及时性和有效性,并能定期对电子文档进行版本更新,极大地提高了工作效率。
2.构建各类档案信息库。档案数字化是一项细致而繁琐的工作,底图和文书档案需进行扫描,声像档案可采用录像转视频文件、照片生成电子图片等方式,集中进行数字化处理。工程档案采用大流水工作方式数字化后,需进一步进行网上编目,自动生成流水号、文档挂接等工作,构建各类档案信息库。档案管理平台具有电子档案密级和权限划分功能,可以根据密级和权限划分规则,对全部电子档案进行密级和权限划分,从而实现了档案信息库的自动安全管理。