《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > 数字图书馆的“数字”难题
数字图书馆的“数字”难题
来源:网界网
王莹
摘要: 数字化图书馆发展的根本是资源的数字化。大数据促使数据产生的范围、方式、途径发生翻天覆地的变化,人们的一举一动、一言一行、行为规律等都将产生出大量的半结构化。对于数字图书馆而言,对这些复杂数据进行的应用、存储、分析将面临着更大的难题。
关键词: 国图 于洪波
Abstract:
Key words :

      中国国家图书馆(以下简称国图)位于北京市海淀区白石桥南长河畔,紫竹院公园旁。坐落在中关村南大街33号。建筑面积26万平方米,国家图书馆的主楼为双塔形高楼,通体以蓝色为基调,取其用水慎火之意。主楼采用双重檐形式,孔雀蓝琉璃瓦大屋顶,淡乳灰色的瓷砖外墙,花岗岩基座的石阶,再配以汉白玉栏杆,地上书库19层,地下书库3层,书库建筑面积6万平方米,设计藏书能力2000万册。 裙楼分布在主楼两侧,并形成两个面积甚大的天井,天井内为花园,形成楼中有园的独特景致,裙楼地上5层地下1层,分布着图书馆的各个功能单元,设有各具特色的阅览室46个,其中开架阅览室23个,日均可接待读者六、七千人次。

中国国家图书馆的自动化建设起步于70年代中期。1989年大型计算机综合管理系统启动,进行图书馆自动化应用系统的开发与实践。从1995年开始,按照数字化、网络化建设的思路,国图制定了《国家图书馆网络建设发展规划(1997-2000)》,在网络建设、软件开发、数据加工等方面开展攻关。1999年2月,国图在中国国内图书馆界率先采用先进的千兆位以太网络技术,开通了拥有3000个信息节点的馆域网,将各个应用子系统连接起来。在互联网建设方面,开通了国际互联网中国国家图书馆站点;分别与国务院办公厅、清华大学、北京大学等实现了100M速率的专线联接;与中国计算机公用网、中国教育科研网、中国科技网及北京有线电视网、国家广播电影电视总局全国有线电视网、网通等实现了高速互联,使国家图书馆初步建成网上信息资源的中心枢纽。

作为互联网上重要的信息内容提供者,国图很早就意识到了自己在中文数字资源建设与服务方面的重要责任。从1987年起,国家图书馆开始致力于电子出版物的收集与馆藏书目数据库的建设,2000年起开始有计划地进行馆藏特色资源的数字化建设。2005年10月,由国家图书馆主持建设的国家数字图书馆工程获得国务院批准开始建设,工程明确提出了建设世界上最大的中文数字信息保存基地和中文数字信息服务基地的目标。目前正在进行的一期维修改造工程完成后,建成的数字化图书馆的非结构数据存储量将达到800TB左右。随着国图数字化进程的日趋完善,海量数据、安全等问题也日益突显。本期访谈我们就走进国图,中央控制室主任于洪波的最新文章">于洪波将为我们揭示国图数字化背后的秘密。

国家图书馆中央控制室主任于洪波

海量数据“存”与“用”

数字图书馆是当今世界各国视为国家信息基础设施建设、知识、创新体系和创新能力的重要组成部分。国家图书馆从1995年起开始跟踪研发数字图书馆,1998年向文化部提出申请,要求在国家立项实施“中国数字图书馆工程”,同时着手进行数字资源建设,已建成相当规模的数字资源量,其中部分已经为社会提供服务。

国图的整体建筑作为智能建筑,网络数据主机房是图书馆的“心脏”,所有业务的正常运行都依赖于网络的可靠连接及设备的正常运行。国图对于网络的可靠性、安全性、可拓展性等各方面有着高标准的要求。于洪波详细介绍道:“馆内的信息点多达几千个,信息点支撑起整个国图机房的数据中心主干。目前,国图有近百台服务器、上千台PC连接到馆域网。其中,有328台连接到互联网,此外,ALEPH 500计算机综合管理系统早已全面投入运行。如今,国图网上读者已逾千万人次,平均每天有超过50万人次左右。而且随着国家图书馆千兆馆域网的正式开通和大量文献数字化,读者通过终端能快速检索馆藏古今中外图书、期刊、电子出版物、视听资料等各种文献,而这一切都要归功于国家图书馆的数字信息化的建设。”

数字化图书馆发展的根本是资源的数字化。大数据促使数据产生的范围、方式、途径发生翻天覆地的变化,人们的一举一动、一言一行、行为规律等都将产生出大量的半结构化、非结构化信息数据,信息数据的组成结构、类型格式、存在形态等都愈加复杂。对于数字图书馆而言,对这些复杂数据进行的应用、存储、分析将面临着更大的难题。

数据量的急剧增长就需要面临两方面的挑战一个是“存”,另一个是“用”。“存”要求数据的完整、持久,“用”的含义是及时、有效。这也是国家图书馆大数据存储面临和需要应对的问题。于洪波介绍道:“国图目前面临的问题之一是非结构化数据的存储。国图中央控制室视频存储数据量巨大,达800T到900T。国图数据存储介质最早是磁带,这种方式检索和经营成本很大。此外,大磁盘阵列的方式国图使用得也比较多,但是,它有一个弊端在于高热量的情况下磁铁就会被破坏。另外一种方式是固态硬盘,但是也有一定的局限性。光盘的存储形式好处比较多,刻录后内容永久写入,不易被篡改。目前,以‘光存储’数据的主要介质是国图的‘缩微胶片’。‘光存储’是文献、资料数字化的一种表现形式,同‘电’存储和‘磁’存储相比,其稳定、不易修改、抗击强电磁场和强磁电场干扰、抗击热冲击的特点比较突出,同时可以完全抗击网络黑客和病毒的攻击,成本也较为低廉。”对于大数据量的存储,于洪波认为,既要考虑到现实情况,也应该看到未来长远的趋势,应该具有一定的前瞻性。

云计算改良安全环境尚待时日

国图每年大约要接待海内外读者400多万人次。国图的藏书可上溯到700多年前的南宋皇家缉熙殿藏书,最早的典藏可以远溯到3000多年前的殷墟甲骨。截至到2005年,国图的藏书容量达2500多万册,其中价值连城的古籍善本就有200余万册。图书馆即作为一种提供服务的公共场所,又作为珍藏着大量的珍贵文物的特殊场所,如何保障人员安全、资源安全,成为数字图书馆时代,国图需要首先解决的难题。此时楼宇的整体安全防范建设就显得尤为重要。

国图的智能建筑,由主机房进行全面的管控,针对公共服务的网络环境,国图主机房安全防控进行了细致的布置:主机房采用了感烟探测器。当设有固定灭火系统时,采用感烟、感温两种探测器的组合;当主机房内设置空调设备时,应受主机房内电源切断开关的控制,机房内的电源切断开关最大限度地靠近工作人员的操作位置和主要出入口。在智能楼宇的公共安全方面,国图新馆的公共安全防范系统(SafetyAutomation System,SAS)已经启用,主要包含入侵报警系统、闭路监控系统、门禁系统、电子巡更系统以及公共安全防范综合管理系统等五个子系统。这一系统的启用在加强内部管理同时,也为人们提供了一个更加安全宁静的读书环境。后端监控中心配备有两台UPS电源,当遇到图书馆意外停电时,UPS电源负责对所有网络视频监控系统设备进行集中供电,保证监控系统能够继续正常运行2个小时。监控系统通过光纤高速接入中央控制室,管理者可通过馆域网调看录像或实时监看各个监控画面,实现高效管理。

信息时代的图书馆应该是高度信息化的图书馆,在谈到自动控制系统今后的发展方向时,于洪波认为未来一定是以处理各种探测信息和数据为核心的控制系统,这些数据会随着探测器技术的发展而发展,信息探测技术会随着探测器技术的更新而更新,所以安全防范系统的消防自动控制系统和安防自动控制系统,逐渐趋于一个平台进行管理,这时就会应用到云计算技术。打破各个系统之间的壁垒,在一个平台上统一进行管理。但是,在此之前,如果对各个系统进行数据库整合还是一个尚待解决的问题。如何实现云计算在数字图书馆安全防范中的应用还尚需时日。

此内容为AET网站原创,未经授权禁止转载。