“随着出版界和图书馆界总体上越来越数字化,国会图书馆也在走向数字化。”Conklin说,他在CIO办公室管理着大约400名员工,其中包括大约200名的承包商。
国会图书馆坐落于国会山麦迪逊、亚当斯和杰斐逊大楼的三座建筑里,不断接受着新的物理和数字数据以及元数据。虽然他们的目标不是将所有的资料全部数字化,但这一转变仍然是巨大的,Conklin说。“有些数据我们会保存在本地,有些数据则希望放在云平台,获得云计算的效率和弹性。”她补充道。
麻省理工学院斯隆管理学院的首席研究科学家兼高级讲师George Westerman说,这项雄心勃勃的事业将惠及整个社会。
“LOC的目标是通过数字化来‘打开宝藏’,这样它就可以让全国各地的公民、教师和创新者都能访问图书馆的各种资料,而不需要亲自来华盛顿了。”Westerman说。
改造国会图书馆
LOC最初引入了埃森哲来帮助其指导现有的数字化转型。这项为期三年的工作包括将超过130个图书馆IT系统和应用程序从麦迪森大楼的一个“过时”数据中心转移到华盛顿特区外的一个最先进的三层数据中心,以及由图书馆管理的并通过多路径广域网连接的其他数据中心和云服务。
有了这个企业云环境,图书馆现在可以专注于版权局的企业版权系统(ECS)、国会研究服务局(CRS)的集成研究和信息系统(IRIS)项目,以及改善图书馆所接受、管理和维护信息的各种项目,并提供馆藏资料,其中包括了视听内容管理系统和新的图书馆内容平台。
ECS项目会将版权数据分配给一家大型云提供商,尽管Conklin拒绝具体说明是三大提供商中的哪一家,但该项目将使申请版权的流程更加容易和透明。“越来越多的人希望注册他们的资料以获得版权。”Conklin说。
由许可建议和公共记录等多个部门组成的美国版权局(US Copyright Office)依靠的是人工流程与那些已经实现现代化的IT系统的自动化流程的混合。国会为这项任务拨款了6000万美元,图书馆对完成这项任务有一个“非常严格的截止日期”,Conklin说,预计将于2024年的10月份上线。
Conklin正在修改图书馆的项目管理程序,他还启动了一项为期五年的数字存储计划,其中包括了吸收许多从各种来源以数字格式进入图书馆的数字化藏品,以及国会两院的数字化内容。
数十年来,该图书馆一直在传统遗留系统中存储数字化数据,包括许多重要的历史文献和收藏。一些数字化文档将保留在本地,因为并不是所有的内容都将公开。
“目标不是数字化100%的馆藏,有些人可能会对此感到沮丧。”但Conklin表示,图书馆的预算不允许建立无限的数据仓库,尽管她也指出,国会在两年前通过的一项法律正在放松对更多数据的公开。
例如,美国宪法就不会出现在国会图书馆的网站上,Conklin说。然而,图书馆的数字化转型也影响了我们对宪法的理解,因为一名内部保护主义者利用对宪法数字化草案的光谱分析发现了以前未被发现的编辑内容。
“他们分析了宪法草案的一层又一层,他们说他们发现了对宪法所做的修改……而这些修改并不为人所知,”Conklin说,他们将其发现与可追溯性的打开轨迹更改进行了比较。
该图书馆还涉足了实验性的人工智能技术,如计算机视觉、机器学习以及专注于音频剪辑和视觉艺术的应用程序,其中大部分是作为开源软件来提供的。
因为进入国会图书馆的数据和元数据一直存在,数字化转型的工作也永远不会真正完成。“这将是每个首席信息官的奋斗目标。”Conklin说。
毫无疑问,LOC比它刚开始进行数字化转型时的水平已经领先了很多。