20120903/网络世界中的迷失

译言网方小磊译/科技与社会:互联网数字化内容爆炸性增长,对内容的长久性保存鲜有人问津。后世的历史学家们会不会期盼以前的网页能不能保存得更仔细些?

追溯早期的网页很可能会是个问题。比如说,《经济学人》最早先的网页是由其派驻美国加州的记者制作,1994年3月上线。八个月之后,该网页改版,并由杂志社总部收回接管。网站所有的原始网页记录均消失得无影无踪。有关互联网从不会遗忘的观点就此打住,忘性由此得以证明。

就连世界上首个互联网——1991年8月投入使用的万维网连一张屏幕截图也没留下。敲入它的地址后,展现在你眼前的是一个现代感的网站,里面有Berners-Lee在欧洲原子核研究委员会工作时取得的学术成就。在那里他主持开发了世界上第一个网页浏览器和服务器。

随着诸如电子邮件、音乐下载、视频流等因特网服务爆炸性增长,互联网本身也在疾速扩张。互联网内容更新快速,过往内容遗失不足为奇。长今基金会Stewart Brand说:“文明的发展带来了严重的健忘症。”从事并行信息处理和机械智能的工程师Danny Hillis担心世界已经陷入黑暗数据时代,缺乏过往的文化成果为将来发展道路指明方向。

文化成果的缺乏,社会就缺失了从过往错误中汲取教训的机制。可能导致的后果也是显而易见的。正如建于公元前3世纪,以藏有当时世界上出版的每种图书(许多图书都是孤本)享誉的亚历山大图书馆一样。在凯撒大帝征服埃及的公元前48年到公元640年穆斯林军队入侵的某段时间里,该图书馆毁于一场大火。

那场大火燃起的原因时间等细节迄今不得而知。但是许多名家如Aristotle,Aeschylus,Euripides ,Sophocles 的著作焚于那场大火,其他古代天文学家、数学家、诗人、剧作家哲学家的被毁的作品更是不计其数。 现今留存下来的所有作品只占亚历山大图书馆当时藏书的很小一部分,是其下属一个名叫Serapeum的庙宇内留存的备份。 一些历史学家认为,亚历山大图书馆的损失,大量书吏学者的散佚,是造成横行欧洲黑暗中世纪和罗马帝国衰亡的因素。直到文艺复兴运动曙光初露,欧洲已在无知和贫穷中度过了一千年。

鲜有人认为当今的数字黑暗时代预示着类似的灾难。尽管上述情况可能会对教育、学术、政府治理甚至国家安全产生严重后果。对未来情况的忧虑并非没有道理。

寻觅早期的《经济学人》网页无果而终并不令人感到意外。在当今搜索引擎上线之前的几年里,原先的网站早已停止服务。同一时代的网络服务(诸如Aliweb、JumpStation和WebCrawler)不是弃之不用就是改换门庭。甚至帮助用户寻找老旧网页的搜索引擎——Wayback Machine亦行将就木。

开发Wayback Machine的Brewster Kahle是一位IT 企业家,热衷慈善,痴迷电脑。曾在1980年代帮助Hillis先生设计具有开拓性质的Connection Machine。在1996年Brewster Kahle创立了一个名叫因特网档案馆的非营利性组织,能免费收存线上所有网站的每张网页。Wayback Machine的用户能浏览其收存的过期网页。如今因特网档案馆收存的内容也包括文本、音频、动态图像和软件。最近的盘点显示,该档案馆收存的品项数量超过1500亿。

因特网档案馆一个有趣的副产品就是开放图书馆。这个图书馆致力于提供存世的每一种图书的网页版。 开放图书馆不同于已故Michael Hart创立的古登堡计划,早在1971年他就是电子图书的缔造者。古登堡计划提供免费下载的图书多达4万册,涵盖主要的电子书格式。

奥秘

相比之下,开放图书馆实质上是一个可编辑的目录。这个机构同世界各国的图书馆合作,将它们的藏书分门别类扫描成多种格式的文档。到目前为止已收录的条目超过2千万条,扫描的公版书籍超过170万册,当然,所有书籍均可免费下载。如果碰到一本仍在版权保护期内的图书,这本书将作为待扫缺损图书在数周内可供读者检索,而不是像实体图书馆的藏书提供下载。

但是为何在Kahle先生做这一切的时候,谷歌、亚马逊、苹果和其他一些公司开足了编辑、扫描、录入设备的马力,不遗余力地把这些文明成果搬上网呢? 一个显而易见的答案就是,这些商业企业对用户获得的一部分信息是收费的,而非营利性的网络档案馆总的说来分文不取。 除了钱的问题,开源性的档案馆值得推崇还有其它一些因素。比方讲,商业出版商提供给搜索引擎的信息是有选择性的,对其收存的档案的可获得性做了一定的限制。甚至就算这些内容已经过了版权保护期,这些商业性档案馆的用户仍不能享有这些内容查阅和传播的权利。

正如因特网档案馆所觉察出的那样,如果没有图书馆,人们的“记忆权”很难得以履行。在越来越多的公共信息从印刷方式向数字形态转变的时候,不论何种虚拟档案馆,为了将来的资料参考和责任义务,尽可能多地收贮资料,是非常重要的。

《经济学人》将其从1843年创刊以来的每一期杂志都制作成数字拷贝,就是部分基于这样的考虑。 但是,早期网页的缺失却不止是《经济学人》一家面临的问题。