你知道吗,Wayback Machine(时光机)目前以不可思议的速度每天存档网页吗?哦,它位于旧金山的一座教堂里。
新闻机构CNN最近与互联网档案馆进行了采访,该机构包含Wayback Machine。Wayback Machine位于旧金山的芬斯顿大道上,坐落在一座曾是基督教科学家教堂的大型新古典建筑中,现在维护着29年的网络历史。
在1996年档案馆成立之初,一整年的网页总共大约需要2 TB的存储空间。现在,仅仅一天就消耗了150 TB,整个档案的副本是175 PB(即175,000 TB),并且还在不断增加。在十月份,档案馆庆祝成功存储了超过一万亿个网页。
虽然一组服务器被象征性地放置在前教堂建筑中,但整个档案实际上并没有存储在芬斯顿大道的地点。大部分档案的服务器位于旧金山外的一处仓库,副本被分布在世界各地。
这些备份不仅在火灾、洪水或其他自然灾害发生时是明智的。CNN指出,特朗普政府删除了很多政府网站。
“这个变化是巨大的。整个网络的多个部分都崩溃了,”互联网档案馆创始人布鲁斯特·凯尔委婉地解释道。“(政府)有了新的看法,这就是我们需要图书馆来保存记录的原因。”
当然,互联网档案馆不仅仅是存储网页。它还保存了4900万本书籍、1300万音频录音(其中包括268,000场现场音乐会)、1000万视频(包括300万个电视新闻节目)、500万张图片和100万个软件程序。
这个组织于2005年开始数字化图书。目前,它在全球20个地方每天扫描4,400本图书。1929年或之前出版的书籍可以下载,数十万本现代书籍可以通过该组织的开放图书馆网站借走。
遗憾的是,它去年遭遇了一场诉讼,结果有50万本书被迫从图书馆中移除,因为互联网档案馆在九月份失去了上诉。卡尔当时指出,“世界变得更愚蠢了”。
至于电视内容,互联网档案馆于2000年底开始存储电视节目,第一个主要的电视项目围绕2001年9月11日事件相关的电视新闻。在2009年,档案馆让选定的美国电视新闻广播进行电视新闻档案中的字幕搜索。
不过,对于一个专注于记录过去的组织来说,它也在向前看。根据CNN的报道,互联网档案馆正在“尝试通过每天提出数百个基于新闻的问题和提示,来记录人们通过聊天机器人获取新闻的方式,同时记录查询和输出。”
如果你在城里,听说你可以在周五下午1点参加免费的设施 tour。作为一个自称是极客的人,这无疑会在我的旧金山行程中占据很重要的地位。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.