人们很容易忘记互联网的无常。页面不断更新,文章在没有警告的情况下被删除,整个网站一夜之间就消失了。据估计,自2013年以来,网络上66%的页面链接现在已经死亡,这一现象被称为链接腐烂。
您可能无法访问特定网页的原因有很多。服务器可能已关闭,或者网站所有者已更改(或删除)您要查找的内容。在这些情况下,有必要检查缓存版本是否仍然存在。
谷歌曾经保存其索引的网页的备份副本,但从搜索结果中查看网页缓存版本的选项已被删除。“它的目的是帮助人们访问页面,而在很久以前,你往往不能依靠页面加载。这些天来,情况有了很大改善。谷歌的官方搜索联络人丹尼·沙利文在2月份表示。
这是一个令人费解的举动,但谷歌在谈到夕阳产品时从来没有害羞过。不过,还有其他选择。以下是如何访问网页的缓存版本。
查看Microsoft Bing上的缓存
谷歌可能不再对保护网络感兴趣,但微软的必应仍然提供查看你试图访问的网站的保存版本的功能。在必应上查看缓存网站类似于谷歌过去的做法。在搜索结果页中,单击要访问的条目旁边的向下箭头,然后从菜单中选择缓存。
你将被带到有问题的页面,顶部会有一则通知,指出这是必应上次爬行网站时的页面快照。(请注意,此过程也将适用于雅虎!搜索,因为微软必应为雅虎处理网络爬行。)
使用Wayback机器搜索网站的历史
如果你在一个经常被抓取的网站上寻找历史数据,缓存版本不会有特别大的帮助。随着时间的推移,为了获得网站的更大图景,非营利性的互联网档案馆托管着网站、文本、视频、音频、软件和图像,这些都是在其他地方很难找到的。而它的Wayback Machine,可以为现有的和死掉的网站工作,可以让你查看它们随着时间的推移的快照。
输入您要浏览的URL,存档搜索引擎将显示一个日历,指明Wayback Machine何时爬行该页面。单击日历上的日期可查看该站点在该日期的外观。Wayback Machine是查看互联网历史的好方法;PCMag.com的存档版本可以追溯到1996年12月19日!
难道你不想等Wayback机器发挥它的魔力吗?如果您有想要为后代保留的网页,也可以从Wayback Machine主页手动将其存档。将URL粘贴到立即保存页面下的文本字段中,然后单击保存页面。
如果你有一个互联网档案帐户,你还可以保存该页面的屏幕截图,并为它链接的任何其他页面创建一个档案。做出您的选择,再次单击保存页面,然后等待生成存档。
不想直接访问网站吗?互联网档案还为Chrome、Edge、Firefox和Safari提供了Wayback Machine浏览器扩展,允许你直接从相关网站搜索档案。
Archive.Today
存档网站The Archive.Today允许用户保存网页的最新版本,还可以搜索之前保存的现有条目。在红色文本框中输入URL以存档现有页面。如果最近创建了存档,您将有机会查看它并保存新的存档。
如果要查看网站的存档版本,请在蓝色文本框中输入URL并存档。今日将填充该页面及其关联域的结果。如果同一页面有多个版本,它们将堆叠在一起以便于查看。然后,您可以下载Web存档的压缩文件。例如,PCMag的网站早在2013年1月31日就已存档,目前有近70个不同版本的主页保存在该服务上。
已经为Chrome、Edge、Firefox和Safari创建了非官方的浏览器扩展,允许您只需点击一个按钮就可以将页面存档。
有话要说...