来自:
[奇客Solidot | 2013 年的网页有 38% 今天已无法访问](https://www.solidot.org/story?sid=78207)
根据皮尤研究中心的一项分析,从2013年到2023年10月,有38%的网页已经无法访问。研究人员使用了Common Crawl存档的网页来进行研究,该服务定期存档互联网的快照。研究人员每年收集了约9万个网页的样本,检查这些网页今天是否还能访问。
研究结果显示,截至2023年10月,四分之一的网页无法访问,其中16%是网页不存在但域名还在,9%是域名都不存在了。2013年的快照收集的网页中,有38%在2023年无法访问;2021年的快照两年后有五分之一无法访问。
研究人员还使用Common Crawl在2023年3月和4月的快照分析了50万个政府网页,检查网页上的链接是否有效。结果显示,在4200万个链接中,86%是站内链接,这些政府网页大多使用HTTPS;6%指向静态文件,如PDF;16%的链接被重定向;6%的网页无法访问;21%的网页至少包含一个坏链。
对新闻网站网页的分析发现,23%的网页至少包含一个坏链,高流量和低流量新闻网站的网页中坏链的比例基本相同。此外,54%的维基百科网页的参考链接至少包含一个死链。
研究人员还在2023年春季分析了X/Twitter上的实时推文样本,发现接近五分之一的推文在3个月后基本不可见。其中,60%是因为账号被设为私有、冻结或删除,而40%是因为账号发布者自己删除,但账号本身仍然活跃。
----------华丽的分割线------------
中文互联网的比例应该只会更高。
2013年的时候新浪博客啥的是不是还在?
其实吧,就算我自己搭了网站,保不齐哪天忘了域名续费、服务器续费、网站故障数据丢失,又或者遭遇意外狗带了,都会让这些内容消失。
同样的,不管什么公众号、知乎、小红书,连google都是说关什么服务就关什么服务,阿里达摩院成立的时候说啥来着,反正定位很高,现在不也没了嘛。
这时候应该要有广告出现了,比如搞个NAS备份,中年男人的玩具。
往年今天...
- Favorite tweets - 2015
- 昨天和今天,关键字:酒,肉,热,达芬奇密码 - 2006