Loading... # 维基百科再度拉黑 Archive.today,删除 69.5 万条存档链接 # 一、新闻概述 ## 1. 标题 维基百科再度拉黑 Archive.today:利用访问者浏览器发动 DDoS 攻击 ## 2. 发布时间 2026 年 2 月 20 日 ## 3. 来源 维基百科社区共识、Solidot、IT之家等多家媒体报道 # 二、核心内容 ## 1. 事件摘要 ### A. 主要内容 英文版维基百科编辑达成共识,决定将网页存档网站 Archive.today 及其镜像站点(archive.is、archive.ph)列入黑名单,并清理分散在约 40 万个页面中的 69.5 万条引用链接。 ### B. 核心亮点 - 维基百科史上最大规模的链接清理行动之一 - Archive.today 被指控利用访问者浏览器对持异见者发动 DDoS 攻击 - 该网站还涉嫌冒用他人身份、篡改存档内容 ## 2. 关键信息 ### A. 涉及数据 - 受影响页面:约 40 万个 - 待删除链接:约 69.5 万条 - DDoS 攻击频率:每 300 毫秒发送一次请求 ### B. 涉及服务 - Archive.today 主站 - archive.is、archive.ph 等镜像站点 - CAPTCHA 验证页面(被植入攻击代码) ### C. 事件时间线 - 2023 年 8 月:博主发表调查文章 - 2025 年 10 月:FBI 发出传票 - 2026 年 2 月:DDoS 攻击曝光 - 2026 年 2 月 20 日:维基百科正式拉黑 ## 3. 背景介绍 ### A. Archive.today 简介 Archive.today(又称 archive.is 或 archive.ph)是一个私人资助的网页存档网站,成立于 2012 年。与互联网档案馆的 Wayback Machine 不同,该服务采用用户主动提交的方式存档网页,不遵守 Robots 排除标准。 ### B. 历史争议 - 2013-2016 年:曾被维基百科拉黑,原因包括僵尸网络和链接垃圾 - 2015 年:封锁芬兰 IP 地址,避免与政府纠纷 - 被中国、哈萨克斯坦封锁 # 三、详细报道 ## 1. DDoS 攻击事件 ### A. 事件起因 2023 年 8 月,博主 Jani Patokallio 发表文章,利用公开信息调查 Archive.today 幕后运营者的身份,文章点击量约 1 万次。 2025 年 10 月,FBI 向域名注册商 Tucows 发出传票,要求提供 Archive.today 注册者信息。媒体报道时引用了 Patokallio 的博客,称 Archive.today 创始人可能来自俄罗斯。 ### B. 攻击手段 Archive.today 向 Patokallio 发送邮件要求撤下文章(被 Gmail 归类为垃圾邮件)。在未获回应后,该网站在 CAPTCHA 验证页面中嵌入了恶意代码。 攻击原理: ```mermaid graph LR A[用户访问 Archive.today] --> B[弹出 CAPTCHA 验证] B --> C[页面加载恶意 JavaScript] C --> D[每 300ms 发送请求] D --> E[目标博客服务器] E --> F[带宽耗尽/费用增加] ```  只要用户保持 CAPTCHA 页面打开,恶意代码就会每隔 300 毫秒向 Patokallio 的博客发送一次请求,通过大量访问者的浏览器形成分布式拒绝服务攻击。 ### C. 威胁与骚扰 Archive.today 运营者对 Patokallio 进行辱骂和威胁,声称要开发与他名字相关的 AI 色情内容。 ## 2. 其他恶意行为 ### A. 篡改存档内容 Archive.today 被发现在存档页面中擅自插入与持异见者相关的内容,破坏了存档作为可靠证据的可信度。 ### B. 冒用身份 该网站涉嫌冒用他人身份进行操作。 ## 3. 维基百科的决策 ### A. 社区讨论 DDoS 攻击事件曝光后,维基百科志愿者发起了关于是否将 Archive.today 加入黑名单的讨论(RFC 5)。 ### B. 最终决定 维基百科编辑达成共识: - 立即弃用 Archive.today - 将其添加到垃圾黑名单 - 创建编辑过滤器阻止添加新链接 - 删除所有指向该站点的约 69.5 万条链接 # 四、影响分析 ## 1. 行业影响 ### A. 网页存档生态 Archive.today 曾被视为仅次于互联网档案馆的第二重要网络存档服务,特别适用于: - 收费网站的存档 - 大量使用 JavaScript 的页面 - 被 Robots.txt 阻止的页面 此次事件将严重影响其可信度和使用率。 ### B. 存档服务信任危机 用户对第三方存档服务的信任度下降,可能促使用户转向: - 互联网档案馆 Wayback Machine - 自建存档方案 - Perma.cc 等学术存档服务 ## 2. 用户影响 ### A. 维基百科读者 - 约 40 万个页面的引用链接失效 - 部分历史证据难以追溯 - 需要寻找替代存档来源 ### B. 数据保存爱好者 - 失去一个重要的存档工具 - 对存档服务的可靠性和中立性产生质疑 ## 3. 技术趋势 ### A. CAPTCHA 安全性 此次事件暴露了 CAPTCHA 页面可能被滥用的安全风险,网站运营者需要更严格地验证第三方脚本的安全性。 ### B. 存档服务规范化 事件可能推动存档服务行业建立更明确的道德准则和透明度要求。 # 五、各方反应 ## 1. 官方回应 维基百科社区通过编辑共识机制做出了此次决定,体现了社区治理的运作方式。 ## 2. 业内评价 ### A. 数据保存社区 Reddit 等平台的 DataHoarder 社区对此进行了激烈讨论。部分用户认为: - Archive.today 的功能确实独特且有用 - 但其恶意行为不可接受 - 维基百科的决定合理 ### B. 安全专家 安全专家指出,利用访问者浏览器发动攻击是一种隐蔽但危害巨大的手段,难以被传统防御措施检测。 ## 3. 替代方案 ### A. 互联网档案馆 - 遵守 Robots 标准 - 主动爬取 - 更高的可信度 ### B. Perma.cc - 专注于学术和法律引用 - 更严格的内容审核 - 非营利性质 ### C. 自建方案 - 使用 wget、httrack 等工具 - 完全控制存档过程 - 避免第三方风险 # 六、相关链接 ## 1. 官方公告 - 维基百科 RFC 讨论:Wikipedia:Requests_for_comment/Archive.is_RFC_5 - 维基百科黑名单政策 ## 2. 相关报道 - Solidot:Archive.today 对博主发动 DDoS 攻击,维基百科考虑将其屏蔽 - Ars Technica:Wikipedia might blacklist archive.today after site maintainer DDoSed a blog - IT之家:网页存档站点 Archive.today 再度被维基百科拉黑 ## 3. 技术文档 - Archive.today Wikipedia 条目 - 互联网档案馆 Wayback Machine *** ## 参考资料 1. [Archive.today - 维基百科](https://zh.wikipedia.org/wiki/Archive.today) 2. [Solidot - Archive.today 对博主发动 DDoS 攻击](https://www.solidot.org/story?sid=83542) 3. [Wikipedia:Requests_for_comment/Archive.is_RFC_5](https://en.wikipedia.org/wiki/Wikipedia:Requests_for_comment/Archive.is_RFC_5) 最后修改:2026 年 03 月 22 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏