文章摘要
自2026年3月23日起,监测到来自Meta和微软IP地址的异常访问行为,包括系统性地获取文档库内容、完整存档下载、版本比对、作者分析等,表明存在有组织的企业情报收集活动,而非常规网络爬取。
文章总结
监控活动通告 - TBOTE项目
监控发现
自2026年3月23日起,我们记录到: - 来自Meta公司AS32934阿什本基础设施的70个独立IP地址的1,285次请求 - 来自微软AS8075注册的18个IP地址的1,659次请求
这些访问模式符合企业级情报收集行为,而非常规爬取。
主要监控行为
| 行为类型 | 具体表现 | | --- | --- | | 仓库枚举 | 每个文件以六种格式被读取:渲染视图、源代码视图和原始格式 | | 完整存档导出 | 下载所有提交的完整.bundle存档,包括主分支和四个特定提交 | | 版本比对 | 下载四个提交中的相同文件以重构编辑历史,逐版本比较 | | 作者分析 | 对关键文件执行git blame查询 | | 差异提取 | 获取所有提交的.diff和.patch文件,测试多种空白字符处理标记 | | 文档获取 | 下载德国商业登记文件(PDF和XML格式) | | 变更监控 | 订阅仓库及15个特定文件的RSS/Atom feed | | 互动分析 | 枚举关注者、星标、分支、议题等仓库互动数据 | | 时间线采集 | 采集每日/每周/每月等各粒度时间线的仓库活动 | | 认证探测 | 尝试访问需认证的文档、提交历史和分支视图 | | IP轮换 | 使用70个IP以2秒间隔轮换请求,规避速率限制 |
关于Meta的监控
- 所有请求使用
meta-externalagent/1.1用户代理 - 从AS32934阿什本基础设施的70个轮换IP发起
- 完整爬取仅耗时9分钟
- 2024年Meta联邦游说支出达2630万美元,推动将年龄验证责任转嫁给操作系统提供商
关于微软的监控
- 请求标识为OpenAI爬虫(GPTBot/OAI-SearchBot)
- 流量来自微软AS8075注册的亚特兰大、华沙和首尔IP段
- 2024年微软联邦游说支出1035万美元,支持多项儿童安全立法
- 微软2021年收购Kinvolk GmbH,其前员工后来创立了Amutable GmbH
最新进展:监控范围扩大
新增监控来源包括: - Google云平台(使用2020年浏览器签名的大规模轮询) - Palo Alto Networks的Cortex Xpanse(企业级侦察工具) - Censys等多家机构的自动化探测
后续措施
所有可疑请求均被完整记录(含头信息、时间戳、TLS指纹等),这些日志将: 1. 作为企业关注本调查的证据存档 2. 在调查人员遭遇职业报复时公开发布 3. 提供给报道开源治理议题的记者
特别声明
本网站所有发现均基于公开记录: - 德国商业登记文件 - 游说披露报告 - systemd拉取请求 - FTC和解协议
我们欢迎通过[联系页面]进行事实更正,但拒绝将沉默监控作为替代性参与方式。
关于平台压制:虽然我们的社交媒体账号在发布研究链接后屡遭封禁,但公开记录无法被删除。每条发现均可通过我们提供的命令独立验证。封禁只会促使更多人传播这些发现。
评论总结
以下是评论内容的总结,涵盖主要观点和论据,并保持不同观点的平衡:
年龄验证与身份检查的区别
- 观点:区分护照ID检查与“是否超过18岁”的复选框,认为两者是不同的法律要求。
- 引用:
- "Don't confuse the passport ID check with the 'are you over 18?' checkbox. Both types of laws exist." (评论1)
- "To ban 16 and younger from social media will require every user to be identified." (评论13)
政府动机与 unpopularity
- 观点:质疑政府推动年龄验证的动机,认为其 unpopularity 但仍被实施。
- 引用:
- "what do governments get out of this? ... I don't see how this is highly unpopular from governments and still being implemented." (评论2)
- "There have been pushes to implement similar instances of this for a while now." (评论5)
隐私与加密技术
- 观点:批评Persona SDK的加密实现问题,并探讨隐私保护的替代方案。
- 引用:
- "Seems like a pretty big fuck up, if so. I wonder why did they not use asymmetric encryption." (评论4)
- "I wonder if not private age verification could not be solved with the right cryptographic protocol." (评论7)
互联网的变化与隐私
- 观点:互联网已从爱好者社区变为大众化,隐私保护是猫鼠游戏。
- 引用:
- "the internet is not the same as it was 20 years ago ... privacy has always been a game of cat and mouse." (评论6)
- "It’s good that for non SFW stuff you do the need the internet anymore ... no more npm or React garbage needed." (评论10)
年龄验证的替代方案
- 观点:提出互联网提供者应承担儿童访问责任,而非强制年龄验证。
- 引用:
- "WHO IS PROVIDING INTERNET TO A CHILD ... they are liable." (评论11)
- "If you have a credit card, you are an adult." (评论11)
对研究质量的批评
- 观点:批评某网站的研究质量低,依赖LLM且逻辑混乱。
- 引用:
- "their research is massively written by LLMs ... lacks logical connections." (评论8)
- "The second source they link to has been a dead link for 11 months." (评论8)
LLM的负面影响
- 观点:LLM的自我强化数据循环可能导致脆弱人群受影响。
- 引用:
- "LLM feedback loops are scary because they self-reinforce by training over their own data drift." (评论12)
讽刺与幽默
- 观点:以讽刺方式表达对“保护儿童”政策的质疑。
- 引用:
- "The root password to the Constitution is 'ITs4daChildren!'" (评论9)
- "So to avoid it all I have to do is stop using social media? LGTM" (评论3)
总结:评论围绕年龄验证、隐私保护、政府动机、互联网变化及技术问题展开,既有对现状的批评,也有对替代方案的探讨,同时包含对研究质量和政策动机的质疑。