文章摘要
GitHub更新了Copilot交互数据使用政策,明确用户数据将仅用于改进产品体验,不会用于其他目的。新政策强调数据隐私保护,确保用户代码和交互信息的安全处理。
文章总结
GitHub Copilot 交互数据使用政策更新
2026年3月25日,GitHub宣布自4月24日起,将使用Copilot免费版、专业版和Pro+用户的交互数据(包括输入、输出、代码片段及相关上下文)来训练和改进其AI模型,除非用户选择退出。Copilot商业版和企业版用户不受此政策影响。
主要更新内容: 1. 数据使用范围: - 包含用户接受的输出内容、发送给Copilot的输入内容、光标位置周边的代码上下文 - 包含用户编写的注释文档、文件名称、仓库结构等元数据 - 不包括企业版数据、已选择退出用户的数据,以及静态存储的私有仓库内容
用户权益:
- 用户可通过设置中的"隐私"选项随时选择退出
- 此前已选择退出的用户设置将自动保留
- 数据仅限GitHub及其关联公司(如微软)使用,不会共享给第三方
改进目标:
- 提升模型对开发工作流的理解能力
- 提供更准确的代码模式建议
- 增强潜在错误检测能力
GitHub表示,此前使用微软员工交互数据已使多语言代码接受率显著提升。该政策遵循行业惯例,旨在通过真实开发场景数据持续优化AI辅助编程体验。
(注:原文中大量导航菜单、图片描述、推广内容等非核心信息已精简,保留了政策变更的核心要素和用户操作指南。)
评论总结
以下是评论内容的总结,涵盖主要观点和论据,并保持不同观点的平衡性:
主要观点1:对隐私和知识产权的担忧
- 论据:用户担心Copilot会使用私有仓库的代码进行模型训练,可能泄露敏感信息或知识产权。
- "Sounds like it's even likely to train on content from private repositories. This feels like a bit of an overstep to me." (djmashko2)
- "Vulnerabilities, Secrets can be leaked to other users. Intellectual Property, can also be leaked to other users." (TZubiri)
主要观点2:对默认设置的质疑
- 论据:用户不满“允许使用数据训练AI”默认开启,认为应是“选择加入”而非“选择退出”。
- "Now 'Allow GitHub to use my data for AI model training' is enabled by default." (mentalgear)
- "If I'm paying, which I am, I want to have to opt-in, not opt-out." (section_me)
主要观点3:法律和合规性问题
- 论据:用户质疑该做法在欧盟等地区的合法性,尤其是涉及PII(个人身份信息)时。
- "Is it legal ? Surely not in any EU countries." (mt42or)
- "What is the legal basis of this in the EU?" (pred_)
主要观点4:对GitHub和微软的不信任
- 论据:用户认为微软/GitHub可能已在使用数据训练模型,即使关闭选项也可能无效。
- "Btw, even if disabled, I have zero confidence they are not already training on our data." (pdp)
- "Maybe it's already active in our accounts and we don't realize it." (TZubiri)
主要观点5:开源社区的负面影响
- 论据:用户认为此举会打击开源贡献,促使开发者转向其他平台或停止开源。
- "Why would I even spend time choosing a copyleft license if any bot will use my code as training data?" (sph)
- "I'm not planning on creating any more opensource code." (sph)
主要观点6:对平台未来的悲观预期
- 论据:部分用户表示将迁移至Codeberg或自托管,认为GitHub正在“恶化”。
- "Now is the time to run off of GitHub and consider Codeberg." (rvz)
- "I'm ready to abandon Github. Enschitification of the world's source infrastructure is just a matter of time." (thesmart)
少数支持或中立观点
- 论据:有用户认为GitHub已明确告知变更且易于关闭选项,或认为问题被夸大。
- "They're not trying to hide this change at all and are very upfront about it." (hmate9)
- "I am not certain this is that big of a deal outside of 'making AI better'." (pizzafeelsright)
关键引用保留
- 反对观点:
- "Why would I even spend time choosing a copyleft license if any bot will use my code as training data?" (sph)
- "Btw, even if disabled, I have zero confidence they are not already training on our data." (pdp)
- 中立/支持观点:
- "They're not trying to hide this change at all and are very upfront about it." (hmate9)
- "I am not certain this is that big of a deal outside of 'making AI better'." (pizzafeelsright)