Hacker News 中文摘要

RSS订阅

ICLR 2026投稿中至少50篇存在虚假引用 -- At least 50 hallucinated citations found in ICLR 2026 submissions

文章摘要

GPTZero在ICLR 2026会议论文中检测出50多处虚假信息,包括作者署名错误等事实性错误。例如TamperTok论文实际作者与标注不符,MixtureVitae论文也存在类似问题。这表明当前学术论文中可能存在未被发现的AI生成或错误内容。

文章总结

GPTZero在ICLR 2026会议论文中发现50余处虚构内容

人工智能检测工具GPTZero对即将召开的ICLR 2026会议论文进行审查,发现超过50处存在虚构或错误引用的内容。这些"幻觉"(hallucinations)主要表现为作者名单不实、论文标题篡改或引用文献不匹配等问题。

典型问题案例

  1. 作者信息造假
  • 论文《TamperTok》列出的所有作者均与原始文献不符
  • 《MixtureVitae》虚构了7位不存在的作者
  1. 标题与内容不符
  • 《PDMBench》引用的论文标题和年份均存在错误
  • 《IMPQ》的arXiv编号真实,但论文标题和作者全系伪造
  1. 虚假引用
  • 《SAFE-LLM》引用的ACL 2023论文作者信息不实
  • 《Microarchitecture Is Destiny》篡改了真实论文《FP6-LLM》的作者列表

检测方法

GPTZero通过比对OpenReview平台论文与公开数据库,采用以下验证标准: - 作者身份真实性核查 - 论文标题和元数据一致性检查 - 引用文献的准确性验证

问题严重性分布

| 评分区间 | 论文数量 | 主要问题类型 | |---------|--------|------------| | 8.0 | 2 | 作者虚构 | | 4.0-6.0 | 8 | 标题/引用不符 | | ≤3.0 | 12 | 多重信息错误 |

值得注意的是,部分高评分(8.0)论文同样存在严重的内容虚构问题,这表明学术评审系统可能存在漏洞。

该发现引发了对AI生成学术内容可信度的担忧,也提示需要加强学术出版物的审核机制。目前ICLR组委会尚未就此事发表正式回应。

(注:本文基于GPTZero发布的检测报告整理,部分技术细节有所删减)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

1. 对AI生成内容的批评与法律担忧

  • 主要观点:AI生成的虚假引用应被视为"疏忽"或"谎言",需承担法律责任
  • 关键引用:
    • "The legal system has a word to describe AI 'slop' --- it is called 'negligence'"(法律系统用"疏忽"形容AI垃圾)
    • "Can we just call them 'lies' and 'fabrications' which is what they are?"(这就是"谎言"和"捏造")

2. 学术诚信问题

  • 主要观点:问题根源在于研究者不负责任,而非AI工具本身
  • 关键引用:
    • "If a scientist uses an LLM to write a paper with fabricated citations - that's a crappy scientist"(科学家用LLM编造引用就是烂科学家)
    • "How sloppy is someone that they don't check their references!"(不检查引用太马虎)

3. LLM技术特性分析

  • 主要观点:幻觉是LLM的设计特性,但技术上可实现准确引用
  • 关键引用:
    • "hallucination is what LLMs do...mashing it up for an output"(幻觉是LLM的工作方式)
    • "Creating a real citation is totally doable by a machine"(机器完全可以创建真实引用)

4. 学术体系的结构性问题

  • 主要观点:现行学术评价体系重数量轻质量,助长不良行为
  • 关键引用:
    • "incentives for more quantity and not quality in modern science"(现代科学更重数量而非质量)
    • "We're well past Goodhart's law when it comes to publications"(出版已远超古德哈特定律)

5. 同行评审制度的缺陷

  • 主要观点:同行评审存在固有缺陷,需改革评审机制
  • 关键引用:
    • "Peer review doesn't catch errors"(同行评审抓不住错误)
    • "the steady corrosion of knowledge is not an accident"(知识的持续腐蚀并非偶然)

6. 解决方案建议

  • 主要观点:应建立自动核查系统,加强学术不端惩罚
  • 关键引用:
    • "why this has not been largely fully automated"(为何不实现自动化核查)
    • "report to academic and professional organizations"(应向学术机构报告不端行为)

7. 其他观点

  • 有评论认为AI暴露了既有问题("exposing this problem we knew was there")
  • 建议停止拟人化术语,应称"errors"而非"hallucinations"("they're computers...just simply Errors")

总结显示争议集中在责任归属(工具vs使用者)、学术体系改革和技术解决方案三个维度。