Hacker News 中文摘要

RSS订阅

IBM为200年历史的欧拉数学技术申请专利 助力"AI可解释性" -- IBM Patented Euler's 200 Year Old Math Technique for 'AI Interpretability'

文章摘要

IBM将欧拉、高斯等数学家200年前提出的连分数求导技术用PyTorch实现后申请了专利,引发争议。批评者认为这相当于对公有数学方法收取专利费。相关代码已开源。

文章总结

IBM为欧拉200年前的数学方法申请专利引争议

核心事件

IBM公司近期获得了一项关于"使用导数求广义连分数收敛项"的专利。令人惊讶的是,这项技术实质上是将高斯、欧拉和拉马努金等数学家200多年前提出的数论方法,用PyTorch实现后调用反向传播函数而已。

争议焦点

  1. 旧酒新瓶:IBM研究人员在2021年论文《CoFrNets:受连分数启发的可解释神经网络架构》中,将传统连分数概念重新包装:

    • 将连分数改称为"阶梯"(ladders)
    • 将基本除法运算命名为"1/z非线性"
    • 将广义连分数重新命名为"CoFrNets"
  2. 技术实质:研究人员只是用PyTorch实现了连分数计算库,通过链式线性神经网络层,并用倒数(而非ReLU)作为主要非线性函数。这种结构与AI领域常见的线性层类似,只是将偏置项替换为另一个线性层。

  3. 专利影响:该专利目前处于待审状态,若获批准,IBM可能对使用该数学方法的以下领域主张权利:

    • 机械工程(齿轮设计)
    • 纯数学研究(椭圆曲线等)
    • 数值分析(积分近似计算)

历史背景

连分数在数学界已有悠久历史: - 1785年欧拉就研究过级数转换为连分数的方法 - 1861年钟表师Achille Brocot用其设计齿轮系统 - 拉马努金等数学家也深度应用过该技术

业界反应

批评者指出: - 论文充斥着"故作高深"的术语重构 - 测试准确率仅61%,远未达到当前最优水平 - 连分数的可微性本就是已知特性 - 本质上只是用PyTorch实现了传统数学方法

潜在影响

该专利若生效,可能影响数学软件(Sage、Mathematica等)和机械设计等领域对这项古老数学方法的使用。目前相关代码已在Google Colab和GitHub开源。

(注:文中涉及的图片链接和部分技术细节已省略,保留核心事实和争议要点)

评论总结

总结评论内容如下:

  1. IBM专利数量庞大

    • 观点:IBM持有大量专利(仅美国就超15万项)
    • 引用:
      "I remember reading that IBM holds a staggering number of patents" (mv4)
      "I had pressure and saw people get rewards for patenting everything" (CountHackulus)
  2. 专利制度批评

    • 观点:现行专利制度易被滥用,阻碍创新
    • 引用:
      "IP patents should be thrown out...exist primarily for rent seeking" (stuffn)
      "Software patents are mostly garbage...like getting a patent on 'Murder story'" (linuxhansl)
  3. 具体专利争议

    • 观点:当前专利(连分数在神经网络的应用)可能无效或过度宽泛
    • 引用:
      "They don't claim to invent continued fractions, what they patent is applying them" (rdtsc)
      "It's an architecture using CF that is patented...patents are trash" (zkmon)
  4. 程序性质疑

    • 观点:媒体报道存在误导,该申请尚未获批
    • 引用:
      "This has not been patented...rejection mailed by the USPTO" (ipfreely)
      "Remember that new applications of existing techniques are still novel" (keeda)
  5. 系统性改革呼吁

    • 观点:软件专利需重新审视,版权保护更合理
    • 引用:
      "I have not been able to think of a compelling reason to have patents for software" (IceHegel)
      "Software is better handled by Copyright law" (linuxhansl)

关键分歧点在于:支持者认为专利保护创新应用(如keeda),反对者则认为软件专利阻碍进步(如linuxhansl)。技术争议聚焦该专利是否属于已有数学方法的新应用(rdtsc vs zkmon)。