文章摘要
IBM将欧拉、高斯等数学家200年前提出的连分数求导技术用PyTorch实现后申请了专利,引发争议。批评者认为这相当于对公有数学方法收取专利费。相关代码已开源。
文章总结
IBM为欧拉200年前的数学方法申请专利引争议
核心事件
IBM公司近期获得了一项关于"使用导数求广义连分数收敛项"的专利。令人惊讶的是,这项技术实质上是将高斯、欧拉和拉马努金等数学家200多年前提出的数论方法,用PyTorch实现后调用反向传播函数而已。
争议焦点
旧酒新瓶:IBM研究人员在2021年论文《CoFrNets:受连分数启发的可解释神经网络架构》中,将传统连分数概念重新包装:
- 将连分数改称为"阶梯"(ladders)
- 将基本除法运算命名为"1/z非线性"
- 将广义连分数重新命名为"CoFrNets"
技术实质:研究人员只是用PyTorch实现了连分数计算库,通过链式线性神经网络层,并用倒数(而非ReLU)作为主要非线性函数。这种结构与AI领域常见的线性层类似,只是将偏置项替换为另一个线性层。
专利影响:该专利目前处于待审状态,若获批准,IBM可能对使用该数学方法的以下领域主张权利:
- 机械工程(齿轮设计)
- 纯数学研究(椭圆曲线等)
- 数值分析(积分近似计算)
历史背景
连分数在数学界已有悠久历史: - 1785年欧拉就研究过级数转换为连分数的方法 - 1861年钟表师Achille Brocot用其设计齿轮系统 - 拉马努金等数学家也深度应用过该技术
业界反应
批评者指出: - 论文充斥着"故作高深"的术语重构 - 测试准确率仅61%,远未达到当前最优水平 - 连分数的可微性本就是已知特性 - 本质上只是用PyTorch实现了传统数学方法
潜在影响
该专利若生效,可能影响数学软件(Sage、Mathematica等)和机械设计等领域对这项古老数学方法的使用。目前相关代码已在Google Colab和GitHub开源。
(注:文中涉及的图片链接和部分技术细节已省略,保留核心事实和争议要点)
评论总结
总结评论内容如下:
IBM专利数量庞大
- 观点:IBM持有大量专利(仅美国就超15万项)
- 引用:
"I remember reading that IBM holds a staggering number of patents" (mv4)
"I had pressure and saw people get rewards for patenting everything" (CountHackulus)
专利制度批评
- 观点:现行专利制度易被滥用,阻碍创新
- 引用:
"IP patents should be thrown out...exist primarily for rent seeking" (stuffn)
"Software patents are mostly garbage...like getting a patent on 'Murder story'" (linuxhansl)
具体专利争议
- 观点:当前专利(连分数在神经网络的应用)可能无效或过度宽泛
- 引用:
"They don't claim to invent continued fractions, what they patent is applying them" (rdtsc)
"It's an architecture using CF that is patented...patents are trash" (zkmon)
程序性质疑
- 观点:媒体报道存在误导,该申请尚未获批
- 引用:
"This has not been patented...rejection mailed by the USPTO" (ipfreely)
"Remember that new applications of existing techniques are still novel" (keeda)
系统性改革呼吁
- 观点:软件专利需重新审视,版权保护更合理
- 引用:
"I have not been able to think of a compelling reason to have patents for software" (IceHegel)
"Software is better handled by Copyright law" (linuxhansl)
关键分歧点在于:支持者认为专利保护创新应用(如keeda),反对者则认为软件专利阻碍进步(如linuxhansl)。技术争议聚焦该专利是否属于已有数学方法的新应用(rdtsc vs zkmon)。