小乐数学科普:事关猜想,人工智能发现椭圆曲线的“椋鸟群飞murmuration”现象——译自量子杂志

数学家们正在努力充分解释使用AI人工智能发现的不寻常行为。

如果以正确的方式看待,椭圆曲线可以像鸟一样成群。

视频:Paul Chaikin

椭圆曲线是现代数学中最迷人的对象之一。它们看起来并不复杂,但它们在许多人在高中学习的数学和最深奥的研究数学之间形成了一条高速公路。它们是20世纪90年代安德鲁·怀尔斯著名的费马大定理证明的核心。它们是现代密码学的关键工具。2000年,克莱数学研究所将一个关于椭圆曲线统计的猜想——BSD猜想作为“七大千禧年问题”之一(七大问题中每一个问题的解决方案都有100万美元的奖金)。这一猜想由布莱恩·伯奇(Bryan Birch,1931 -)和彼得·斯温纳顿-戴尔(Peter Swinnerton-Dyer,1927 - 2018)在20世纪60年代首次提出,至今仍未得到证实。

理解椭圆曲线是一项高风险的奋进,一直是数学的核心。因此,在2022年,当一个跨大西洋的合作项目使用统计技术和AI人工智能发现椭圆曲线中完全出乎意料的模式时,这称得上是一个大受欢迎的贡献。“机器学习带着一些有趣的东西来到我们的家门口仅仅是个时间问题,”普林斯顿高等研究院IAS及普林斯顿大学的数学家彼得·萨纳克(Peter Sarnak,1953 -)说。起初,没有人能解释为什么新发现的模式存在。从那时起,在最近的一系列论文中,数学家们开始解开这些模式背后的原因,并开始证明它们不仅会出现在2022年研究的特定例子中,而且会出现在更普遍的椭圆曲线中。

成为椭圆曲线的重要性

为了理解这些模式是什么,我们必须对椭圆曲线是什么以及数学家如何对它们进行分类做一些基础知识准备。

椭圆曲线(elliptic curve)将一个变量(通常写为y)的平方与另一个变量(通常写为x)的三次幂联系起来:y² = x³ + Ax + B,其中的两个数A和B,满足一些简单的条件。该方程定义了一条可以在平面上绘制的曲线,如下所示。(尽管名称相似,但椭圆并不是椭圆曲线!)。

图源:Merrill Sherman

尽管椭圆曲线看起来很普通,但它却成为数论学家(即寻找整数模式的数学家)的强大工具。数学家们喜欢将变量x和y限制在不同的数字系统中,而不是让变量x和y在所有数字上变化,他们称之为在给定数字系统上定义曲线。限制在有理数(可以写成分数的数字)上的椭圆曲线特别有用。“实数或复数椭圆曲线相当无聊。”Sarnak说:“只有有理数才有深度。”

有一种说法是正确的。如果你在椭圆曲线上的两个有理点之间画一条直线,那条直线与曲线相交的地方也是有理的。你可以使用该事实来定义椭圆曲线中的“加法”,如下所示。

在P和Q之间画一条直线。这条直线将与曲线相交于第三点R。(数学家有一个特殊的技巧来处理直线与曲线不相交的情况,即在无穷远处加上一点。)R关于x轴的反射(对称点)就是P + Q的和。曲线上所有的解与这种加法运算一起形成一个称为群(group)的数学对象。

数学家用它来定义曲线的“秩”(rank)。曲线的秩与它所具有的有理解的数目有关。秩为0的曲线有有限个解。具有更高秩的曲线具有无穷多个解,这些使用加法运算得到的解之间的关系由秩描述。

人们对秩还不太了解;数学家们并不总是有办法计算它们,也不知道它们能有多大。(已知一条特定曲线的最大精确秩为20。)看起来相似的曲线可能有完全不同的秩。

椭圆曲线也与素数(大于1且只能被1和它们自身整除的正整数,也叫质数)有很大关系。数学家特别关注有限域(finite field,为每个素数定义的循环算术系统)上的曲线。一个有限域就像一个钟面上的小时数等于某个素数的时钟:如果你一直向上数,数字就会重新开始。例如,在素数7有限域中,5加2等于0,5加3等于1。

由数千条椭圆曲线组成的图案与椋(liáng)鸟群飞有着惊人的相似之处。

图源:Alex Ramsay

椭圆曲线有一个相关的数列,称为 ap ,它与素数p有限域中曲线的解的数量有关。虽然秩很难计算,但数列ap 要容易得多。

在极早期的一台计算机上进行大量计算的基础上,伯奇和斯温纳顿-戴尔证明了椭圆曲线的秩和数列ap 之间的关系。任何能证明他们的猜想正确的人都能赢得一百万美元和数学上的不朽名声。

一个令人惊讶的模式出现了

疫情开始后,伦敦数学科学研究所的研究员Yang-Hui He(何阳辉,音译名)决定接受一些新的挑战。他在大学里主修物理,并在MIT获得数学物理博士学位。但他对数论越来越感兴趣,鉴于人工智能的能力越来越强,他认为他应该尝试使用人工智能作为一种工具来寻找数字中的意外模式。(他已经在使用机器学习来分类卡拉比-丘流形,这是弦理论中广泛使用的数学结构。)

当Kyu-Hwan Lee(左)和 Thomas Oliver(中)开始与Yang-Hui He(右)合作使用人工智能来寻找数学模式时,他们希望这只是一种玩乐,而不是一个会导致新发现的艰难尝试。

图源:Yang-Hui He(何阳辉,音译名)

2020年8月,随着疫情的加深,诺丁汉大学邀请他参加了一场在线讲座。他对自己取得的进展,以及利用机器学习发现新数学的可能性感到悲观。“他的叙述是,数论很难,因为你不能用机器学习来学习数论中的东西,”威斯敏斯特大学数学家托马斯·奥利弗(Thomas Oliver)说。奥利弗当时也在观众席上。他回忆说:“我发现不了任何东西,因为我不是专家。我甚至没有用正确的方式来看待这个问题。”

奥利弗和康涅狄格大学的数学家Kyu-Hwan Lee开始与他合作。“我们决定这样做只是为了了解机器学习是什么,而不是认真学习数学。”奥利弗说:“但我们很快发现,你可以用机器学习来学习很多东西。”

但他们不确定为什么他们的机器学习算法工作得这么好。李让他的本科生阿列克谢·波兹尼亚科夫(Alexey Pozdnyakov)看看他是否能弄清楚这是怎么回事。碰巧的是,LMFDB根据一个称为导子(conductor,也有极少数文献译为引导子,zzllrr小乐译注)的量对椭圆曲线进行分类,导子总结了曲线无法表现良好的素数的信息。因此,波兹尼亚科夫试图同时观察大量具有类似导子的曲线--比如说,所有导子在7500到10000之间的曲线。

总计约10000条曲线。其中有一半秩为0,一半秩为1。(更高的秩非常罕见。)然后,他对所有秩为0、1的曲线的 ap 值分别取平均值,并绘制结果。这两组点形成了两条清晰可辨的波浪。这就是机器学习分类器为什么能够正确地确定特定曲线秩的原因。

“起初,我只是为完成了这项任务感到高兴。”波兹尼亚科夫说:“但Kyu-Hwan立即意识到这种模式令人惊讶,那就是它变得真正令人兴奋的时候。”

李和奥利弗被迷住了。“阿列克谢给我们看了这张照片,我说这看起来像是鸟类做的事情,”奥利弗说。“然后Kyu-Hwan查了一下,说这叫椋鸟群飞(murmuration),然后杨说我们应该把这篇论文叫做'椭圆曲线的椋鸟群飞'。”

他们在2022年4月上传了自己的论文,并转发给了其他少数数学家,紧张地期待着被告知他们所谓的“发现”是众所周知的。奥利弗说,这种关系如此明显,早就应该注意到了。

Alexey Pozdnyakov(阿列克谢·波兹尼亚科夫)是康涅狄格大学的一名本科生,他是第一个观察到现在被称为“椋鸟群飞”模式的人。

图源:Alexey Pozdnyakov

这篇预印本论文几乎立刻就引起了人们的兴趣,特别是麻省理工学院的研究科学家安德鲁·萨瑟兰(Andrew Sutherland),他是LMFDB的总编辑之一。萨瑟兰意识到300万条椭圆曲线对他的目的来说是不够的。他想看看更大的导子范围,看看有多鲁棒的椋鸟群飞。他从另一个大约1.5亿条椭圆曲线的巨大数据库中提取数据。他仍然不满意,然后从另一个存储库中提取了3亿条曲线的数据。

萨瑟兰写道:“希望你(们)知道一个已知的解释。”

然而他们并不知道。

解释模式

李、何和奥利弗于2023年8月在布朗大学数学计算与实验研究所(ICERM)组织了一个关于椋鸟群飞的研讨会。Sarnak和Rubinstein来了,还有Sarnak的学生Nina Zubrilina(尼娜·祖布里琳娜)。

“尼娜的最大成就是她给出了一个公式;我称之为Zubrilina椋鸟群飞密度公式,”Sarnak说。“她用非常复杂的数学证明了一个精确的公式,完全与数据相符。”

她的公式很复杂,但Sarnak称赞它是一种重要的新函数,可与Airy函数相媲美,Airy函数定义了从光学到量子力学等各种物理学背景下使用的微分方程的解。

虽然Zubrilina的公式是第一个,但其他的都随之而来。“现在每周都有一篇新论文发表,”Sarnak说,“主要是使用Zubrilina的工具,解释椋鸟群飞的其他方面。”

即将在普林斯顿大学完成博士学位的尼娜·祖布里琳娜(Nina Zubrilina)证明了一个解释椋鸟群飞模式的公式。

图源:Julie Dassaro

萨瑟兰对发现椋鸟群飞的运气印象深刻。如果椭圆曲线数据没有被导子排序,椋鸟群飞就会消失。“他们很幸运能从LMFDB获取数据,这些数据是根据导子预排序的。”他说:“这就是椭圆曲线与相应的模形式之间的关系,但这一点也不明显。两条方程看起来非常相似的曲线可能有非常不同的导子。”例如,萨瑟兰指出,y² = x³ - 11x + 6有导子17,但将负号翻转为加号,y² = x³ + 11x + 6有导子100736。

即使在那时,这些椋鸟群飞也只是因为波兹尼亚科夫缺乏经验而被发现的。“如果没有他,我不认为我们会找到它,”奥利弗说,“因为专家们传统上将 ap 的绝对值归一化。但他没有将它们归一化……所以振荡非常大,而且可见。”

奥利弗指出,AI人工智能算法用来按秩对椭圆曲线进行排序的统计模式存在于一个有数百个维度的参数空间中--太多了,人们无法在脑海中进行排序,更不用说可视化了。但是,尽管机器学习发现了隐藏的振荡,“直到后来我们才明白它们是椋鸟群飞。”

THE END
0.猜想纹章之劫《量子长生者观测报告》小说在线阅读1.丹炉表面浮现BSD猜想证明: $$ord_{s=1}L(E,s)= rank\ E(\mathbb{Q})= 3$$ 2.炉内金丹坍缩为L函数奇异点,吞噬八十一座辅峰 3.幸存丹师李清弦目睹模形式幽灵从炉渣升起,吟唱: >“每个模形式皆自守表示” 2.剑狱降临·蜀山万剑冢 异变数据: |参数|异变前|异变后| |---|---|---| |剑jvzquC41yy}/smro0eun1lmcrvks1:567;=18:91:7;53;<241
1.引导直觉解决数学猜想难题,DeepMind登上《Nature》封面多年来,数学家们一直使用计算机来生成数据以帮助搜索数学模式,这种被称为实验数学的研究方法产生出许多重要的猜想,例如BSD猜想。虽然这种方法已经取得成功并且相当普遍,但从这些数据中识别和发现数学模式仍然主要依赖于数学家。 随着计算机领域的飞速发展,利用计算机寻找数学模式变得越来越重要,因为计算机生成的数据量爆炸式jvzquC41yy}/gnuy0eun0ls1|j{bpufp14685?>0jvsm
2.千禧年大奖难题BSD猜想(贝赫和斯维讷通-戴尔猜想) BSD猜想,全称贝赫和斯维纳通-戴尔猜想(Birch and Swinnerton-Dyer 猜想),它描述了阿贝尔簇的算术性质与解析性质之间的联系。 数学家总是被诸如x方+y方=z方那样的代数方程的所有整数解的刻画问题着迷。欧几里德曾经对这一方程给出完全的解答,但是对于更为复杂的方程,这就变得极jvzquC41oq|jg7iqwdgo0lto1u{clnhv14<6;<::91jjulzuukuo1?896:637<4
3.纪念潘承洞先生诞辰90周年数论国际会议闭幕山东大学教授翟帅以椭圆曲线和二次型为主题作报告,介绍了椭圆曲线的解析与代数、二次型表整数的表法个数和它们之间的联系,讲述了千禧年七大数学难题之一BSD猜想的最新研究进展及其研究成果。 7月31日下午,会议由王小云院士和西北大学教授张文鹏主持。爱荷华大学教授叶扬波回忆了与潘承洞先生见面的场景并表达了崇高敬意,jvzquC41yy}/xrjy0ujv0niw0et0kwkq1363386;63>90qyo
4.经典数论的现代导引(豆瓣)猜想、孪生素数猜想、黎曼猜想、欧拉猜想、卡塔兰猜想、华林问题、3x+1问题、BSD猜想、abc猜想等. 本书以一种特殊的方式(每节配以引人入胜的补充读物)把这些素材串联起来,再通过引入加乘方程、形素数、平方完美数、默比乌斯函数指数、椭圆曲线等新概念和方法,拓广了包括希尔伯特第8问题在内的经典数论问题和猜想. jvzquC41dqul0mtwdct/exr1kuho1B<:92918A<76:
5.北京大学数学学院随着知识和技术的积累,袁新意渴望向更深刻的数论问题前进。数论中有很多迷人的问题,而最吸引他的则是BSD猜想。 BSD猜想可以被粗略地描述为建立椭圆曲线E的有理点集形成的有限生成Abel群的算数信息和与之相对应的Hasse-Weil L-函数L(E,s)在s=1的泰勒展开式的分析信息之间的联系。这是一个关于椭圆曲线上有理点结jvzquC41yy}/ojyj0rqv0niw0et0lpl1iqyy864:9610qyo
6.翟帅翟帅 教授 研究方向:数论 研究领域: Elliptic Curves (椭圆曲线) Birch and Swinnerton-Dyer Conjecture (BSD猜想) 电子邮箱:zhai@sdu.edu.cn 个人网页链接:http://www.prime.sdu.edu.cn/info/1023/1773.htm上一篇:彭珍玲 下一篇:张钊山东省青岛市即墨滨海路72号山东大学(青岛)华岗苑东楼 邮编:266237, E-jvzquC41yy}/orx0uf{/gmz0ep5jpot132651;:970nuo