人工智能如何帮助科学家寻找新粒子?
据国外媒体报道,大型强子对撞机(LHC)可以在一秒钟之内撞击十亿对质子。有时,这台巨大的机器可能会给现实世界带来惊喜,因为在少数碰撞中,会产生一些前所未有的东西。但是,这样的惊喜并没有什么规律可言,物理学家并不确切知道要寻找什么。他们担心,在将数十亿次碰撞所获得的数据梳理成更易管理的数字时,可能会无意中删掉物理学新理论的证据。 在搜寻新基本粒子的过程中,物理学家总是需要对粒子的行为作出假设,但新的机器学习算法却不用这么做。 在欧洲核子研究中心(CERN)参与超环面仪器(ATLAS)实验的纽约大学粒子物理学家凯尔·克兰默(Kyle Cranmer)说:“我们总是担心自己会把婴儿和洗澡水一起倒掉。” 面对智能数据规约的挑战,一些物理学家尝试使用“深度神经网络”的机器学习技术来挖掘相似事件组成的数据海洋,寻找新的物理学现象。 在初步使用案例中,深度神经网络通过研究大量标记为“猫”的图片和标记为“狗”的图片,学习如何区分猫和狗。然而,这种方法在寻找新粒子时并不适用,因为物理学家无法为机器提供他们从未见过的东西的图片。因此,物理学家转而采用所谓的“弱监督学习”(weakly supervised learning)方法,即机器从已知粒子开始,利用细化的信息(比如总体上可能发生的频率)来寻找罕见事件。 在今年5月份发表于科学预印本网站arxiv.org上的一篇论文中,三位研究人员提出应用相关策略对“撞击狩猎”(bump hunting)进行扩展。这种经典的“粒子狩猎”技术曾用于希格斯玻色子的发现。美国劳伦斯伯克利国家实验室的研究者本·纳赫曼(Ben Nachman)表示,具体的思路是训练机器在数据集中寻找罕见的变化。 试想一下,我们可以在猫狗实验的原理基础上做一个游戏:在充满北美森林观察记录的数据集中寻找新的动物物种。假设任何新的动物物种都倾向于聚集在某个特定的地理区域(与新粒子围绕某个特定质量的概念相对应),那算法就应该可以通过邻近区域的系统比较,将它们挑出来。如果加拿大不列颠哥伦比亚省刚好有113只驯鹿,美国华盛顿州有19只驯鹿(即使数据集中有数百万只松鼠),那程序也能在没有直接研究驯鹿的情况下,学会将驯鹿与松鼠区分开来。弱监督学习研究者、俄勒冈大学的理论粒子物理学家说:“这不是魔术,但感觉像魔术一样。” 相比之下,粒子物理学中的传统搜索方法通常要求研究人员对新现象是什么样子做出假设。他们会创建一个描述新粒子行为的模型。例如,一个新粒子可能有衰变成一大群已知粒子的趋势。只有在定义了所要寻找的东西之后,他们才能设计出自定义的搜索策略。这项工作通常需要花费一个博士研究生至少一年的时间,而纳赫曼认为,这一过程可以完成得更快、更彻底。 |




