实现“大海捞针”!这个神经网络在短短5周内筛选了近300万种候选新材料

发布时间:2020-04-02 15:42来源:原创 帮助了896人
摘要:新材料的发现是一项艰巨的任务。在搜索可能出现在特定应用中的新材料(例如电池或其他与能源相关的设备)的理论清单时,通常要考虑数百万种可能的材料,必须同时满足和优化多个标准。


新材料的发现是一项艰巨的任务。在搜索可能出现在特定应用中的新材料(例如电池或其他与能源相关的设备)的理论清单时,通常要考虑数百万种可能的材料,必须同时满足和优化多个标准。现在,麻省理工学院的研究人员已经发现了一种使用机器学习系统的方法,可以大大简化发现过程。作为演示,该团队从将近300万种候选材料中选择了八种最有前途的材料,用于一种名为“移动电池”的储能系统。他们说,根据传统的分析方法,此筛选过程花费了50年,但他们仅用了5周就完成了筛选。这项发现发表在ACS中央科学杂志上,由麻省理工学院化学工程教授Heather Kulik,Jon Paul Janet,Sahasrajit Ramesh和研究生Chenru Duan合着。这项研究研究了一组称为过渡金属配合物的材料。

它们可以以多种不同的形式存在,Kulik说,“它们是非常引人入胜的功能材料,与许多其他物理阶段不同。了解它们为何起作用的唯一方法是使用量子力学来研究它们。”数百万种材料的性质需要费时且资源密集的光谱学和其他实验室工作,或费时且高度复杂的基于物理的计算机建模才能对每种可能的候选材料或材料组合进行建模。每个此类研究可能需要花费数小时甚至数天的时间。相反,Kulik和她的团队选择了少量不同的可能材料。并使用它们来教授高级的机器学习神经网络,以了解材料的化学成分与其物理性质之间的关系。然后,他们将这些知识应用于建议,以生成可在下一轮神经网络训练中使用的下一代材料。通过此过程的四个连续迭代,每次达到临界点之前,神经网络都会得到显着改善,也就是说,进一步的迭代不会产生任何进一步的改善。该迭代优化系统大大简化了获得满足两个冲突标准的潜在解决方案的过程。在这种情况下,找到最佳解决方案的过程称为Pareto前沿,在这种情况下,改善一个因素通常会使另一个因素恶化。帕累托阵线表示理想状态,也就是说,不可能有更多的帕累托改进空间。这代表了可能的最佳折衷方案,具体取决于分配给每个因素的相对重要性。

训练典型的神经网络需要非常庞大的数据集,从数千个到数百万个示例不等,但是Kulik和她的团队能够使用基于Pareto前沿模型的迭代过程来简化该过程,并且仅使用数百个样本即可提供可靠的结果。在筛选移动电池材料时,所需的特性是矛盾的,通常是这样的:最佳的材料将具有高溶解度和高能量密度(对于给定的重量,可以存储能量)。但是增加溶解度会降低能量密度,反之亦然。神经网络不仅可以快速提出有希望的候选者,而且可以在每次迭代中为其不同的预测点分配置信度,这有助于在每个步骤中优化样本选择。库里克说:“我们已经开发出一种不确定性的措施一种更好的使用技术的方式来真正知道这些模型何时会失败。他们在概念验证测试中选择的挑战是氧化还原液流电池所用的材料,该材料有望用于大规模的网格规模电池。它在清洁和可再生能源的发展中可以发挥重要作用。库里克说,过渡金属配合物是制造此类电池的首选材料,但是通过传统方法进行评估的可能性却很大。他们最初列出了300万个此类复合体,最终将它们缩减为8个良好的候选对象,并制定了一套设计规则,使实验人员能够探索这些候选对象及其变化的潜力。

她说,除了建议使用该系统进行进一步研究的特定过渡金属配合物外,该方法本身可能具有更广泛的应用。 “我们将其视为可以应用于任何材料设计挑战的框架,并且您确实尝试同时解决多个目标。您知道,所有最有趣的材料设计挑战是:您想要一件事进行改进,但又使情况变得更糟。“对我们而言,氧化还原液流电池的氧化还原耦合只是一个很好的演示,我们认为我们可以继续使用这种机器学习技术来加快新材料的发现。”例如在各种化学和工业过程中优化催化剂库利克说,这是另一种复杂的材料搜索。当前使用的催化剂通常包含稀有和昂贵的元素,因此,基于丰富而廉价的材料寻找相似有效的化合物将是一个显着的优势。统计,应用数学和物理科学概念的完美结合,在工程应用中将非常有用。”化学教授Geo说道。西北大学化学与生物工程专业。Rge Schatz说他没有参与这项研究。他说,这项研究解决了“有多个目标时如何进行机器学习”的问题。这项工作得到了海军研究办公室,美国国防部高级研究计划局(DARPA),美国能源部,Burroughs Wellcome基金和AAAS Marion Milligan Mason奖的支持。

以上关于实现“大海捞针”!这个神经网络在短短5周内筛选了近300万种候选新材料的内容对您是否有帮助?
    我要提问