在过去的十年左右的时间里,计算化学领域一直在增长。尽管早在那之前,计算方法的使用还是很有限的,但是近年来,它已经成为优化和预测化学研究的非常强大的工具。现在,使用计算方法,化学家可以预测反应的工作方式,最佳参数、要使用的试剂和反应条件,甚至可以使用计算方法来预测他们计划制造的材料/分子的结构和性质。
因此,计算方法可以在整个概念、开发和分析过程中为化学家提供帮助。那么,为什么近年来使用量增加了?首先,化学家对计算化学有了更多的了解,并意识到它可以带来的好处。第二,更多科学家现在更容易获得支持这些模拟所需的计算能力。第三,机器学习算法的进步以及它们在计算化学过程中的集成,使得可以获得更准确的结果-实验进行时,成功的可能性更高。
将机器学习应用于化学过程
像许多实施机器学习的领域一样,它在计算化学领域的用途是从文献中获取所有已知数据,进行推断和分析,并预测最可能的结果。对于化学领域,这通常意味着从不同的反应中获取数据,例如试剂的类型、化学物质的浓度、工艺条件以及可以生产的产品。
所有这些数据都是有价值的,因为它们都是可以决定结果的因素,使反应物成为理想的输入集,而产物则成为输出。这些数据的使用可以被输入到机器学习算法中,并且可以用来做三件事。首先是通过使用现有数据,可以推断出化学结构形成的最可能原因(从反应/过程的角度来看),并且可以被工业界用来预测执行其所需功能的新分子。
第二种方法更多地与流程本身有关。有时,研究人员会想到一个产品,但不知道其过程。可以从以前的反应中获取数据并进行分析,这使算法能够预测哪些条件和试剂将负责分子中不同化学基团的形成。这使算法可以创建反应路径,该算法显示了逐步构建分子的最可能途径。
第三种方法是完整的分子设计方法,该方法以一个想法开始,但没有定义的产物或反应途径。这采用了其他两点的原则。尽管如此,除了一个变量(产物或反应)外,两者在技术上都是未知的,因此算法需要外推产物和反应条件,以产生可能的结果/途径。这是一项较难执行的任务,但受到了很多关注。
机器学习预测分子
计算化学的另一个主要方面是对材料/分子本身,它们的基本内在特性以及它们在某些情况/环境下的行为进行预测。与工业中通常采用的工艺优化相比,这是计算化学的更基本、更长时间的使用,并且在学术界研究新材料和分子时通常更常用(因为这是时间、金钱和有效产品规模的体现)。应当指出的是,这些努力不仅限于化学领域,因为在生物和工程领域也使用了类似的计算方法。
即使需要关注的因素较少(即仅关注分子,而不是过程和分子),但在此领域中使用计算化学也很重要,因为它有助于从根本上实现结果。通常是在创建工业流程之前发生的阶段-机器学习也确实帮助提升了这一领域。
模拟分子的结构及其如何执行并非易事。多年来,一直受到需要计算的变量数量与可用计算能力的限制(许多研究人员共享一台超级计算机来执行上述计算)。机器学习在这方面确实有所帮助,因为与以前相比,计算原子的各种数量、键能、能量和反应势垒、量子特性、磁和激发分子态以及分子间和分子内相互作用都非常容易。
从一组变量和已知数据点推断和预测最佳解决方案是机器学习最擅长的事情,这意味着使用机器学习算法可以更轻松地优化必须计算的大量数据。上述许多变量对分子/分子系统的结构和性质都有重要影响,因此推论出比往年更准确的分子和性质。它甚至可以使更复杂的原子(例如元素周期表中的d和f块元素)的计算精度更高,而在过去的几年中这是不可能的。
总结
即使有几种不同的计算程序可用于创建这些分子模拟,但是机器学习也可以应用于所有这些模拟中。机器学习不仅有助于优化和改善工业水平上的化学和药物发现过程,而且在推论已知和未知分子的分子结构和特性,了解分子在某些情况下的行为以及反应最有可能产生的结果等基础性方面也发挥了关键作用。
总体而言,机器学习已经对计算化学产生了巨大影响,并且随着越来越多的化学家在尝试实验程序之前首先转向计算/模拟,机器学习将在未来几年中发挥更大的作用。