生成的分子几乎100%有效,并用作反向分子设计的引导扩散模型

干货分享4个月前发布 Youzhizhan
4,911 0


以色列理工学院和意大利威尼斯大学(College Ca’foscari Of Venice)的研究小组提出了反向分子设计的引导扩散模型:GaUDI,它结合了等变量神经网络进行属性预测并生成

“从头分子设计”是材料科学的”圣杯”。生成式深度学习的引入大大推进了这一方向,但分子发现仍然具有挑战性,而且往往效率低下。

以色列理工学院和意大利威尼斯大学(College Ca’foscari Of Venice)的研究小组提出了反向分子设计的引导扩散模型:GaUDI,它结合了等变量神经网络进行属性预测并生成

研究人员通过将单靶点和多靶点任务应用于475,000个多环芳烃系统的生成数据集,证明了高迪在设计有机电子应用分子方面的有效性。高迪展示了一种改进的条件设计,以生成具有最佳特性的分子,甚至超出原始分布,并提出了比数据中的分子更好的分子set.In 除了逐点靶标外,GaUDI还可以被引导至开放靶标(例如最小值或最大值),并且在所有情况下,生成的分子的有效性都接近100%。

该研究题为”逆分子设计的引导扩散”,并于2023年10月5日在Nature Computational Science上发表。

生成的分子几乎100%有效,并用作反向分子设计的引导扩散模型

现有的分子设计方法及其挑战

新技术的发展往往取决于获得新功能分子的能力。然而,分子发现对于化学家和材料科学家来说仍然是一个开放的挑战,因为很难准确地模拟分子和材料的性质。这通常通过满足多种需求而加剧,这种需求有时可能是矛盾的,甚至是相互排斥的。 例如,需要催化剂既稳定又有活性。因此,关键是找到多个分子性质之间的最佳权衡,以便给定分子能够提供所需的功能。

要找到这个最佳点,首先需要确定分子结构与其各种性质之间的关系。因此,传统的分子设计方法依赖于人工构建的启发式和化学intuition.In 除了缓慢和艰巨之外,这些通常仅限于在较小的化学空间中相关的相对简单的结构-性质关系。

近年来,生成模型已经将这种化学挑战表示为反向设计问题,已经被引入作为替代方法,并且已经成为识别各种应用的新候选结构的日益强大的工具。

扩散模型已成为许多生成任务的主要方法,例如图像,视频和文本生成。扩散模型在化学领域也显示出巨大的前景。但是,扩散模型的全部功能尚未得到充分利用,因为这仍然是探索最少的area.In 另外,也执行条件生成的现有扩散模型使用所谓的标准方法,难以学习条件分布。它们也仅限于逐点目标,必须重新训练以添加新属性,并且不能在不同的数据集上训练生成器和预测器。指导扩散模型从条件分布取样的能力尚未在化学环境中得到充分测试。

高迪用于生成具有目标特性的分子

在这里,研究人员通过设计和实施引导扩散模型GaUDI来弥合这一差距,该模型用于生成具有目标特性的分子。

研究人员使用两个预训练模型来设计分子:第一个是训练有素的生成式扩散模型,用于根据给定的数据分布生成无条件样本,第二个是训练有素的预测

与标准扩散采样一样,扩散模型从一些易于处理的噪声源采样,然后迭代地去噪信号;然而,与标准无条件模型相比,在高迪,生成模型的中间输出被馈送到预然后,通过向每个迭代添加校正项,使用这些属性的目标函数的梯度来指导采样process.In 这样,扩散产生偏向于具有低目标函数值(即最接近目标)的分子。 这个过程相当于从具有几乎任意复杂条件的条件分布中采样。

生成的分子几乎100%有效,并用作反向分子设计的引导扩散模型

图1:生成过程。(来源:论文)

该研究证明了高迪在多环芳族体系(PAS)的用例中的性能,多环芳族体系是由多个不同大小和原子的芳环组成的分子。多环芳族体系占已知分子的三分之二,是有机电子学的基石,因为它们构成了绝大多数有机半导体。因此,具有特定性能的新型PAS对于有机发光二极管,场效应晶体管,光伏和其他光电子学等先进技术至关重要。

在新生成的475,000PAS数据集上训练后,高迪在单目标生成任务和多目标生成任务的有效性和平均误差方面优于其他领先的扩散模型。高迪提供了具有最佳特性的新分子,甚至超出了原始数据集的分布。

生成的分子几乎100%有效,并用作反向分子设计的引导扩散模型

图2:具有高HOMO-LUMO(HLG)值的PAS的引导设计。(来源:论文)

此外,当与环图(Gor)表示法一起使用时,高迪产生的分子几乎100%是有效的,新颖的和独特的。

表1:未启动生成的性能。(来源:论文)

生成的分子几乎100%有效,并用作反向分子设计的引导扩散模型

此外,与许多现有方法相反,高迪提供高目标函数通用性,并且可以处理单个或多个属性的任何可微目标函数,包括开放目标,例如,即使在先未知,目标属性的

在这项研究中,研究人员利用这一特征对通过廉价计算方法获得的数据进行高迪训练。 虽然值不同,但该方法捕获了相同的结构-性质趋势。

生成的分子几乎100%有效,并用作反向分子设计的引导扩散模型

图3:窄带隙分子的引导设计。(来源:论文)

高迪提出具有所需特性的新分子的能力,甚至超出了初始训练集的特性,有助于加速许多感兴趣领域的分子设计和发现,包括但不限于有机电子和光电子

未来的方向包括应用高迪设计功能性PAS和peri-condensed PAS.At 与此同时,研究人员还在探索一种替代方法,其中高迪将给定的子结构完善为具有目标特性的最终分子。

论文链接:https://www.nature.com/articles/s43588-023-00532-0

[ad]
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...