查看原文
其他

机器学习在化学工程中的应用:机遇与挑战丨Engineering

编辑部 Engineering 2023-12-20

本文选自中国工程院院刊《Engineering》2021年第7卷,原文出自:Machine Learning in Chemical Engineering: Strengths, Weaknesses, Opportunities, and Threats(化学工程中机器学习的优势、限制、机会和挑战)


引言

化学工程师依靠模型进行工程设计、研究和日常决策制定,因为这些工作通常会伴有较大的财务和安全方面的风险。数十年来,将人工智能和化学工程进行有机结合用于建模的努力仍未满足预期效果。在过去的五年中,数据和计算资源的可获性不断提高,使基于机器学习的研究再度兴起。研究者最近努力为化学应用和新的机器学习框架开发大型数据库、基准测试集和表征,这些努力促进了机器学习技术在研究领域的推广。与传统建模技术相比,机器学习具有显著的优势,包括灵活性、精度和执行速度。但有利也有弊,比如机器学习中黑盒模型就缺乏可解释性。其最大的机遇包括在时间有限的应用场合中使用机器学习,比如需要高精度的实时优化和规划技术,并且可以建立具有自学习能力的模型去识别模式,从数据中学习,并随着时间的推移变得更加智能。然而,现在人工智能研究最大的挑战是不恰当的使用,因为大多数化学工程师只在计算机科学和数据分析方面受到有限的培训。尽管如此,机器学习肯定也会成为化学工程师建模工具箱中值得信赖的基础工具。因此,荷兰根特大学Kevin M. Van Geem研究团队概述了当今机器学习应用于化学工程的三个主要环节,并批判性地讨论了机器学习在化学工程中不断增长的潜力;他们还调查了其利弊,并列出可能的原因来讨论为什么机器学习在化学工程中仍是“热门”的话题或为什么它最终会“不再热门”。

在化学工程130年的发展中,数学建模对于工程师理解和设计化学过程而言非常宝贵;因此,通常可以使用已经建立了几百年的理论模型进行预测,其中,描述黏性流体行为的Navier-Stokes方程就是这种理论模型的一个例子。然而,这些模型大多数都不能对现实系统进行分析求解,并且需要相当大的计算能力来进行数值求解。这一缺陷使大多数工程师首先选用简单的模型来描述现实情况。历史上,一个重要且对如今而言仍然相关的例子是普朗特边界层模型。在计算化学中,科学家和工程师愿意为了缩短计算时间而放弃一些精度。与更高层次的理论模型相比,这种意愿解释了密度泛函理论的流行。然而,在许多情况下仍然需要更高的精度
几十年的建模、模拟和实验为化学工程界提供了大量的数据,这些数据作为额外的建模工具包增加了根据经验进行预测的选择。机器学习模型是统计和数学模型,其可以从经验中“学习”,并在数据中发现模式,并且不需要显式的、基于规则的编程。作为一个研究领域,机器学习是人工智能(AI)研究领域下的子领域。人工智能是指机器执行任务的能力,这些任务通常与智能生物(如人类)的行为有关。如图1所示,这并不是一个全新的领域。“人工智能”一词创造于1956年在美国达特茅斯学院为数学家举办的一个夏季研讨会上,该研讨会旨在开发更多具有认知能力的机器。从那时起,经过十数年的努力,人工智能技术才首次应用于化学工程中。在20世纪80年代,更多的关注偏向于规则式专家系统,因为这被认为是人工智能最简单的形式。在那时,机器学习领域的研究已经开始兴起。但在化学工程领域,除去个别例外,机器学习的发展滞后了大约10年。20世纪90年代,随着聚类算法、遗传算法和最为成功的人工神经网络(ANN)的采用,关于人工智能在化学工程中应用的论文著述出版量突然增多。然而,这种趋势并非可持续的。部分研究人员认为这种兴趣的丧失可能是由于机器学习缺乏强大的计算能力和创建算法任务的困难性所致

图1. 人工智能、机器学习和深度学习的发展时间表。关于人工智能在化学工程领域应用的出版物的发展表明,出版物数量上升之后是一个兴趣淡漠的阶段。目前,化工领域的人工智能研究再次处于“火热”阶段,然而现在尚不清楚曲线是否会很快回落。


一个标志性的突破是深度学习的发展,深度学习是机器学习研究领域的子领域,它构建人工神经网络来模仿人类大脑。人工神经网络从20世纪90年代开始在化学工程师中流行起来:然而,深度学习时代的不同之处在于,深度学习为多层神经网络的训练提供了计算手段,即所谓的深度神经网络。这些新发展激发了化学工程师的灵感,这从关于该主题的论文著述出版数量的指数级增长上也可以反映出来。过去,人工智能技术永远不会作为标准工具用于化学工程中;因此,对于当前是否是将之最终纳入标准工具箱的合适时机,是值得讨论的。在本研究中,荷兰根特大学Kevin M. Van Geem研究团队首先概述了当今机器学习应用于化学工程的三个主要环节(图2);接下来将批判性地讨论机器学习在化学工程中不断增长的潜力,并调查了其利弊;最后,列出了可能的原因来讨论为什么机器学习在化学工程中仍是“热门”的话题或为什么它最终会“不再热门”。


图2. 化学工程机器学习的三个主要环节;每个部分都对最终预测结果有影响,应该谨慎处理。
研究发现,在过去的十年里,机器学习已经成为化学工程师工具箱中的一个新工具。事实上,由于其具有执行速度快、灵活和用户友好的应用优势,化学工程师对机器学习的兴趣愈发浓厚。这种流行的另一面是误用机器学习或误解黑箱结果的风险,这可能会导致化学工程界对机器学习的不信任。以下三点建议可以帮助提高机器学习模型的可信度,使其成为一种更有价值、更可靠的建模方法


第一,在化学工程界中保持对数据和模型简单、开放的访问非常重要。高质量的数据和开源模型鼓励研究人员将机器学习作为一种工具,使他们能够更专注于自己的主题,而不是花时间在编程和收集数据上。第二,与第一点相关,是创建可解释模型。由于其他研究领域已经建立起机器学习,化学应用的新模型往往受到现有算法的启发。因此,研究为什么某个输出是由给定的输入生成的,而不是维护其黑箱特性,将有利于该领域的研究。第三条是对长远的算法教育进行投资。虽然化学工程师通常有很强的数学和建模技能,但理解图形界面背后的计算机科学是成为建模人员的前提。这也使定义模型的应用范围成为可能,这对于理解模型什么时候是插值,什么时候是外推至关重要。最后一点绝对是最为关键的:机器学习模型应该是可信的模型,这种可信度只有模型在多次训练集外的谨慎使用后方能获得。
关键词:人工智能;机器学习;反应工程;过程工程

扫二维码 | 查看原文

原文链接:http://www.engineering.org.cn/en/10.1016/j.eng.2021.03.019


以上内容来自:Maarten R. Dobbelaere, Pieter P. Plehiers, Ruben Van de Vijver, Christian V. Stevens, Kevin M. Van Geem.Machine Learning in Chemical Engineering: Strengths, Weaknesses, Opportunities, and Threats [J]. Engineering, 2021, 7(9): 1201-1211.


推荐阅读


点赞/在看/分享让更多小伙伴看到 ↓↓↓

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存