1、准备工作
1.1 题目背景
C4 烯烃广泛应用于化工产品及医药的生产,乙醇是生产制备 C4 烯烃的原料。 在制备过程中,催化剂组合(即:Co 负载量、Co/SiO2 和 HAP 装料比、乙醇浓度 的组合)与温度对 C4 烯烃的选择性和 C4 烯烃收率将产生影响(名词解释见附录)。 因此通过对催化剂组合设计,探索乙醇催化偶合制备 C4 烯烃的工艺条件具有非常 重要的意义和价值。 某化工实验室针对不同催化剂在不同温度下做了一系列实验,结果如附件 1 和 附件 2 所示。
请通过数学建模完成下列问题:
(1) 对附件 1 中每种催化剂组合,分别研究乙醇转化率、C4 烯烃的选择性与温 度的关系,并对附件 2 中 350 度时给定的催化剂组合在一次实验不同时间的测试结 果进行分析。
(2) 探讨不同催化剂组合及温度对乙醇转化率以及 C4 烯烃选择性大小的影响。
(3) 如何选择催化剂组合与温度,使得在相同实验条件下 C4 烯烃收率尽可能 高。若使温度低于 350 度,又如何选择催化剂组合与温度,使得 C4 烯烃收率尽可 能高。
(4) 如果允许再增加 5 次实验,应如何设计,并给出详细理由。
附录:名词解释与附件说明
温度:反应温度。
选择性:某一个产物在所有产物中的占比。
时间:催化剂在乙醇氛围下的反应时间,单位分钟(min)。
Co 负载量: Co 与 SiO2 的重量之比。例如,“Co 负载量为 1wt%”表示 Co 与 SiO2 的重量之比为 1:100,记作“1wt%Co/SiO2”,依次类推。
HAP:一种催化剂载体,中文名称羟基磷灰石。
Co /SiO2 和 HAP 装料比:指 Co/SiO2 和 HAP 的质量比。例如附件 1 中编号为 A14 的催化剂组合“33mg 1wt%Co/SiO2-67mg HAP-乙醇浓度 1.68ml/min”指 Co/SiO2 和 HAP 质量比为 33mg:67mg 且乙醇按每分钟 1.68 毫升加入,依次类推。
乙醇转化率:单位时间内乙醇的单程转化率,其值为 100 % x (乙醇进气量-乙 醇剩余量)/乙醇进气量。
C4 烯烃收率:其值为乙醇转化率 C4 烯烃的选择性。
附件 1:性能数据表。表中乙烯、C4 烯烃、乙醛、碳数为 4-12 脂肪醇等均为 反应的生成物;编号 A1~A14 的催化剂实验中使用装料方式 I,B1~B7 的催化剂实 验中使用装料方式 II。
附件 2:350 度时给定的某种催化剂组合的测试数据。
1.2 解题使用工具
语言:python3.8
编译器:SPSSPRO Notebook
下载链接:SPSSPRO Notebook(免费在线使用,推荐使用)
2、第一问解题教程
2.1 整体解题思路
第一问分两个问题进行回答,
1》对附件 1 中每种催化剂组合,分别研究乙醇转化率、C4 烯烃的选择性与温度的关系。
针对第一小题,需要注意的是,对催化剂组合应该是一一分析的,例如对于催化剂组合编号A1,可以画出来乙醇转化率、C4 烯烃的选择性与温度的三维图进行空间分析,也可以画出来二维图进行波动分析,然后再用些定量的指标进行描述性分析,例如用皮尔逊相关系数分析其相关性。
附件1 数据
2》对附件 2 中 350 度时给定的催化剂组合在一次实验不同时间的测试结果进行分析。
针对第二小题,由于温度固定,因此最简单的做法就是画出乙醇转化率、C4 烯烃的选择性的二维图,然后分析其相关系情况。
2.2 解题流程框图
第一问解题思路
2.3 详细解题步骤
首先读取数据,把附件一数据读取出来。
附件1数据
需要注意的是,需要填补一些催化剂组合,以便后面用代码绘图用。
直接使用fillna即可,设置ffill,也就是向上填充即可。
填充后的数据
然后根据催化剂组合进行分组,这在2.1的思路我们有讲到。分组后分别画出
1》乙醇转化率、C4 烯烃的选择性与温度的三维图进行空间分析
2》乙醇转化率、C4 烯烃的选择性与温度的二维图进行波动分析
3》乙醇转化率、C4 烯烃的选择性与温度的皮尔逊相关系数分析其相关性
SPSSPRO Notebook实现代码
波动分析
空间分析
皮尔逊相关系数分析其相关性
也可以通过SPSSPRO的相关系分析,拖入数据一键生成分析报告。
以催化剂组合为分组,生成的全部图表
3、第二问解题教程
3.1 整体解题思路
探讨不同催化剂组合及温度对乙醇转化率以及 C4 烯烃选择性大小的影响。
在做这道题是,首先需要搞清楚什么是催化剂组合。可以看到下图,截图的就是催化剂组合。
催化剂组合
解题需要我们根据附件内容把这些组合提取出来,提出取来后,以
Y(因变量):乙醇转化率、 C4 烯烃选择性(分2次做)
X(自变量):不同催化剂组合及温度
进行回归分析,可以采用多元线性回归,这里不适合用机器学习的回归,因为线性回归的分析结果会更加可解释。
3.2 解题流程框图
第二问解题思路
3.3 详细解题步骤
首先需要做的是按照这个规则(附件有提示),将组合提取出来。
其中,新生成的列名为:
co-sio2:Co/SiO2 质量比,例如下图所示为 200mg;
Co负载量:Co 与 SiO2 的重量之比,例如下图所示的1wt%;
HAP: HAP 质量比,例如下图所示为 200mg;
乙醇:乙醇加入量,例如下图按每分钟 1.68 毫升加入
提取后如下所示,然后将其保存为excel,
基于SPSSPRO的线性回归,设置
Y(因变量)与X(自变量)
可以得到结果如下:
SPSSPRO线性回归输出结果1
从F检验的结果分析可以得到,显著性P值为0.000***,水平上呈现显著性, 拒绝回归系数为0的原假设, 因此模型基本满足要求 对于变量共线性表现,变量 Co-SiO2、HAP VIF值大于10, 存在共线关系,简易移除共线性的自变量或者进行岭回归或逐步回归。
我们这里采用岭回归进行二次回归,岭回归(Ridge)是一种针对小样本数据,处理自变量多重共线性问题(一般VIF值大于10)的一种有偏估计回归方法。岭回归通过引入一个正数改进正规方程组,提供一种有偏估计的方法消除共线影响。当K=0时,即为最小二乘估计,由于岭回归为有偏估计,K的取值应尽可能小。岭回归放弃了普通最小二乘法的无偏估计,损失了部分信息,因此岭回归方程的 ²通常会稍低于普通最小二乘回归,但其估计的偏回归系数往往更接近真实的情况,从而提高了模型的稳定性和可靠性,对于病态数据的修复和拟合,具有较好的效果。
引用至SPSSPRO的岭回归描述
设置自动读取K值,根据岭迹图,结合方差扩大因子法确定K=0.113。(可以理解为惩罚系系数)
引用至SPSSPRO的岭回归输出结果1
上图以可视形式化展示了本次模型的各个自变量的标准化系数趋于稳定时的情况,确定好K值后,查看回归分析结果,岭回归的结果显示:模型F显著性 值为0.000***,水平上呈现显著性,拒绝原假设,表明自变量与因变量之间存在着回归关系。查看标准化系数,我们就可以定量地进行探讨不同催化剂组合及温度对乙醇转化率大小的影响。
且模型的公式:乙醇转化率(%)=26.153+0.042 × Co-SiO2+0.032 × Co负载量+0.059 × HAP-9.261 × 乙醇
同理可探讨不同催化剂组合及温度对 C4 烯烃选择性大小的影响。
4、第三问解题教程
4.1 整体解题思路
如何选择催化剂组合与温度,使得在相同实验条件下 C4 烯烃收率尽可能高。若使温度低于 350 度,又如何选择催化剂组合与温度,使得 C4 烯烃收率尽可 能高。
第三问核心思想就是构造一个X-Y模型,在验证确保拟合优度R2达到某一标准下,成立仿真模型,然后再控制其他相关变量不变的情况下(相同实验条件),调整选择催化剂组合与温度,使得 C4 烯烃收率尽可能高。
跟第二问的解决思路差不多,但是第三问可以采用更多的回归模型,因为第二问重点在于分析变量之间的关系,因此拟合优度不是关键,而第三问核心思想在于仿真,因此拟合优度R2是关键。
首先第一步,需要确定X与Y,
Y(因变量):C4 烯烃收率
X(自变量):不同催化剂组合及温度、以及其他相关变量(需要尽可能地构造)
C4 烯烃收率计算方法
因此可以知道,只是将第二问的Y改成Y*C4烯烃选择性(%)
构建好模型后,可以多个算法比较调优,选出最好的模型。然后生成一些数据,在控制其他相关变量不变的情况下(相同实验条件),调整选择催化剂组合与温度,使得 C4 烯烃收率尽可能高。
第二小问:若使温度低于 350 度,又如何选择催化剂组合与温度,使得 C4 烯烃收率尽可 能高。
第二小问则是可以限制温度低于350度,轻松解决。
SPSSPRO中的机器学习回归
4.2 解题流程框图
4.3 详细解题步骤
在3.3数据的基础上,以C4 烯烃收率为Y(因变量),采用机器学习模型进行预测,加入催化剂组合作为自变量,
拆分数据为训练集和测试集合,如下所示
可以采用启发式算法,例如遗传算法、PSO粒子群、模拟退火论等进行寻优
SPSSPRO-超参数寻优
训练好模型后,查看模型的评估结果,可以看到测试集的R2有0.821,拟合优度较高,模型表现还可以接受(这是我没调优随便跑的)。
接着,我们需要生成大量的仿真数据,也就是对催化剂组合进行笛卡尔积列举组合,可以通过计算现有数据的最大值和最小值,如下所示
催化剂组合的最大最小配比范围
然后5层for迭代,生成不同组合数据,例如下面所示,以温度、cosio2、HAP以1为步阶,co负载量和乙醇以0.1为步阶单位,生成了13万种不同的催化剂组合
然后将这些催化剂组合(X)喂入模型进行预测,然后对预测结果进行降序排序,C4 烯烃收率最大对于的催化剂组合,便是最优结果。
而第二小问,则是筛选出来温度小于等于350度的,作为最优结果即可。
5、第四问解题教程
如果允许再增加 5 次实验,应如何设计,并给出详细理由。
第四问其实是第三问的补充。
将这些催化剂组合(X)喂入模型进行预测,然后对预测结果进行降序排序,C4 烯烃收率最大对于的催化剂组合,我们把迭代最优的前5种方法给出,便是最优结果。
6 代码获取
以上,全部的代码、题目数据可以通过下面免费获取,关注SPSSPRO社区账号【跟着欢欢玩转数模】:
作者创作不易,大家觉得有用的点赞收藏关注三连呗。
来源地址:https://blog.csdn.net/weixin_44099072/article/details/126402684