怎样用人工神经网络法预测二维色谱柱效 ?如题 谢谢了
1个回答
展开全部
摘要二维柱色谱系统是近年来迅速发展的新型色谱方法,柱效与主要影响因素的关系难以用传统方法建立定量模型。本文采用基于变步长BP算法的人工神经网络,对高效微填充柱──毛细管柱构成的二维柱色谱系统建立了柱效与影响因素的权接拓朴模型,并用于柱效预测和操作条件优化中,取得了较好的效果。 1、前言 现代气相色谱已广泛采用了毛细管柱,毛细管柱的分离效能高但柱容量低,直接进样极易造成进样过量,柱管也易被样品中的高沸点组分玷污。因此,比较理想的方法是在毛细和柱前串接一支短填充柱,构成二维柱色谱系统。由于二维柱色谱便于实现中心切割、溶剂切割、反吹等切换操作,有利于痕量杂质的测定、有利于保护主柱,并且可简化样品的预处理过程,故近年来这种新型的色谱方法发展十分迅速。 自八十年代起,中科院大连化物所国家色谱研究分析中心对二维柱色谱进行了大量研究工作,卢佩章院士开创性地提出了微填充柱──毛细管柱直接连接的新型系统。根据这一思想,国振双等以美国PE公司SIGMAI气相色谱仪为基础,在原汽化室中安装了自行研制的高效微填充预柱与石英毛细管柱直接相连接,将一维柱色谱改装为二维柱色谱系统。并以正构烷烃为样品建立了双柱系统的柱效评价实验方法,指出二维柱色谱系统的柱效主要由预柱柱温、主柱柱温、预柱间压差、预柱与主柱间的放空量所决定,但未建立柱效与因素之间的数学关系。实际上,这种关系较为复杂,并不能找到一个简单的函数式来表示,如果用传统的建模方法来研究,通常难以奏效。 人工神经网络(ArtificialNeuralNetwork,简称ANN)是近年来迅速发展的研究热点,在生物科学、自动控制、化学工程等领域取得了很大的应用进展。它是一种新型的黑箱方法,不需要了解输入输出之间的相互关系,其自学习功能能够“记忆”样本所含的信息,网络只是根据训练样本的数据来自动寻找相互关系,给所研究的系统以具体的数学表达,从而使系统的定量化优化和预测成为可能;并且由于其并行计算的性质,计算量不会因为维数增加而发生指数“爆炸”。在研究系统内复杂关系的建模问题上,人工神经网络显示出其独特的优越性。 2、变步长BP算法人工神经网络 我们采用的目前应用比较成熟且应用最广泛的三层BP神经网络模型,它能将样本的输入输出问题转化为一个非线性的优化问题,是从大量实验数据中总结规律的有力手段。 BP网络是由输入层、输出层和隐层所组成的前向连接模型,同层各节点互不连接,相邻层的节点通过权连接。输入层各点的输入信号经权重耦合到隐层的各点,由作用函数f(x)转换后再耦合到输出层的各点。将输出信号与学习样本的目标数值进行比较,两者之间的误差利用“反传算法(BackpropagationLearningAlgorithm)”沿原连接通道返回,通过修改各层节点的连接权重,使误差达到最小。权重修改公式为: 式中:W为权重;t为训练次数;h和α分别为学习步长和记忆常数。 当所有样本输出值与目标期望值的之间的均方差RMS值满足要求时,停止迭代,网络训练完毕,各节点的连接权值就固定下来,同时也就得到了所研究对象的输入输出之间的拓朴关系,即建立了两者之间的数学定量关系。利用训练好的网络即可方便地进行新样本的预测。 由于经典的BP算法存在着收敛速度慢、有局部最小问题等缺点,人们对其提出了一些改进方法,如添加惯性冲量、批处理学习样本、跳跃学习以及动态调整学习步长和记忆常数等。我们所采用的是变步长BP算法,主要改进之处在于: (1)引入动态步长技术:根据样本的训练情况动态地增大或减小学习步长h。在样本学习过程中,当RMS减小时自动增大h值(乘以一个大于1的常数因子a);而当RMS增大时自动减小h值(乘以一个小于1的常数因子b)。在一般情况下,常数a和b值的选取应使得(1-b)的值比(a-1)略大一些。 (2)加入偏置以稳定网络; 3、样本及网络模型参数的选取 3.1训练样本集及预测集的组织 实验数据组成训练样本集与预测集。其中训练样本数为22个,预测集样本数为3个。以预柱柱温、主柱柱温、预柱间压差、预柱与主柱间的放空量四个因素为输入向量,作为衡量柱效指标的二维柱色谱系统有效塔板数N为输出向量(教师信号)。 3.2变步长BP网络参数 我们所采用的网络为带一个配置节点的4-6-1体系;学习步长h初值为0.2,记忆常数α为0.5;步长调整因子a取1.02,b取0.96;传递作用函数f(x)取Sigmoid函数,即: 表1变步长BP神经网络训练样本及预测样本 序号类别输入向量输出向量 预柱柱温(℃)主柱柱温(℃)预柱间压差(kPa)柱间放空量(mL/s)塔板数N 1训练样本1406084951.1 214080103171.7 3140100122104.7 416060102138.5 5160801241108.7 6160100832482.8 718060123838.6 81808082726.5 918010010412064.9 10180120103.315809.1 1112012033.316162 1212012053.315284 1312012073.310978 1412012093.310498 15120120113.313150 16120120133.37562 1712012083.39349 1812012082.52896 1912012082.0648 2012012081.5289 2112012081.0108 2212012080.575 23预测样本18010010513707.7 24180100103.313931.2 25180120103.315809.1 由于研究的样本中最大最小值相差较大,而Sigmoid函数要求输入值范围在-2~+2之间、输出值范围在0~1之间,这样才能保证网络对样本具有足够的敏感性和良好的拟合性。样本训练开始前,先用对数标准化方法将输入向量归一化至-2~+2之间、输出向量归一化至0~+1之间,对数标准化的方程为(设向量为V0,标准化合的向量为V):(A和B的值由程序根据归一化目标自动求算) 采用随机数矩阵进行权值矩阵的初始化,设置随机数生成器的最大最小输出为-3和+3。 值得注意的是,这里目标误差的设置是对于已标准化的数据而言的,在标准化数据还原时可能会导致误差的放大。 4、人工神经网络的训练和预测 4.1变步长BP网络的训练 设置网络的目标误差为0.05(这是通常情况所采用的值),利用VisualBasic编写的程序进行样本的训练,运行平台为Windows95,机型为Pentium166、16M内存。经过约230秒的迭代运算,RMS值小于目标误差(注意此时是对已标准化的数据而言),网络训练完毕程序输出各种结果参数。此时对于每一样本,网络的输出值对目标值(实验值)的误差都基本小于目标误差0.05。 这样,我们就建立了二维柱色谱柱效与其四个影响因素之间的BP神经网络模型,这个模型是一个定量化了的拓朴权接模型,为进一步预测和优化提供了数学依据。 4.2利用BP神经网络进行柱效预测 从数据可以看出,在进行不同因素条件下的柱效预测时,标准化向量的误差均小于网络训练的目标误差0.05;这说明神经网络较好地记忆了所学习样本中蕴藏的信息,训练完毕的网络较好地反映了二维柱色谱柱效(以有效塔板数来表示)与四个主要影响因素之间的定量关系。另一方面,正如前面第2节所述,在对标准化(归一化)向量作还原时,可能会导致误差的放大,这也正是24号样本相对误差会达20%的原因,对实际的微填充柱──毛细管柱二维色谱系统,由于其本身的柱效很高,这样的误差还是可以接受的。而且,这种误差应该还含有实验本身误差的因素在内。 实际上,预测集中的样本是取自在前期实验基础上进一步寻优实验的数据。根据小区间的进一步寻优试验,根据所得的有效塔板数的多少确定了实验所用的二维柱色谱系统其最佳操作条件为25号样本对应的操作条件:预柱温180℃、主柱温为120℃,预柱前压为10kPa,预柱和主柱间的放空量为3.3mL/s。如果我们依据BP神经网络的预测结果,同样可以发现,25号样本的目标输出最大,其对应的操作条件应为最佳操作条件,两者结果完全一致。 5、结论 (1)BP算法人工神经网络具有自组织、自学习和自适应能力,具有模拟多种函数的能力,包括非线性函数和分段函数等。在用于预测二维柱色谱系统的柱效时,BP网络对样本元素间的复杂关系用权接拓朴结构进行了较好的摸拟,训练好的网络在预测不同条件下二维柱色谱系统的有效塔板数、优化二维柱色谱系统操作条件时,结果基本与实验值一致,预测精度较高,证明了方法的可行性。 (2)针对经典BP网络收敛速度慢、有局部最小问题的缺点,引入了变步长技术。实践证明这种根据样本学习情况动态地改变学习步长的方法有效地改善了收敛特性和速度。 (3)BP网络的样本组织,并不需要满足某种特定的条件。例如散布于文献中的数据资料、不够系统性的有残缺性的数据等只要准确可靠,都可以作为训练的样本。 (4)当然,BP网络的应用必须基于一定数量准确可靠的输入输出数据对组成的训练样本。这就是说,BP算法作为一种有导师学习算法,适合于应用在有数据资料积累但不易用一般数学方法分析得到定量关系的场合,而不适合于资料严重缺乏的场合。 详情请参考国家标准物质网 www.rmhot.com
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询