邵聯(lián)合(1974-)男,黑龍江虎林人,工學(xué)碩士,大學(xué)講師,現(xiàn)就職于保定電力職業(yè)技術(shù)學(xué)院,主要研究方向?yàn)樯a(chǎn)過程自動(dòng)化及儀器儀表。
摘要:軟測量技術(shù)是解決現(xiàn)代復(fù)雜工業(yè)過程中較難甚至無法由硬件在線測量參數(shù)的實(shí)時(shí)估計(jì)問題的有效手段。本文介紹了基于回歸支持向量機(jī)(SVR)算法的基本原理,并以非線性、時(shí)變、大滯后的PTA氧化過程為研究對象,使用SVR算法對4-CBA含量進(jìn)行了預(yù)測。結(jié)果表明,與傳統(tǒng)預(yù)測方法相比,采用SVR算法的預(yù)測模型,具有精確度高,泛化能力強(qiáng)等優(yōu)點(diǎn),是用于PTA氧化過程中4-CBA含量預(yù)測的一種有效的方法,具有很好的應(yīng)用價(jià)值。
關(guān)鍵詞:軟測量;數(shù)學(xué)模型;4-CBA;回歸支持向量機(jī)
Abstract: In the modern complex industrial processes, some variables are very hard to be measured or even cannot be measured on-line by existing instruments and sensors. Soft-sensing technology can effectively solve the problem of realtime estimation. The basic principle of Support Vector Regression Machine (SVR) algorithm was introduced in this paper. For the process of PTA oxidation with non-linear, time-varying, large time delay characteristics, the 4-CBA Content was predicted by SVR. The predicted result was compared with that of traditional forecasting methods. The comparison result shows that the SVR has better integrative performance, high precision and generalization ability,so it is an effective method for being used in forecasting of 4-CBA content of PTA oxidation process and has a very good application value.
Key words: Soft-sensing; Mathematical model; 4-CBA; Support Vector Regression Machine
1 引言
建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的支持向量機(jī) (support vector machine,SVM)[1-3]已成為當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)研究熱點(diǎn)。
支持向量機(jī)采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則,在有限樣本情況下,得到現(xiàn)有信息下的最優(yōu)解而不僅僅是樣本數(shù)趨于無窮大時(shí)的最優(yōu)值,解決了一般學(xué)習(xí)方法難以解決的問題,如神經(jīng)網(wǎng)絡(luò)的局部最小問題、過學(xué)習(xí)以及結(jié)構(gòu)和類型的選擇過分依賴于經(jīng)驗(yàn)等固有的缺陷等問題,從而提高了模型的泛化能力。另外支持向量機(jī)把機(jī)器學(xué)習(xí)問題歸結(jié)為一個(gè)二次規(guī)劃問題,因而得到的最優(yōu)解不僅是全局最優(yōu)解,而且具有唯一性。SVM的方法最早是針對模式識(shí)別問題提出的,Vapnik通過引入ε不敏感損失函數(shù),將其推廣應(yīng)用到非線性回歸估計(jì)中,得到了用于回歸估計(jì)的標(biāo)準(zhǔn)SVM方法,稱為回歸支持向量機(jī)(support vector regressor,SVR) [4,5]算法。
2 支持向量機(jī)回歸算法原理
SVR算法的基礎(chǔ)主要是ε不敏感函數(shù)(ε-insensitive function)和核函數(shù)算法[6]。若將擬合的數(shù)學(xué)模型表達(dá)為多維空間的某一曲線,則根據(jù)ε不敏感函數(shù)所得的結(jié)果就是包絡(luò)該曲線和訓(xùn)練點(diǎn)的“ε管道”。在所有樣本點(diǎn)中,只有分布在“管壁”上的那一部分樣本點(diǎn)決定管道的位置。這一部分訓(xùn)練樣本稱為“支持向量”(support vectors)。為適應(yīng)訓(xùn)練樣本集的非線性,傳統(tǒng)的擬合方法通常是在線性方程后面加高階項(xiàng)。此法誠然有效,但由此增加的可調(diào)參數(shù)未免增加了過擬合的風(fēng)險(xiǎn)。SVR采用核函數(shù)解決這一矛盾。用核函數(shù)代替線性方程中的線性項(xiàng)可以使原來的線性算法“非線性化”,即能作非線性回歸。與此同時(shí),引進(jìn)核函數(shù)達(dá)到了“升維”的目的,而增加的可調(diào)參數(shù)卻很少,于是過擬合仍能控制。
2.1 線性回歸情形
設(shè)樣本集為: ,回歸函數(shù)用下列線性方程:
最佳回歸函數(shù)通過求以下函數(shù)的最小極值得出,
(1)
其中C是設(shè)定的懲罰因子值,ξ、ξ*為松弛變量的上限與下限。
Vapnik提出運(yùn)用下列不敏感損耗函數(shù):
(2)
通過下面的優(yōu)化方程:
(3)
在下列約束條件下:
求解:
(4)
由此可得拉格朗日方程的待定系數(shù) 和 *,從而得回歸系數(shù)和常數(shù)項(xiàng):
(5)
2.2 非線性回歸情形
類似于分類問題,一個(gè)非線性模型通常需要足夠的模型數(shù)據(jù),與非線性SVC方法相同,一個(gè)非線性映射可將數(shù)據(jù)映射到高維的特征空間中,在其中就可以進(jìn)行線性回歸。運(yùn)用核函數(shù)可以避免模式升維可能產(chǎn)生的“維數(shù)災(zāi)難”,即通過運(yùn)用一個(gè)非敏感性損耗函數(shù),非線性SVR的解即可通過下面方程求出:
(6)
其約束條件為:
(7)
由此可得拉格朗日待定系數(shù) 和 *,回歸函數(shù)f(X) 則為:
(8)
3 基于回歸支持向量機(jī)的4-CBA含量的軟測量建模
對二甲苯(Pa r a-Xyl ene,簡稱PX)是一種重要的化工原料,通常由石腦油經(jīng)過加工得來,PTA全名精對苯二甲酸(Pure Terephthalic Acid),由PX氧化得到,主要用于生產(chǎn)聚對苯二甲酸乙二醇酯(俗稱聚酯),聚對苯二甲酸丙二醇酯以及聚對苯二甲酸丁二醇酯。
3.1 PX氧化工藝流程
作為聚酯工業(yè)重要原材料的PTA主要由PX氧化而來。其氧化過程流程由圖1所示。在氧化反應(yīng)中,4-CBA濃度是作為氧化反應(yīng)進(jìn)程的觀測器,其含量是PTA產(chǎn)品中的主要雜質(zhì)及重要質(zhì)量指標(biāo)。根據(jù)反應(yīng)機(jī)理研究,4-CBA含量過低,則表明氧化反應(yīng)程度加深,副反應(yīng)加劇,能耗及醋酸、PX單耗增加。而濃度過高則表明氧化反應(yīng)停留時(shí)間較少,氧化反應(yīng)不足,將導(dǎo)致PX轉(zhuǎn)化率過低,這是生產(chǎn)過程主要必須控制和克服的。因此為了節(jié)能降耗,并保證PTA的產(chǎn)品純度,一般工業(yè)要求其含量在TA中為1500~3000 。在工業(yè)生產(chǎn)中4-CBA含量往往通過離線光譜分析獲得,但離線的分析滯后數(shù)小時(shí),且分析采樣次數(shù)少(一天兩三次),遠(yuǎn)遠(yuǎn)不能滿足控制的要求[7-9]。為了實(shí)時(shí)預(yù)測中間反應(yīng)物4-CBA含量,需要建立一個(gè)能夠較精確預(yù)測4-CBA濃度的軟測量模型[10]。
圖1 PX氧化過程流程圖
3.2 軟測量模型的建立
整個(gè)PTA氧化單元包括近10個(gè)罐,整個(gè)流程的停留時(shí)間為200min左右,與最終4-CBA濃度對應(yīng)的過程變量有不同的對應(yīng)時(shí)間間隔。在PTA 生產(chǎn)過程中,DCS 系統(tǒng)每隔半分鐘采集一次數(shù)據(jù),被采集的過程變量多達(dá)上百個(gè),將這些變量全部當(dāng)作模型的輸入變量是不切實(shí)際的,一方面會(huì)使模型復(fù)雜化,另一方面還會(huì)降低模型的預(yù)測能力,因此在建立軟測量模型之前需要選擇模型的輸入變量。表1給出了軟測量模型的輸入變量、變量滯后時(shí)間以及正常操作值。從實(shí)時(shí)數(shù)據(jù)庫中采集數(shù)據(jù)463個(gè)樣本用于訓(xùn)練。每個(gè)樣本有10維屬性,分別代表在某一時(shí)刻工況下的操作參數(shù),樣本輸出為4-CBA 濃度。
4 仿真實(shí)驗(yàn)
本文用來估計(jì)PX氧化過程模型參數(shù)的數(shù)據(jù)全部來源于工業(yè)現(xiàn)場,采集到的463組數(shù)據(jù)值,以混合罐料流量、催化劑濃度、反應(yīng)器溫度、反應(yīng)器液位等為輸入數(shù)據(jù),用支持向量機(jī)回歸方法為模型。在模型中,核函數(shù)選為高斯核,P=0.05,物性常數(shù):C=100,不敏感函數(shù):ε=0.1。圖2是PTA樣本集從x(0)到x(463)的測試過程。來預(yù)測4-CBA含量,其中紅線為模型預(yù)測值,藍(lán)點(diǎn)為真實(shí)值。
圖2 基于SVR模型的4-CBA含量的預(yù)測
5 結(jié)論
SVR算法基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化,克服了傳統(tǒng)方法的過學(xué)習(xí)和陷入局部最小的問題,具有很好的回歸精度和泛化能力;對于復(fù)雜的系統(tǒng),用支持向量機(jī)回歸方法來提取特征樣本,用這些少量的特征樣本來估計(jì)機(jī)理模型參數(shù),可以減少計(jì)算時(shí)間,同時(shí)避免了人工隨機(jī)試湊法選擇訓(xùn)練樣本的盲目性。利用其對PTA氧化過程中4-CBA含量的進(jìn)行預(yù)測,具有更快的收斂速度、更好的擬合精度和良好的預(yù)測性能,4-CBA含量軟測量的實(shí)現(xiàn)為PTA裝置的穩(wěn)定操作和離線指導(dǎo)提供了依據(jù)。
參考文獻(xiàn):
[1] Vapnik V. The Nature of Statistical Learning Theory[M]. NewYork,Springer,1995.
[2] 鄧乃揚(yáng),田英杰. 數(shù)據(jù)挖掘中的新方法—支持向量機(jī)[M]. 北京: 科學(xué)出版社,2004.
[3] CAUWENBERGHS G,POGGIO T. Incremental and Decremental Support Vector Machine[J]. Advances in Neural Information Processing Systems,2001,13: 409-415.
[4]Vapnik V. The Nature of Statistical Learning Theory[M]. New York: Springer2Verlag,1999,2nd ed.
[5]Vapnik V. An overview of statistical learning theory[J]. IEEE Transactions on Neural N etworks,1999,10(5): 988-999.
[6] 榮岡,金曉民,王樹青. 先進(jìn)控制技術(shù)及應(yīng)用: 軟測量技術(shù)及其應(yīng)用[J]. 化工自動(dòng)化及儀表,1999. 26(4): 70-72.
[7] 俞金壽,劉愛倫,張克進(jìn). 軟測量技術(shù)及其在石油化工中的應(yīng)用[M], 北京: 化學(xué)工業(yè)出版社,2000.
[8] 李修亮,蘇宏業(yè),褚健.基于在線聚類的多模型軟測量建模方法[J]. 化工學(xué)報(bào),2007,58(11): 2834-2839.
[9] 李海青,黃志堯. 軟測量技術(shù)原理及應(yīng)用[M]. 北京: 化學(xué)工業(yè)出版社,2000.
[10] 汪永生. 軟測量理論、方法、軟件包及其工業(yè)應(yīng)用研究[C]. 上海交通大學(xué),2000. 43-48.
摘自《自動(dòng)化博覽》2010年第三期