作者簡介:陳勇(1966-),男,高級工程師,現任東方電子股份有限公司董事、副總經理,多年從事電力調度自動化、變電站自動化、配電自動化相關領域研究和企業管理工作。
摘 要:本文依據電力調度實際運行情況和業務知識需求,考慮智能電網發展趨勢,提出了利用數據挖掘技術建設智能電網調度運行分析系統的解決方案,討論了調度運行業務分析系統的體系結構和數據挖掘模型,并說明了調度運行業務信息分析實例和系統實現技術。
關鍵詞:數據挖掘;智能電網;調度運行;業務分析;綜合信息平臺
Abstract: Based on data mining and business information request in electric power dispatching,considering the development trend of Smart Grid,this paper presents one solution of building the intelligent operation analysis system by using data-mining technology.We discuss the system architecture,and data mining model,and present.the instance of dispatching operation business analysis and the technologies of system implementation.
Key words:Data Mining;Smart Grid;Electric Dispatching Operation;Business Analysis;Integration Information Platform
智能電網是當今世界電力自動化系統發展的最新動向,被認為是21世紀電力系統的重大科技創新和發展趨勢。作為下一代電網自動化、信息化解決方案,智能電網是電網運行和管理的“中樞神經系統”。可綜合處理各類調度自動化數據信息,為調度員提供各種智能分析和輔助決策工具,具有高度開放性、可用性和信息安全性,可適應各種標準信息集成框架的調度自動化系統[7-9]。
本文針對我國智能電網的建設背景,探討構建智能電網的技術研究。結合電網調度業務需求,提出了利用數據挖掘技術構建應用系統的解決方案,按照“集成信息——構建模型——提取知識”的業務分析思路,建設智能電網調度運行分析系統,實現消除信息孤島,形成信息共享,支持智能化業務知識分析。
1 系統體系結構
智能電網調度運行分析系統綜合數據報表、數據挖掘和多維分析等商務智能技術,從歷史數據中提取信息,分析對調度決策有價值的知識。系統體系分為三層:信息集成層整合各種業務系統的結構化和非結構化數據,構建綜合信息平臺;應用服務層整合業務模塊,根據粒度大小整合業務服務對象,實現基于數據挖掘模型的知識發現,并通過消息通訊和工作流技術進行業務銜接,跨越多個應用進行業務流程整合;展現層主要實現系統訪問層次上的整合,向用戶提供統一的交互模式。系統體系結構如圖1所示。
圖1 系統體系結構
電力企業目前已積累了許多有關調度運行和管理的數據,這些數據處于SCADA、EMS、TMR和GIS等系統中。由于這些數據的分散性、異構性,再加上安全分區、橫向隔離的要求,使得很難直接獲取這些系統的數據并基于這些數據發現隱藏在海量數據背后的信息或知識。為了發現這種信息或知識,首先需要對數據進行整合,對這些分散的數據進行抽取、轉換、加載和清洗,然后基于該數據信息平臺進行相關主題的數據挖掘以獲取所需要的知識。
業務整合是將原有的分散于企業內部或外部的“業務流程斷點”進行鏈接,完成業務活動自動化的過程,利用工作流、消息、協同等技術,實現跨系統整合,使跨部門業務能夠在網絡環境中實現對同一事務的協同處理。降低服務對系統交互的信賴性。服務之間通過簡單、精確定義的接口進行通信,實現各系統間業務流程整合和管理。
展現層實現信息系統用戶交互層次的整合,訪問企業內分布存儲的、各種來源的信息內容,并提供統一的檢索和內容訪問控制。內部用戶可通過Intranet根據系統賦予的不同權限實現各個業務應用訪問的集成,提供集成化的服務,實現信息查詢和報表展示。
2 數據挖掘模型
數據挖掘就是從海量數據中挖掘出有價值信息的技術,應用一系列技術從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、有用的信息和知識的過程[1-5]。其工作過程包括數據整合、建立模型、挖掘和知識分析。數據可以是結構化的,如關系數據庫中的數據;也可以是半結構化的,如文本、圖形、圖像數據,甚至是分布在電力調度各類業務間的異構型數據。
數據挖掘技術在處理電力調度海量數據和挖掘深層次信息方面有著很大的優勢,針對電力調度業務需求,可以采用數據挖掘中發現知識的預測模型、多維分析模型、關聯分析模型等方法構建挖掘模型,實現知識提取。
2.1 預測模型
為了把握分析對象發展規律,需要用已有數據序列預測未來趨勢。電力負荷預測是調度業務中常用技術,在充分考慮系統運行特性、增容決策、自然環境和社會影響的條件下,研究或利用一套能系統地處理過去與未來負荷的數學方法,根據氣溫、濕度等因素預測未來用電需求,在滿足一定精度要求的前提下,確定某特定時刻的負荷數值,指導電力調度決策。
負荷預測比較常用的方法有:時間序列法、灰色預測法、模糊聚類識別預測法、神經網絡預測法和優選組合預測法等。人工神經網絡能夠建立任意非線性的模型,適用于解決時間序列預測問題。時間序列模型強調考慮時間特性,尤其是考慮時間周期的層次,如日、星期、月等,還可考慮日歷的影響,如節假日等,適合應用于電力系統的負荷預測。
2.2 多維分析模型
維是信息所對應的層次概念,多維分析以維為基礎,將數據分類進行抽象統計分析,按照分析對象的屬性、特征,建立業務信息分類模型。多維分析基于統計學原理,在不同維度之間關聯后做數據分析,在電力調度分析中通常按時間(年、季度、月、周、日)和區域(地區、省、城市、區)進行分析,常用的方法有回歸分析、方差分析等。
電力調度業務數據也可以采用分類模式進行統計分析,將數據分為三類進行歸納,提取能代表共同特性的信息:①設備臺賬類,描述電力調度對象固有屬性的數據,包括一次設備、二次設備、自動化設備、通信設備等,主要來自業務系統的設備數據庫,包括各種參數、定值;②動作記錄類,電力調度所從事的工作,實質上就是對電網設備的操作,以及處理電網設備的動作,這類數據來自日志(調度、保護、自動化、通信)、操作票、工作票,開關變位、保護故障信息系統等,反映電力系統運行的非連續過程;③時間采樣類,反映電力系統連續變動過程的一系列數據,其最大特點就是時間性,根據應用目的不同設置不同的粒度,如來自SCADA/EMS的原始數據可達到秒級的時間間隔,有分鐘級或小時級的采集電量,還有按日、旬、月、季、年匯總加工的報表數據等。
2.3 關聯分析模型
關聯規則反映事物之間依賴或關聯的知識,關聯規則挖掘是在數據庫或信息知識庫的項目集或者對象集中尋找關聯、相關、或有因果關系的信息,涉及的兩個重要參數是最小支持度和最小信任度,支持度表示規則前件和后件同時在數據集中出現的概率;信任度表示在規則前件成立時能夠推出規則后件的概率,或者說規則后件相對于規則前件的可信程度。相關性指某種事物發生時其他事物會發生的一種聯系,可以通過關聯的支持度和可信度來描述。
進行電力負荷特性分析時,可以將影響負荷特性變化的因素分為兩類:一類是對負荷具有長期影響效應的因素,對負荷的影響表現為負荷變化的長期趨勢性,例如經濟發展、產業結構變化等;另一類是對負荷的影響具有短期效應的影響因素,比如溫度、降雨量等氣候因素。研究各種相關因素對各行業或區域用電負荷變化的影響規律,有助于提高電力負荷的預測精度,確保電力系統的安全、經濟運行。
本系統在具體應用中改進ID3算法,不僅考慮決策屬性帶來的信息增益,還考慮到選擇該屬性后繼續選擇的屬性所帶來的信息增益,即同時考慮樹的兩層結點,構造出高質量的決策樹。運用該算法,能夠減少結點數目,使樹的深度更小,提高挖掘速度和效率。具體算法為:設A為侯選的屬性,A有n項屬性值,對應的概率分別為P1,P2,…,Pn,按照最小信息熵原理對屬性A擴展,{B1,B2,…,Bn}為n個子結點選擇的屬性,分別對應的信息熵為H(B1),H(B2),…,H(Bn),則
(1)
算法選擇屬性A*的標準是A*使得H*(A)最小。算法的詳細步驟如下:
(a)對任意未選擇的屬性A,假設A有n個屬性值,對應的概率分別為P1,P2,…,Pn,以屬性A擴展,生成n個子結點{B1,B2,…,Bn},Bi是屬性A取第i個值時,按照最小信息熵原理選擇的A的后繼屬性,分別對應的信息熵為H(B1),H(B2),…,H(Bn);
(b)根據公式(1),計算H*(A);
(c)選擇A*使得H*(A)最小,將A*作為新選的屬性;
(d)利用步驟(a)的計算結果,建立結點A*的后繼結點{B1,B2,…,Bn};
(e)對所有的Bi,若為葉結點,則停止擴展此結點,否則遞歸執行(a)-(e)的過程。
電力負荷具有隨機性,在實際預測中不可能考慮到所有的因素,一方面是由于歷史數據的收集和觀測困難;另一方面是因為因素太多不僅會引起建模困難,而且會帶來運算復雜和數值不穩定等問題。因此選取對負荷預測有較大影響的星期因素和溫度、濕度等氣象信息作為主要考慮因素,改進決策樹預測模型,克服算法的計算依賴于屬性值較多的屬性、屬性間相關性強度不夠及對噪聲較為敏感的缺點,具有較好的預測結果,在一定程度上揭示影響日特征負荷的各個影響因素的重要程度。
3 業務信息分析
為了電力安全經濟調度,必須認真分析所有收集到的數據,將其轉化為直觀、易懂的調度經驗知識。為此,基于數據挖掘的調度運行知識獲取模型,觀測分析結果、提供可視化程度高,便于調度運行人員獲得有價值的信息,快速、有效地支持實際調度業務分析。
3.1 電網運行信息分析
分析挖掘電網運行的宏觀信息,支持電網運行調度知識的發現,根據分析信息合理安排未來的輸電計劃,充分發揮其跨區輸電的潛力,能最大限度滿足當前電力需求。建立用電區域、電壓等級、用電負荷三維的電網運行數據透視和分析模型,可以直觀分析出某區域、某條線路負荷明顯高于其他線路的負荷情況,根據分析結果,可進行編制初步的電力調度計劃。
業務分析過程中,可以利用多種復雜檢索對數據源各特征的總體均值、方差、標準差、中心矩、總體偏度、總體峰度進行計算,提取電網運行信息。按照故障類型、故障發生時間、嚴重程度和系統的運行模式、人員素質進行相關性分析,從而挖掘出更多的調度運行經驗,指導實際調度運行業務。
3.2 區域負荷趨勢分析
電力負荷具有經常變化的特點,不但按小時變、按日變,而且按周變,按年變,同時負荷又是以天為單位不斷起伏的,具有較大的周期性。負荷變化是連續的過程,一般不會出現大的躍變,但電力負荷對季節、溫度、天氣等是敏感的,不同的季節,不同地區的氣候,以及溫度的變化都會對負荷造成明顯的影響。
圖2 本年與上年區域負荷趨勢對比
為了選擇適當的電網供電機組類型和合理的電源結構,還必須預測負荷及電量。負荷預測根據目的的不同可以分為超短期、短期、中期和長期。電力系統負荷預測包括最大負荷功率、負荷電量及負荷曲線的預測。最大負荷功率預測對于確定電力系統發電設備及輸變電設備的容量非常重要。如圖2所示,建立分區負荷趨勢對比分析圖表,挖掘電網負荷的變化趨勢規律,用于指導電網供電負荷調度。
3.3 電力負荷特性分析
電力優化調度的目標之一就是要努力減少用戶在電網峰荷時段的電力需求,使用戶更有效地利用能源,在滿足同樣能源服務的同時減少其用電量。目前重點實施的削峰填谷等措施在一定程度上改變了負荷曲線的形狀,基于用戶用電特性的分類方法,通過用戶曲線與系統曲線的對比,為電力調度選擇用戶、采取各種價格措施(如峰谷分時電價、可中斷電價、避峰電價等)影響用戶用電行為、改善系統負荷曲線形狀提供有益參考,促進電力系統的生產和運行效率的提高。
基于負荷量的用戶分類是分析用電特性的基礎,建立各類用電特性分析,能直觀表明某供電區域商業用電和生活用電為調峰重點,可以加強電力需求側管理,運用各種措施減少該時間段這兩類電量消耗,降低電網最大負荷。
4 系統實現技術
4.1 基于綜合信息平臺實現信息集成
綜合信息平臺是建設調度業務分析系統的基礎,實現數據整合和集成業務信息,以企業應用集成總線ESB方式提供數據模型,而無需進行點對點轉換;基于公共模式的集成數據模型有助于減少數據重復,而且企業范圍內參與集成運行的應用可以同時知道數據變化[6]。平臺提供靈活的模式定義工具,用戶可自定義一些特殊數據模式。分布式計算環境下的多層客戶/服務器模式、跨平臺、跨網絡透明通信框架的特點,實現了電力企業應用以軟插件形式插入軟總線實現集成運行。
綜合信息平臺不同于所謂的“數據平臺”,數據平臺重點在于采用統一的方法進行數據的存儲管理,能提供規范的數據接口,簡單的查詢統計工具。而綜合信息平臺的建立,除了要包含數據平臺的功能外,還要做到數據信息上的整合。從整體綜合規劃數據信息,結合業務需求,使用面向服務的方法建立信息模型、業務知識模型和服務模型,把數據和應用結合到一起,方便地解決信息的交流問題,完成信息發布、全文搜索、知識抽取和應用集成。
4.2 構件模型庫
構件模型庫的建設思路就是利用構件技術,在標準的、異構系統互聯的中間件技術支持的基礎上實現基于軟件總線的信息集成,提高應用系統開發效率和運行性能,使應用系統各業務模塊凝成為有機體。基于構件耦合法分層設計構件模型庫可以充分考慮構件的易擴展性和重用性,減輕系統開發工作量并提高應用質量。根據構件在應用中功能層次的差異,部署在構件模型庫中的構件可分為:支撐構件、內核構件、外殼構件等。
支撐構件層提供系統運行時服務的底層定義和實現,為系統其他構件提供底層支撐。如數據提取構件、數據轉換構件、數據通訊構件等。內核構件層實現系統的基本功能,是系統必不可少的組成部分,主要包括兩部分構件:一是事務處理構件、安全定義構件、消息處理構件、協調構件等;二是業務建模、計算處理、數據挖掘算法構件等。外殼構件層主要用于與用戶的交互功能及業務邏輯的實現。包括界面操作構件、業務邏輯構件、報表生成構件、交互信息處理構件等。
相對于外殼構件層的用戶個性要求經常變化,支撐構件層與內核構件層因系統的需求信息差異而改變的頻率很小,從而可以充分利用構件的可重用性,提高系統可靠性和運行性能。
4.3 動態報表和圖形分析
為增強應用效果,系統將動態業務報表和圖形分析技術相結合,提供包括棒圖、餅圖、折線圖等各種圖表,使數據統計分析信息以美觀、直觀的方式展示,提高系統應用水平。系統提供的動態報表可以滿足用戶復雜Web報表需求,輕松實現企業分散數據信息集成,以個性化的Web報表進行展現,方便用戶和業務人員進行查詢、統計與分析。進行業務分析過程中,將電力負荷、預測負荷和歷史平均負荷以多條曲線同畫面顯示,能直觀地分析偏差走勢,支持調度決策。
5 結語
本文討論構建的智能電網調度運行分析系統能夠滿足電力企業運營模式和調度自動化業務功能需求,適合調度人員進行業務分析,提取調度運行知識信息。數據挖掘是一個人機交互、多次反復的過程,應用中尚面臨超大數據量的挑戰,如何正確處理冗余信息和噪聲數據、提升挖掘結果的有效性和知識信息的實用性是系統建設需不斷完善的要素。
參 考 文 獻
[1]李雄飛,李軍.數據挖掘與知識發現[M].高等教育出版社,2003.
[2]劉宇.基于數據倉庫和數據挖掘的電力調度輔助決策[D].華北電力大學,2004.
[3]陳星鶯,張曉花,矍峰,等.數據挖掘在電力系統中的應用綜述[J].電力科學與技術學報,2007,3:51-56.
[4]肖峻,張晶,朱濤,等.基于關聯分析的城市用電負荷研究[J].電力系統自動化,2007,31(17):103-107.
[5]仲偉寬.模糊聚類方法在用戶負荷曲線分析中的應用[J].華東電力,2007,35(8):97-99.
[6]李勝利,任軍,伊建偉.電力市場中發電廠調度綜合信息平臺的設計與實現[J].電力設備,2007,8(10):27-29.
[7]周歡,黃春毅.企業數據總線在管理型商業智能系統中的應用[J].內蒙古科技與經濟,2008,23:72-73.
[8]周瑾,黃立平.知識管理和商務智能關系研究[J].科學學與科學技術管理,2009,3:100-104.
[9]肖世杰.構建中國智能電網技術思考[J].電力系統自動化,2009,33(9):1-4.
——轉自《自動化博覽》