本文摘要:摘要:論述了大數據在電力設備狀態監測上的發展趨勢與應用前景。首先分析了狀態監測數據的大數據特征,并從大數據技術、大數據思想方法、大數據算法三個層面論述了大數據對電力設備狀態監測的提升點。其次給出了基于大數據的電力設備狀態監測系統架構,并從
摘要:論述了大數據在電力設備狀態監測上的發展趨勢與應用前景。首先分析了狀態監測數據的大數據特征,并從大數據技術、大數據思想方法、大數據算法三個層面論述了大數據對電力設備狀態監測的提升點。其次給出了基于大數據的電力設備狀態監測系統架構,并從數據采集、數據去噪、特征提取、模式識別、知識挖掘、數據可視化幾個方面論述了大數據與狀態監測各個環節的結合點。最后通過一個綜合監測系統案例,分析了大數據在多源異構數據融合、綜合分析與診斷、設備故障預測上的應用。大數據在電力設備狀態監測上的深入應用,有利于解決設備狀態評價和故障預測的難題,推動該領域朝著更加智能化的方向發展。
關鍵詞:大數據;狀態監測;關鍵技術;發展趨勢;應用前景
0引言
電力設備狀態監測通過信號傳感、數據采集、數據處理等步驟獲取設備健康狀況相關的特征參數,評價設備狀態,預測設備故障,一方面能充分延長健康狀況良好設備的停機檢修時間,提高設備運行經濟性,另一方面能檢測出有潛在故障的設備,及時維修,提高設備的可靠性,因此在發電機、變壓器、氣體絕緣開關、電力電纜等主電力設備中獲得了廣泛的應用[1-3]。
電力論文范例: 電力系統中高壓電纜輸電線路設計研究
然而由于電力設備固有的機械、物理、電氣內部復雜性和設備故障信號固有的傳播衰減、耦合干擾、反射振蕩等特性,電力設備狀態正確評價和故障準確預測是該領域的固有難題,造成了誤報警和漏報警等情況,為電力企業帶來損失[4-5]。大數據為該固有難題的解決帶來了新的發展契機。大數據是指其大小超出典型數據軟件抓取、儲存、管理和分析范圍的數據集合[6-7]。也有觀點認為大數據是指需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產[6-7]。
業界對大數據的定義并未統一,但對大數據特性的描述卻大同小異,比較有代表性的為4V特性,即規模性(Volume)、高速性(Velocity)、多樣性(Variety)、價值性(Value)[7]。規模性(Volume)是指大數據的數據量非常龐大,計量單位達到TB級、PB級甚至ZB級;高速性(Velocity)是指數據洪流實時增長,且增長速度快;多樣性(Variety)是指大數據的數據類型眾多,不僅包括結構化的表格,而且包括半結構的文本、視頻、圖像、語音及非結構化的文件;價值性(Value)是指大數據中隱藏著價值,但是價值密度稀疏,必須通過知識挖掘才能獲取[8-9]。
近年來部分研究者將大數據技術應用于電力設備狀態監測[10-15]。文獻[10]提出一種基于大數據分析的輸變電設備狀態數據的異常快速檢測方法。文獻[11]提出一種基于高維隨機矩陣理論的大數據模型,以實現設備關鍵性能評估和異常狀態檢測。文獻[12]提出一種基于無連接層次編碼的電力設備狀態監測數據模型,以達到優化OLAP分析性能的目的。
文獻[13]開展了基于Hadoop云計算平臺進行輸變電設備狀態監測大數據存儲優化和基于MapReduce的并行分析處理的研究。文獻[14-15]中結合大數據技術及數據挖掘分析方法在設備狀態評估中應用的現狀,分析了大數據技術在電力設備狀態評估中的典型應用場景和應用效果。電力設備狀態監測數據,包含在線監測數據、帶電檢測數據、預防性試驗數據等,具有數據量大、增長迅速、類型眾多、價值密度稀疏等特點,是典型的大數據[10]。體現在以下幾個方面:
(1)監測對象數量龐大。電力系統由發電機、變壓器、氣體絕緣開關、電力電纜等主電力設備構成,這些設備型號各異、種類繁多、數量龐大,實現對這些主設備較大覆蓋范圍的監測,對象本身已經達到了較高的數量級[13]。(2)監測參數種類繁多。以變壓器在線監測為例,含接地電流、振動、溫度、微水、介質損耗、油色譜、局部放電等參數,這些監測參數的監測結果中既包含結構化的數據也包含圖片、視頻、文本等半結構化和非結構化的數據[16]。 (3)監測數據增長迅速。電力設備狀態需要不間斷的數據采集,獲取的原始數據呈指數級增長。以三相高壓電纜局部放電在線監測為例,其典型的數據采樣率為100MS/s,每天的監測數據量與電纜數量、采樣時間間隔的關系。
(4)數據分析需要綜合考慮更多的信息源。電力設備狀態監測數據的分析與評價需要綜合考慮設備監測歷史數據、設備離線實驗數據、設備臺賬信息、同類型設備故障信息、電網工況信息、設備狀態評價標準等數據源,才能對設備狀態做出正確評價。(5)價值密度稀疏。電力設備狀態監測數據實時增長,但能捕捉到故障發生征兆的數據卻較少,這是因為一方面電力設備發生故障的概率不高,例如文獻[17]中統計的變壓器故障概率是1.8‰,另一方面部分故障從產生到設備發生事故的時間較短,因此電力設備在線監測數據大部分是平穩數據,價值密度稀疏[16]。
綜上所述,電力設備狀態監測數據與大數據的4V特征吻合較好,是典型的大數據。采用大數據技術或大數據思想方法開展電力設備狀態監測與數據分析,有適應其固有特點的獨到優勢,并將有利于解決設備狀態評價與故障準確預測的難題,進而避免維修不足與維修過剩帶來的經濟損失,提高電力設備的運行可靠性,保障供電安全[18-19]。
1大數據對電力設備狀態監測的必要性
大數據對電力設備狀態監測的提升主要體現在大數據關鍵技術、大數據思想方法和大數據算法三個層面。關鍵技術層面是指處理大數據的分布式計算技術、內層計算技術、流處理技術、批處理技術、分布式存儲技術、非關系型數據庫技術等能直接用于海量狀態監測數據的計算、存儲;思想方法層面是指大數據的全局化思想、并行化思想、分布式思想等能對狀態監測的系統架構、處理流程、通信協議等方面產生啟發性指導;大數據算法層面是指大數據自動化算法對電力設備狀態監測中的模式識別、故障預測等方面的提升[20]。
1.1大數據關鍵技術
大數據關鍵技術含數據集成管理技術、數據處理技術、數據分析技術、數據展現技術等[7],這些技術大多來源于大數據興起的互聯網與信息技術領域,經過最近幾年的發展,具備較高的成熟度和可移植性,因此將這些關鍵技術應用到電力設備狀態監測領域將會具有較強的生命力。大數據處理技術含分布式計算技術、內存計算技術、流處理技術等[7,9,21]。
這些技術能在較短的時間能完成PB級、ZB級海量數據的處理,可直接用于電力設備狀態監測海量原始數據的處理。大數據存儲技術含分布式文件管理技術、非關系型數據庫技術等。分布式文件管理技術一個典型的代表就是HDFS(HadoopDistributedFileSystem)[21]。HDFS是采用流式數據訪問模式來存儲超大文件的文件系統。非關系型數據庫一個典型的代表就是HBase。HBase是一個構建在HDFS之上的分布式面向列存儲的數據庫系統。大數據存儲技術適合數據量較大的電力設備狀態監測原始數據和特征參數的存儲[9]。
1.2大數據思想方法
大數據發展過程中形成的思想方法對電力設備狀態監測具有借鑒價值,這主要體現在全局化、分布式、并行化、低成本四個方面。
1.2.1全局化
大數據從整體而不是從個體的角度開展分析是其具有強大生命力的關鍵因素之一,因此大數據是全面的數據,從大樣本中發掘大價值是其核心思想,以解決“數據爆炸、知識匱乏”的短板[7-8]。文獻[22]用盲人摸象的寓言故事闡述了大數據的全局化思想,形象說明了小樣本分析方法如同盲人一樣只能認識龐大系統的局部特性而診斷出錯誤的結論。電力設備狀態監測具有龐大的對象和復雜的電氣物理連接,而現有的狀態監測系統大多從單個設備的單一監測參數開展監測與分析,容易造成誤診斷,因此將大數據的全局化思想應用到電力設備的監測與診斷分析上,從標準規范統一、系統整體設計、數據同步采集、數據全局分析等角度對現有的監測系統進行重新設計與改進,將在很大程度上提升電力設備狀態監測的可用性和價值性。
1.2.2分布式
大數據中普遍采用了分布式文件管理系統和分布式數據庫系統來開展原始數據和參數的存儲,以應對海量數據的挑戰,典型的案例有Apache基金會的Hadoop,Google的GFS(GoogleFileSystem)等[23-25]。GFS采用了分布式文件系統,在全球部署了超過200萬臺服務器,以應對每天數以億計的搜素請求和24PB級數據增長[24]。
由于電力設備在地理上的分散布置特性,因此電力設備狀態監測系統本身就具有分布式特性。這與大數據的分布式思想具有一定的相似性,但是又有本質的區別,例如Google的分布式文件管理系統雖然是分散布置,但是能聯合工作,在毫秒級的時間內給出綜合搜索結果,而電力設備在線監測系統大多沒有聯合工作的特性,例如某變電站的變壓器、GIS、電纜、避雷器的監測,雖然是分布式布置,但由于數據采集沒有做到時間上完全同步采集,不能開展綜合分析與診斷的高級功能,因此提升現有電力設備狀態監測系統各子系統之間的耦合關系,是大數據分布式思想在電力設備狀態監測上可能獲得應用的新方向。
1.2.3并行化MapReduce編程模式是大數據處理中普遍采用的方法,其實現原理在于通過Map將任務分解成小的模塊,發送給較多的節點并行計算,再通過Reduce將結果匯總,得到最終結果。其核心思想是“分而治之、移動邏輯、屏蔽底層、處理定制”[9]。
并行化的鼻祖可以追溯到曹沖稱象的故事,通過將無法稱量的大象分散為可以計量的石塊,用小工具并行處理,再將結果匯總,得到大數據的結果,就是典型的MapReduce思想。MapReduce的思想已經在電力設備在線監測中得到使用,并可以繼續發展,發揮其更為廣闊的內涵:狀態監測系統本身包含不同的監測子單元,例如變壓器在線監測系統包含局部放電、接地電流、微水、油色譜、溫度等不同的監測單元,這些單元聯合工作完成變壓器綜合監測就體現了Reduce的思想;在較多臺電力設備的在線監測中采用時分復用的思想,將監測單元的計算資源拆分使用,即為Map的思想;在線監測數據的數據處理,采用多線程技術,也是Map思想的應用。
在海量監測原始數據的處理中,將數據分割成較小的子模塊,發送給子單元處理,再將結果匯總,可大大減少計算時間,例如,各種電力設備在線監測單元本身就是一個高性能的處理子站,現在的電力設備綜合監測系統數據傳輸大多是單向的,即原始數據和指標量從現地子監測單元向總站傳輸,在未來的監測系統中,設計雙向數據高速傳輸通道,利用MapReduce思想將總站的海量數據發送到子站并行處理,是一個值得研究的方向。
1.2.4低成本
大數據獲得成功的另一個關鍵因素是采用了低成本的設計思想,例如Google、百度、Facebook等大型互聯網公司都沒有采用昂貴的超級計算機而采用了廉價的計算機組成的集群來存儲大數據,才能在互聯網大數據中獲得成功,因此低成本是大數據得以生存之本[9]。
電力設備狀態監測普遍存在監測系統成本過高的問題,部分電力設備狀態監測系統的成本達到了主電力設備成本的10%甚至更高,這是電力設備狀態監測沒有普及的重要原因之一,因此如何降低傳感器成本、現地監測單元成本、數據服務器成本、軟件成本、系統維護成本等,將狀態監測系統“平民化”是推廣狀態監測中的迫切問題。例如將昂貴的工業控制計算機用廉價的單片機和ASIC(ApplicationSpecificIntegratedCircuit)代替,是降低監測成本的一個有效途徑。
1.3大數據算法
大數據在發展過程中形成了一些優秀算法,其中與狀態監測匹配度較高的一個方向就是大數據預測算法。大數據預測算法一個最典型的應用就是IBM的第三代超級計算機Watson[25-26]:2011年在美國最受歡迎的電視問答類節目《危險邊緣》中,IBM的第三代超級計算機Watson采用大數據技術,打敗了人類兩位問答冠軍。Watson的技術實現了“讓機器像人一樣思考”,在幾秒鐘的時間內搜索海量的資料,給出預選的答案,并通過預測模型6次反復預測與評估,給出最終的答案。IBM的高管們認為Watson是代表了第三個計算機時代的第一臺機器,并譽其為人工智能的真正到來[21-22]。IBM正在為Watson申請美國的醫療執照,在不遠的將來即將應用到醫療領域,為廣大患者帶來福音。
基于海量病例庫、藥物報告、治愈方案、醫療期刊、病人歷史治療記錄、病人基因序列、病人化驗報告等數據源的大數據精準醫療,將會更加準確地預測出病人的病情走勢并給出科學合理的治療方案,這將帶來醫療領域的革命。電力設備狀態監測通過形式各異的傳感器獲取設備健康狀況與醫生通過化驗測試獲取病人病情有很強的相似性,因此借鑒Watson對海量數據的處理與預測方法,基于海量故障案例庫、設備臺賬信息、設備在線監測信息、設備歷史監測記錄、同類型號設備故障信息、電網工況信息等數據源,設計基于大數據的電力設備故障診斷與預測方案,有望為該領域帶來新的變革。
2基于大數據的電力設備狀態監測總體架構
基于大數據的電力設備狀態監測系統總體架構,主要包括電力設備在線監測系統、大數據數據源、大數據存儲、大數據處理、大數據分析、高級應用功能以及大數據展現等模塊。其主要思想是以電力設備狀態監測相關數據為數據源,利用大數據存儲技術、大數據處理技術以及大數據分析技術實現大數據在電力設備狀態監測領域的高級應用,并通過大數據展現技術對結果進行可視化展示。
除了設備在線監測數據之外,狀態監測大數據源還包括設備其他數據、故障數據、設備評價標準、其他數據源等。設備的其他數據包含監測歷史數據和設備臺賬等;故障數據包括故障錄波數據、海量故障案例庫等;其他數據源包含SCADA系統、WAMS系統、MIS系統等;設備的評價標準含國家標準、行業標準和企業標準等。狀態監測大數據通過大數據存儲技術和處理技術進行集成管理和數據處理。適用于狀態監測大數據的存儲技術既包含傳統的關系型數據庫,也包含非關系型數據庫和分布式文件。大數據處理技術可采用分布式計算技術、內存計算技術等。
存儲和計算技術是實現技術手段,其主要目的是通過大數據分析實現設備狀態評價、設備故障預測等高級應用功能。大數據分析技術含大數據知識挖掘、大數據模式識別、大數據預測等。該通用架構還包括大數據的展現模塊,將大數據預測及高級應用功能的結果通過互聯網、三維可視化模型、空間信息流等可視化技術向運行管理人員實時展示。該架構中的大數據存儲技術和處理技術可采用在互聯網和信息技術領域已發展得比較成熟的軟硬件方案,例如HDFS、HBase等。而數據采集、數據去噪、特征提取、模式識別、知識挖掘等環節則需要結合狀態監測的需求和特點,提升和完善傳統技術。本文將在下節對這些技術進行詳細闡述。
3基于大數據的電力設備狀態監測關鍵技術電力設備狀態監測的基本流程含數據采集、數據去噪、特征提取、模式識別、知識挖掘等環節。大數據技術、思想方法、自動化算法在各個環節都能得到結合與應用,這一方面是因為大數據技術本身能在海量數據的存儲、處理、展現上具有獨到的優勢,另一方面是因為大數據高級分析功能對各個環節提出了新的要求。
3.1面向大數據應用的數據采集技術由狀態監測參數含振動、擺度、溫度、濕度、壓力、局部放電、電流、電壓、微水、色譜、紅外、圖像、氣體含量等機械、物理、化學信號[12,27],這些信號通過傳感器變送成電壓或電流信號,并通過數據采集單元轉換成原始數據。原始數據的采集受傳感方式、采樣頻率、采樣時間間隔、觸發方式等多種因素的影響。大數據分析對這些因素提出了新的要求,其發展動向主要體現在以下幾個方面:
1)數據采集的標準化。大數據分析融合更多的數據源進行全面分析,然而現有的數據采集系統采用的標準各異,造成了數據融合困難,無法直接進行數據分析與知識挖掘。通常需要對這些數據進行預處理,增大了數據處理的難度,對于某些不同類型的數據,甚至無法操作。因此基于大數據的數據采集技術應使用統一的數據采集標準。
2)數據采集的同步化。大數據分析采用更為全面的數據進行橫向和縱向的對比分析,例如對一個包含變壓器、GIS、電力電纜的綜合監測系統進行數據分析,可以對比同一時刻信號的差異性開展綜合分析從而提高診斷的準確性,但是這要求這三個電力設備的狀態監測系統共用同一個GPS時鐘以實現數據采集的完全同步,因此數據采集的同步化是電力設備狀態監測開展大數據分析的一個重要的前提條件。
3)數據采集的高可靠性。大數據分析雖然可以開展多源異構數據的融合和異常數據檢測[10],但是低可靠性的數據采集系統獲取的數據,將加大后期數據處理的難度。現有的電力設備狀態監測系統由于傳感器異常、信號調理電路故障、數據采集硬件設備可靠性低、數據采集軟件缺陷等原因,存在數據采集異常終止造成數據缺失的情況,因此從質量監測與采購管理的角度提高數據采集的可靠性是提升狀態監測價值的一個重要途徑。4)數據記錄的全面性。大數據分析采用的數據源不僅有設備狀態監測數據,還需綜合考慮故障傳播耦合、故障發展趨勢、設備故障記錄、設備維護記錄等更加眾多的數據源,因此數據采集單元在存儲原始數據與指標量的時候必須同步記錄時間信息、設備信息、地理信息、參數設置等信息,使數據逐級上傳后不丟失關鍵信息,便于開展大數據分析與知識挖掘。
3.2面向大數據的數據去噪技術
設備故障信號與噪聲和干擾信號混在一起,大大降低了監測信號的可用性[27-30]。干擾信號的誤判斷會產生誤報警,降低運行管理人員對狀態監測系統的信賴;故障信號沒有準確提取會產生漏報警,帶來重大損失,因此數據去噪與干擾抑制是電力設備狀態監測領域的一個亟待突破的難題。數據去噪技術在電力設備狀態監測領域已經得到了蓬勃的發展,國內外的研究者已經將包括FFT去噪、小波去噪、自適應去噪、經驗模態分解等數學方法引入到設備故障信號的去噪中,部分方法獲得了較好的效果[28-30]。基于大數據的狀態監測數據去噪的發展動向主要體現在以下幾個方面:
1)分布式與集中式相結合。如果將電力設備狀態監測原始數據集成起來開展數據去噪,將需要昂貴的計算存儲資源和較大的計算代價。大數據的分布式思想可以應用到原始數據去噪,因為電力設備狀態監測系統現地監測單元一般采用具有較高運算速度的工業控制計算機作為運行控制核心,大量的現地監測單元分布在廣泛的地理空間,本身就是一個分布式計算系統,因此對監測數據中與故障信號頻段相差較大的噪聲與干擾信號在現地完成數字去噪,將大大降低后期集中處理的難度。
2)大數據干擾抑制技術。狀態監測信號的干擾源有白噪聲、隨機干擾、周期干擾、通信干擾、廣播干擾等。部分干擾信號與待提取的故障信號在頻段上有較多重疊部分,例如電力電子技術在電力設備上的大規模使用使得可控硅信號成為一個重要的干擾源。通過大數據技術建立典型干擾信號的特征參數庫,在運行控制中樞開發基于海量樣本庫的干擾信號抑制技術,將有效識別傳統的去噪技術無法剔除的干擾信號。
3)綜合分析與判斷。位置臨近的電力設備具有較強的電氣物理連接,這使得同一故障信號在不同的電力設備狀態監測系統中都能檢測到,從而造成誤診,因此在更高的層面開展綜合分析與判斷,可以進一步剔除臨近電力設備耦合進來的干擾信號,減少誤診斷。
4基于大數據的綜合監測與分析系統應用案例
本節通過典型的具有電氣和物理連接的變壓器、GIS、電纜綜合監測系統案例闡述大數據在電力設備狀態監測上的應用前景。系統中的GIS和變壓器通過三相高壓電纜連接,高壓電纜中間有兩個中間接頭。綜合檢測系統分為三層:即現地層、站控層和中樞層。現地層包含三個設備的現地監測單元,實現對16個監測參數的實時數據采集、數據去噪、特征提取。現地層三個監測單元通過同一個GPS時鐘實現數據采集的同步。
站控層一方面實現對實時監測數據的集成管理,另一方面通過大數據存儲技術實現變電站SCADA系統數據、設備評價標準、設備臺賬信息、設備監測歷史數據的匯總,以此為基礎并融合大數據思想方法,實現多源數據融合分析判斷、專項參數對比分析判斷、設備狀態實時精確評價等大數據高級分析功能。
5總結
本文探討了電力設備狀態監測數據的大數據特征并從大數據技術、大數據思想方法、大數據算法三個層面分析了大數據與電力設備狀態監測的結合點,給出了一個具有通用性的電力設備狀態監測大數據平臺架構,對電力企業狀態監測系統的搭建具有參考價值。同時本文從數據去噪、特征提取、模式識別、知識挖掘、數據存儲、數據可視化深入分析和展望了大數據與電力設備狀態監測各個環節的結合點。這些結合點一方面是因為大數據技術、大數據思想方法、大數據算法在狀態監測各個環節具有獨到優勢,另一方面是因為大數據高級分析應用對這些環節提出了新需求。最后結合一個包含變壓器、GIS、電纜的綜合監測系統,深入分析了電力設備狀態監測大數據應用前景。
基于大數據的電力設備狀態監測既需要理論支撐又需要大數據工程的檢驗,而大數據樣本的獲取是制約其發展的瓶頸。本文雖然從整體理論框架和實現細節探討了大數據在電力設備狀態監測上的應用方向與前景,并給出了分析案例,但是沒有與具體大數據工程的結合是本文的不足之處,需要進一步研究和完善。大數據在電力設備狀態監測上的深入應用將提高電力設備狀態評價和故障診斷的準確性。可以預見,通過大數據樣本、大數據軟硬件技術、大數據思想方法、大數據算法建立電力設備狀態評價與故障診斷醫院,實現對電力設備疑難雜癥的科學診斷,將引領行業發展、推動行業變革,促進綠色、自愈、安全、高效的堅強智能電網建設。
參考文獻
[1]PENGXiaosheng,YANGFan,WANGGanjun,etal.Aconvolutionalneuralnetwork-baseddeeplearningmethodologyforrecognitionofpartialdischargepatternsfromhigh-voltagecables[J].IEEETransactionsonPowerDelivery,2019,34(4):1460-1469.
[2]汪可,廖瑞金,吳高林,等.采用雙向改進模糊2DLDA算法提升多因素影響的局部放電識別可靠性[J].電工技術學報,2014,29(11):210-220.WANGKe,LIAORuijin,WUGaolin,etal.Improvementofpartialdischargerecognitionreliabilityconsideringinfluenceofmulti-factorsbasedontwo-directionalmodifiedfuzzy2DLDAalgorithm[J].TransactionsofChinaElectrotechnicalSociety,2014,29(11):210-220.
[3]張鐿議,廖瑞金,楊麗君,等.基于云理論的電力變壓器絕緣狀態評估方法[J].電工技術學報,2012,27(5):13-20.ZHANGYiyi,LIAORuijin,YANGLijun,etal.Anassessmentmethodforinsulationconditionofpowertransformerbaseduponcloudmodel[J].TransactionsofChinaElectrotechnicalSociety,2012,27(5):13-20.
[4]PENGXiaosheng,LIJinshu,WANGGanjun,etal.RandomforestbasedoptimalfeatureselectionforpartialdischargepatternrecognitioninHVcables[J].IEEETransactionsonPowerDelivery,2019,34(4):1715-1724.
作者:方靜1,彭小圣2,劉泰蔚2,陳玉竹2,李文澤2,文勁宇2,熊磊3,王浩鳴4
轉載請注明來自發表學術論文網:http://www.zpfmc.com/jjlw/28356.html