4月29日,山東電力信通公司調度運行中心的信息調度值班員桑林發現一條系統黃色告警信息,馬上通過數字監控工具定位故障,發現有一臺服務器的磁盤損壞。他快速指揮相應責任人進行維護。1小時內,損壞的磁盤更換完成,告警隨即解除。
1~4月,面對北京冬奧會、冬殘奧會和全國兩會等重大活動電力保障任務,以及電網春檢、疫情防控等重點工作,國網山東省電力公司提前部署、主動作為,實施信息系統穩定運行保障新舉措,強化工具、技術、人員支撐,提升系統運行、調度監控、應急處置三方面能力,確保山東電網信息系統安全穩定運行。
要做到有效預防信息系統故障,提前發現故障隱患十分重要。國網山東電力建立了橫向到邊、縱向到底的雙維度巡檢機制。“橫向巡檢”對各業務操作系統、中間件和數據庫等基礎軟件開展統一管控監測,并在此基礎上開展有針對性的專業技術巡檢和性能優化,及時整改基礎軟件安全漏洞和隱患。“縱向巡檢”即按照系統物理架構和邏輯架構,深度開展漏洞掃描、代碼滲透測試,從細節上嚴格把控對外開放接口的安全。
“基礎軟件和對外開放接口是信息系統的故障多發點。對此,我們重點加強對重要系統、薄弱環節的運維保障,開展雙維度巡檢。”國網山東電力互聯網部建設管理專責徐康說,該公司在北京冬奧會、冬殘奧會電力保障期間,面向全專業信息系統開展雙維度巡檢4590次,整改隱患102項,優化數據庫備份149套,重點加強對應急指揮系統等重要系統的保障工作,實現了業務系統安全穩定運行。
加強調度監控的全面性和及時性對于增強系統運行穩定性來說同樣重要。國網山東電力創新采用流程機器人、人工智能等數字化技術,推進信息通信調度指揮、調度監控、檢修作業等工作的智能替代,實現對內外網全部邊界、系統、設備的監測,確保調度監控有點有面、由點及面,系統運行監視“無死角”。
從2021年開始,國網山東電力開發具備“智慧大腦、敏銳眼睛、安全雙手”的“數字值班員”。“數字值班員”投入應用后,每天自動統計前一日的電網信息系統運行中出現的缺陷故障,發布調度運行早報。根據“數字值班員”的運維值班結果,管理人員能夠有針對性地提出相應系統缺陷的整改意見,補齊電網信息系統運行的短板。
“‘數字值班員’自動運行、不易出錯,又可以24小時工作,符合信息業務調度工作的需求,也是我們之后業務開發的重點方向。”徐康說,在北京冬奧會、冬殘奧會電力保障期間,“數字值班員”自動監控信息系統運行情況1.4萬余次,匯總上報各類報告信息1700余次,節省了大量人工成本,在確保了信息系統調度監控工作準確性的同時促進基層減負。
調度監控的智能化進程推動了信息系統運行實時監控效率的提升,但是要確保及時處置發現的問題,還需要一支召之即來、來之能戰的應急處置隊伍。為此,國網山東電力提出“專人專班”,選拔互聯網專業骨干組建了系統運行保障專班,形成了柔性保障團隊和貫通省、市、縣級單位的三級指揮機制,實現了對信息調度、運行、檢修、客服、網絡安全等系統管理各分支專業的高度協同指揮。
每次開展信息系統特巡,系統運行保障專班都會逐一核查關鍵信息系統的運行方式,確保各類設備、組件、節點均設置了冗余備份策略,及時甄別可能存在的薄弱環節,同時有針對性地優化現有應急預案、完善相應規程,確保故障情況下操作有章可循。
國網山東電力聚焦突發事件應急響應能力,強化實戰演練,快速提升保障團隊綜合素質。北京冬奧會、冬殘奧會電力保障期間,該公司開展3輪次實戰演練,優化應急預案23套,儲備保障設備102臺,應急措施保障到位。4月下旬,針對疫情防控期間部分員工居家辦公需求,該公司組建專項攻關團隊,兩天內完成云文檔代碼研發,優化居家辦公服務系統,滿足員工居家辦公的內外網文件共享服務需求和突發移動應用硬件需求,同時開展信息系統24小時深度運維,保障員工居家辦公期間正常開展工作。(韓興旺 任曉文)
評論