您的当前位置:首页正文

基于PaaS的自动化运维平台研究与设计

2020-12-12 来源:客趣旅游网
 2019年10月25日第36卷第10期Telecom Power TechnologyOct.  25,2019,Vol. 36 No. 10 doi:10.19399/j.cnki.tpt.2019.10.013研制开发基于PaaS的自动化运维平台研究与设计邓惠贤1,彭 建1,尚闻博2(1.国网信通亿力科技有限责任公司,福建 福州 350001;2.国网甘肃省电力公司信息通信公司,甘肃 兰州 730050)摘要:随着云计算时代的到来和电力行业信息化的快速发展,信息系统在电力行业生产经营管理中的作用日益深化。运维对象和边界不断拓展,运维管理日趋复杂,运维量增长迅猛,运维要求不断提高,传统人工运维方式无法满足信息化快速发展要求。每个系统拥有相应资源,导致资源浪费,因此需要充分整合资源,不断提高资源利用率与集约度。各系统之间的关联度比较强,集成关系呈现复杂化,有助于简化系统的整体结构,并促进运行效率的提升。对目前运维管理系统的现状及存在问题进行分析,提出了基于PaaS的自动化运维平台的解决方案,确保电力行业信息系统的良好运行和合理投资效益。重点分析了电力行业实施PaaS的背景及意义,探索建立PaaS的自动化运维平台的设计原则。关键词:云计算;信息系统;PaaS;自动化运维Research and Design of Automatic Operation and Maintenance Platform Based on PaaSDENG Hui-xian1,PENG Jian1,SHANG Wen-bo2(1.State Grid Info-Telecom Great Power Science and Technology CO.,Ltd.,Fuzhou 350001,China; 2.State Grid Gansu Information&Telecommunication Company,Lanzhou 730050,China)Abstract:With the advent of the era of cloud computing and the rapid development of power industry informatization,information system in electric power industry deepening in the role of production and operation management,operational object and boundary expanding,increasingly complex operations management,operational quantity is growing rapidly,and constantly improve the operational requirements,people under d traditional way cannot satisfy the rapid development of informatization requirements. Each system has corresponding resources to lead to waste of resources,so it is necessary to fully integrate resources and constantly improve the utilization rate and intensity of resources. The correlation between the systems is strong and the integration relationship is complicated,which is helpful to simplify the overall structure of the system and promote the improvement of operating efficiency. Through the analysis of the current status and existing problems of the operation and maintenance management system,the solution of the automatic operation and maintenance platform based on PaaS is proposed to ensure the good operation and reasonable investment benefit of the information system in the power industry. This paper focuses on the analysis of the background and significance of PaaS implementation in the power industry,and explores the design principles of PaaS automatic operation and maintenance platform.Key words:cloud computing;information systems;the PaaS;automatic operation and maintenance1 实施PaaS的自动化运维平台的背景及意义励电力行业各单位根据自身运维需求开展自动化巡检、云计算是现阶段比较流行的一种商业计算模型,合规性检查、自动化部署、资源自动化分配及一键重计算机系统中分布着大量的计算任务,各个系统可以启等自动化运维支撑工具建设工作。电力行业对各单结合自身的需求进行计算力分析、存储空间优化,并位未来三年面向作业层面的运维工具建设提出了更高提供多样性软件服务。随着云计算的不断发展,信息要求。目前,通过管理平台和SG-ITOM3.0的建设,系统的基础设施变得更加完善,特别是在交付模式、已经建立了较为全面的运维管控体系,实现了对基础使用模式方面,根据网络模式可以实现按需分配,具设施和业务系统的监控管理,但面向作业的运维自动有很强的扩展性。云计算中主要包括三层的基本服务化水平还有待提升,传统依托脚本或者针对某个具体模式,分别为软件、平台及基础设施。软件作为云计运维场景进行成熟软件采购的运维自动化建设模式已算中相对成熟与完善的服务,在互联网技术的指导下,经无法满足当前不断提升的运维精益化要求、新技术可以为用户提供一些特殊应用程序及软件服务方式。应用日益广泛的新需求。因此,开展敏捷化交付运维1.1 实施PaaS的自动化运维平台的背景管理工具系统建设,以“强化安全、注重实用”为原则,为提升信息通信运维服务质量,“十三五”信息逐步实现网络层、平台层、应用层及终端层等多层面化规划中提出全面开展信息通信系统自动化运维建设,运维对象自动化操作,促进运维工作从传统模式向自于2016年启动运维自动化顶层设计,并在此基础上鼓动化模式有序平滑过渡已经成为电力行业进一步提升信息通信运行保障能力的迫切需要。1.2 实施PaaS的自动化运维平台的必要性收稿日期:2019-07-04目前,运维工作中存在8个问题。(1)传统人工作者简介:邓惠贤(1987-),男,福建福州人,本科,工程师,运维方式无法满足信息化快速发展要求。目前的信息主要研究方向为信息运维;彭 建(1987-),男,仡佬族,贵州遵义人,本科,工程师,系统运维人机比率不均衡,运行人员压力沉重,传统主要研究方向为信息与计算科学;的手工安装部署系统和人工对设备监控、操作的工作尚闻博(1991-),男,甘肃定西人,研究生,工程师,主要模式已经无法满足现在信息系统快速部署和高效运行研究方向为信息安全。的需要。(2)基础硬件老旧,故障频发,为信息系统· 34 ·邓惠贤,等:基于PaaS的自动化 Telecom Power Technology 2019年10月25日第36卷第10期运维平台研究与设计Oct.  25,2019,Vol. 36 No. 10 稳定运行带来极大风险。(3)运维管理效率有待提高。能力层(aPaaS)可提供实际能力的业务价值。日常运维管理工作模式基本采用人工加Excel的方式进流量调度的接入模块(在两个相关的PaaS层之上)行处理。资源管理、人员管理、厂商评价、2+1及端包括流控、路由、降级、灰度、聚合及串联等,还包口治理等常规和专项工作耗费大量人力,因人员疏漏括最新的AWS Lambda Service的小函数。该模块的部造成的工作返工问题频发。(4)基础资源监控分散。署应该与CDN相同[1]。电力行业已完成各层级监控系统建设,并且普遍得到完整的PaaS平台会包括如下5个部分。了应用。但目前信息的采集各自独立,信息管理分散,(1)PaaS调度层。PaaS的自动化和分布式对于缺少全链条监控和运行日志大数据分析,无法全面了高可用、高性能的管理。解系统健康水平。(5)基础平台标准化率不高。按照(2)PaaS能力服务层。PaaS真正提供给用户的基础软硬件版本升级和标准化工艺专项工作安排,电服务和能力。力行业已逐步开展基础平台标准化治理,操作系统、(3)PaaS的流量调度。与流量调度相关,包括中间件及数据库版本基本达到标准化。但仅完成版本对高并发的管理。标准化,无法支撑自动化工具的大范围应用,需进一(4)PaaS的运营管理。软件资源库、软件接入、步推动全平台的标准化,包括软件版本、安装路径及认证和开放平台门户。软件配置等。(6)自动化工具实施难度大。目前,已(5)PaaS的运维管理。与DevOps相关。建和在建的主要自动化工具有自动化巡检、自动化部3.2 创建PaaS平台运行维护模型的设计原则署、合规性检查及一键启停的功能,但由于基础平台第一,先进性。根据全球IT管理业界提出来的标准化率不高、系统台账不共享及操作风险不可控等指导性框架ITIL(Information Technical Infrastructure 因素,工具实施难度大,进度缓慢。(7)微工具未有Library)V3.0基本管理体系,规范电力行业信息化系效整合。随着运维水平的不断提高,各重要信息系统统运维管理工作,要求电力企业各个部门积极应用科运维效率也依托自主研发的小工具、小应用逐步提高。学、规范的IT管理技术,并形成一流的安全管理模式此类微工具具有专用性强、兼容性弱的特点,未形成及服务模式[2]。通用自动化工具集。(8)电力行业统一建设大数据平台、第二,实用性。根据电力行业的实际发展情况,全业务数据中心,大数据部分关键技术取得突破,但优化运营体系,以满足管理需求。通过实时的动态监控、整体效果还有待提高,如全业务数据中心的运行效率、检测业务基本能力、实施巡检自动化操作、完成操作适用性、数据质量及数据管理等方面仍需进一步完善调度及安全管理等,充分实现系统的功能。在此基本提升。工作中渗透服务管理模式,可以在系统的一切信息化为尽快提升全网范围内IT运营的服务保障能力,操作中形成统一的管理、监控及维护,对促进电力行电力行业有必要借鉴业界先进的IT运维服务管理理念,业的信息化发展具有重要意义,并对提高平台的运营建立以客户为导向的IT运维管理体系,实现对相关IT管理效率产生积极的效果。系统的综合集中管理。自动化运维管理是一种以客户第三,高效性。各个层面中,运维部门相关用户和业务为中心的管理方法,以业界公认的ITIL最佳实通过对自动化的运维管理平台的应用,可以更好地进践作为指导规范。自动化运维管理既面向资源和应用,行故障预警,并对故障进行迅速定位,便于及时了解又面向各种人员,是集合人员、流程和工具的三位一故障系统的运行情况。此外,通过系统应用可以进行体的系统。其中,人员是管理的主体,流程是运行规范,快速的工单处理、帮助寻求及运营情况分析等。通过工具是流程运行的载体。本着三位一体的思想,IT运多种功能的发挥和利用,提高解决故障的效率,并尽维服务管理体系将作为IT的重要项目进行长期建设,可能减少系统故障导致的损失,便于优化运维系统的为规范IT日常管理工作、提高IT人员工作效率及切基本流程,对充分提升工作效率与管理水平具有重要实提高IT服务质量打下良好的基础。的价值。2 PaaS平台的主要内容第四,扩展性。在管理及业务的不断发展下,自动化的运维管理系统因具备灵活、迅速的配置方式,拓展PaaS平台的特征为分布式、服务化、自动化部署、了其管理范围,在整个电力行业信息化系统中得以广泛高可用、敏捷以及分层开放,并可与IaaS实现良好地应用,实现了对全网的统一监控、统一维护及统一管理。联动。根据相关报道,该系统已经渗透到电力行业信息化管理PaaS的本质是服务化。软件模块重用、服务治理的各个环节,并发挥着重要的作用,对重新优化系统功及对外提供能力是PaaS的本质。能、实现系统科学配置有着重要的意义[3]。PaaS的根本特性是分布式。多租户隔离、高可用第五,规范性。推广自动化的运维管理平台的过及服务编排是PaaS的基本特性。程中,需要严格采取关键指标,并在关键流程的指导PaaS的灵魂是自动化。自动化部署安装运维、自下统一关键功能,要尽可能满足全国统一的基本要求;动化伸缩调度是PaaS的关键。结合各地的基本情况,积极完善相关指标体系;在服3 PaaS自动化运维平台的设计务管理模式中进行科学地细化,不断规范运营管理体系,提高系统运行的科学性与规范性。3.1 PaaS平台的整体架构第六,安全性。在自动化的运维管理平台构建中,调度层(iPaaS)是管理和运维能力层。要不影响基本系统的功能,并确保业务系统得以顺利· 35 · 2019年10月25日第36卷第10期Telecom Power TechnologyOct.  25,2019,Vol. 36 No. 10 运行。这是进行系统管理与建设的重要原则,也是最实际使用者根据自身使用需求提出并建设;发挥多方基本的前提条件。积极性,各取所长[4]。第七,合规性。在自动化的运维管理平台建设方面,要充分考虑到我国电力行业的发展要求与相关标5 结 论准,了解各级管理条例,结合电力行业发展的实际要求,本文分析了目前运维管理系统的现状及存在的问加强对相关信息系统的控制,通过实施科学的审计工题,提出了基于PaaS的自动化运维平台的解决方案,作来满足该原则。对于任何一个系统的建设与应用,重点分析了电力行业实施PaaS的背景及意义,探索建都需要充分考虑到行业基本发展要求,必须要在合规立PaaS的自动化运维平台的设计原则。基础上进行工作。参考文献:4 利用PaaS平台展开高效运维的展望[1] 李 卫,李济汉,张云勇,等.电信运营商云计算体系随着运维规模的扩大,运维工具数量、种类也大架构思考[J].电信科学,2013,(3):123-127.幅增加,运维工具本身的管理成为必须面对的问题,[2] 朱志良,苑海涛,宋 杰,等.SOA与云计算:竞争还需要统一集中的运维平台支撑。PaaS平台具备广泛的是融合[J].计算机科学,2011,(12):6-11.兼容性,可纳管全面的IT设备和系统;具备与现有运[3] 罗军舟,金嘉晖,宋爱波,等.云计算:体系架构与关维工具集成的能力,对过往投资保护;可灵活扩展到键技术[J].通信学报,2011,(7):3-21.更多运维场景,而不增加平台维护成本;具备向数据化、[4] 屠要峰,黄震江,陈心哲.SD PaaS云平台架构及其关智能化演进的可能性,满足长期建设要求;场景可由键技术研究[J].中兴通讯技术,2012,18(6):52-55.(上接第33页)现场核查处理流程如图2所示[1],不同于过去“检力物力,实现了系统建设预期目标。有效提升试点供查人员提前准备资料→现场对比→手工标注错误→手电局数据整改工作效率,提高数据质量水平,下一步工整改数据→返回现场核对”的核查过程,通过移动将按计划推广到全省应用。应用,实现一拍即核查,解决了核查工作繁琐、消耗基于图像识别技术的数据核查系统目前实现了与人力时间的问题,更有效地提升了整改数据的准确性。生产管理系统、营销管理系统的基础数据实时核查、整改,避免了人工核查的时间、费用成本,提高了数据的完整性、准确性、规范性。后续系统扩展中将进一步扩展核查范围,如人资业务域、物资业务域等,增加员工信息、物资合同及仓储资产等基础数据的图像识别、参数结构化处理功能,进一步支撑云南电网公司数据认责工作,促进公司数据质量提升。图2 现场核查处理流程5.3.2 后台批量核查方式系统还提供PC端应用,支持批量上传图片,对收集的图片信息完成图像识别后进行参数获取和核查对比操作,适用于已有设备图片、工作现场无法使用移动设备及不能及时上传采集图片等情况,实现后台批量处理[2]。通过PC端系统的应用,对于已有完善资料的设备,图3 后台批量核查处理流程工作人员就无需再抵达现场采集信息,可更加便捷地完成数据核查,并在此基础上实现自动生成新设备台7 结 论账数据。新设备投产时,减少了人工录入的工作量,在数据源头就避免了因人员录入错误而造成的数据质本文主要介绍了图像识别技术在云南电网数据认量问题。后台批量核查处理流程如图3所示。责中的研究与应用,以供参考。6 系统应用效果及扩展性参考文献:[1] 李 蕗.治理基础数据 完善核查体系——国网江西电力基于图像识别技术的数据核查系统已完成在云南提升电网营配调基础数据质量[J].江西电力,2017,电网公司的部署,目前已在试点供电局应用。通过系(11):34-35.统的应用,基层一线员工在现场操作、日常巡检工作中,[2] 叶荣伟,康 乾,黄一鸣.面向大数据的安全配置核查实现一拍即核查、一查即整改的效果,改善了过去检工具研究与实现[J].电信工程技术与标准化,2017,(8):查专家多、耗时久及检查范围受限的情况,节省了人37-41.· 36 ·

因篇幅问题不能全部显示,请点此查看更多更全内容