ChinaUnicomInnovation5G时代云化网络运维转型探讨
联通创新
5G时代云化网络运维转型探讨
DiscussiononTransformationofCloudNetworkOperation
andMaintenancein5GEra
袁
林1,蔡
超2,黄庠奇2(1.中国联通重庆分公司,重庆401121;2.中国联通网络技术研究院,北京100048)
YuanLin1,CaiChao2,HuangXiangqi2(1.ChinaUnicomChongqingBranch,Chongqing401121,China;2.ChinaUnicomNetworkTech⁃
nologyResearchInstitute,Beijing100048,China)
摘要:关键词:
5G;NFV;云化网络运维;运维转型;ICT融合doi:10.12045/j.issn.1007-3043.2019.12.003文章编号:1007-3043(2019)12-0012-05中图分类号:TN914文献标识码:A
开放科学(资源服务)标识码(OSID):
当前伴随着NFV和SDN技术的发展和成熟,通信行业逐步向ICT融合的AllCloud时代过渡。5G标准的确定以及云化核心网的商用,使网络运维面临更加复杂的运维环境:节点数量增加、跨层运维、多厂家管理、缺乏统一的运维工具等。从NFV网络运维转型交流关注的问题出发,探讨在NFV模式下如何选择最适合的运维转型方案,包括组织、技能、工具平台等。
Abstract:
WiththedevelopmentandmaturityofNFVandSDNtechnology,thetelecommunicationindustryisgraduallytransitingtotheAllClouderaofICTintegration.Withthedeterminationof5Gstandardandthecommercialuseofcloudcorenetwork,networkoperationandmaintenance(O&M)willfaceamorecomplexenvironment,suchasincreasingnumberofnetworknodes,cross-layerO&M,multi-vendormanagementandlackofunifiedO&Mtools,etc.FocusedontheissuesofNFVnetworkO&Mtransformation,itdiscusseshowtochoosethemostsuitableO&MtransformationschemeunderNFVtechnology,in-cludingorganization,skills,toolplatformandsoon.
Keywords:
5G;NFV;CloudnetworkO&M;O&Mtransformation;ICTintegration
引用格式:袁林,蔡超,黄庠奇.5G时代云化网络运维转型探讨[J].邮电设计技术,2019(12):12-16.
1概述
随着2019年6月6日5G商用牌照的正式发放,我国进入5G商用阶段。5G时代使用的无线频率高,相比4G时代单个基站的覆盖减小,为了满足覆盖需求,基站将会非常密集,网元数几倍乃至几十倍的增量为运营商的运维工作带来了巨大的挑战,相比4G时代网络复杂性提升了一个数量级。另一方面,5G时代带来的不仅仅是网络架构的变化,更是业务形态的变化。——————————
收稿日期:2019-09-18
使能各种差异化的新业务,包括高清视频、车联网、工业物联网等,成为垂直行业数字化转型的利器和未来万物互联数字社会的基石。
面对网络全云化,控制面、用户面分离的分布式网络架构演进,网络运维在5G时代会面临较大的挑战,电信运营商需要通过运维转型来提升网络运维效率,降低网络运维成本。
5G时代云网络运维的对象从传统的专用设备转NFV网络的3层架构包括上层的VNF层,功能与
5G通过灵活的网络切片渗透到网络社会的各个角落,
变成基于NFV的分层网元。图1简单地描述了NFV的分层结构。
传统的CT网元功能一样;中间层的CloudOS,实现向
12
2019/12/DTPT
袁林,蔡超,黄庠奇联通创新
5G时代云化网络运维转型探讨ChinaUnicomInnovation
传统CT网络SRCEPCIMSOSOSOSASOSSRCNFV网络EPC上提供基础资源,向下管理通用硬件;下层的通用硬
ASIMS件层,包括物理的计算、存储和网络资源。
OpeninterfaceCloudOSOpeninterface通用硬件其中“完全解耦”是NFV发展的方向和业界趋势,运营
NFV的各层之间是解耦的,解耦方式如图2所示。
商可以摆脱对个别厂家的依赖,降低网络建设成本。“完全解耦”部署和维护较复杂,但资源可以做到统一管理和调度,其最根本特征是各层间使用标准接口,但当前协议和标准进展缓慢。
③硬件独立厂家A网元网元网元网元厂家B硬件资源池★★★★★★集成难度较低交付效率高预集成工作量小难度中,效率低多厂家协同恢复/定位较好,云平台可针对业务做优化CloudOS④完全解耦厂家A网元网元网元网元厂家BCloudOS厂家C硬件资源池★★★★★★★集成难度高交付效率低预集成工作量大难度高,效率低多厂家协同恢复/定位一般,无优化硬件硬件硬件硬件图1传统CT设备与NFV分层结构对比
①单厂家厂家A网元网元网元网元CloudOS硬件资源池②共享资源池厂家A网元网元网元网元厂家BCloudOS硬件资源池★★★★★★集成难度较低交付效率高预集成工作量大方案分层方式集成难度故障定位资源利用率★★★★★集成难度低交付效率高不需集成验证难度低,效率高最好,针对业务和硬件做特定优化难度中,效率低多厂家协同恢复/定位较好,云平台可针对硬件做优化图2NFV分层架构下解耦方式对比
面临NFV分层解耦的场景,传统的核心网工程师难以独立运维如此复杂的系统,所以运维转型就成为运营商要探讨的一个重要课题。
队来负责管理(此种情况就要面临如何协同管理VNF和NFVI的问题)。
从NFV长期发展的角度来看,分层运维是一个大的趋势。将NFV运维团队分为业务管理、运行维护团队、基础设施管理和运维团队,人员分工和技能更为聚焦和专业,能力继承性好,维护效率更高(见图4)。
随着云化技术的发展,未来NFV的私有云需要满足电信5个9的可靠性要求。作为VNF运维工程师,需要关注上层业务的快速部署和故障处理,而不必关心下层使用的CloudOS是FS、RedhatOpenstack或者是Vmware。当业务出现故障的时候,VNF工程师很容易通过上下层系统接口的状态监控来判断是否是下层出现了问题,快速通知NFVI团队进行问题处理。而对于专业的NFVI运维工程师来说,只需专注于CloudOS和硬件资源的运维,确保可以为上层业务提云统一运维,随着云规模快速扩大,I层的运维效率也会得到很大提高,甚至可向互联网厂商进一步看齐。2.2技能融合与人员融合
在网络云化场景下增加了NFVI的运维,会要求维护团队要有具备I层运维能力的工程师,即经常提
邮电设计技术/2019/12
2运维转型的分析与探讨
围绕5G时代云化网络运维转型,下面将从业务与基础设施分层运维、维护团队人员融合、集中监控以及自动化智能化运维4个方面进行分析和探讨。2.1统一运维VS分层运维
如图3所示,当前的运维模式有3种:统一运维、分层运维和统一管理、分层运维管理。
在运营商云化转型初始阶段,对于少量NFV新建或者替换场景,由于NFVI运维工作量较小而不必要设置专职的I层工程师,如果没有相应的规划,运营商通常会选择模式1,由传统的核心网工程师掌握NFVI的技能,统一负责VNF和NFVI的运维。
对于云化部署模式,因为NFVI运维工作量增加,需要有专职的NFVI运维工程师来负责这部分的运维工作,而VNF运维依旧由传统的核心网工程师来负责,即分层运维。但是在管理层面,可以选择由核心网统一负责问题和变更的管理,或者分别由各自的团
供充足可靠的资源,在这种情况下可做到电信云和IT
13
袁林,蔡超,黄庠奇
ChinaUnicomInnovation5G时代云化网络运维转型探讨
联通创新
模式①:统一运维管理•客户类型:对ICT转型没有规划,现网设备更新换代驱动NFV部署•NFV部署模式:Silo模式,设备在核心网机房,统一采购•面临问题:客户CT监控人员和核心网工程师需融合NFVI技能√CT统一监控VNF和NFVI√核心网统一负责VNF和NFVI的日常维护模式②:分层运维,统一管理•客户类型:对ICT转型有认识但不清晰,自身能力较弱•NFV部署模式:云化模式,有共部署需求,NFVI在IT机房(或者与核心网机房在一起),不接受采购模式限制•面临问题:客户CT监控人员和核心网工程师需融合NFVI技能;CT/IT团队存在功能重叠VNF√CT监控VNF√核心网负责VNF日常维护√IT监控NFVI√IT负责NFVI的日常维护模式③:分层运维管理•客户类型:对ICT转型有明确的路标规划,按规划控制NFV商用节奏•NFV部署模式:云化模式,有共部署需求,NFVI纳入ITDC管理,分层采购•面临问题:如何协同管理VNF和NFVIVNF√CT监控VNF√核心网负责VNF运维√IT监控NFVI√IT负责NFVI的日常维护VNFvEPCvIMSvEPCvIMSvEPCvIMSNFVICloudOSNFVICloudOSNFVICloudOS硬件(COTS/存储/网络设备)硬件(COTS/存储/网络设备)硬件(COTS/存储/网络设备)核心网负责统一监控与维护核心网与IT分层监控与维护,但问题、变更等业务管理由核心网统一负责核心网与IT分层监控与维护图3当前可见的3种运维模式
当前运维模式
IMSPCRFEPCCPEBRAS
NFV运维模式
业务1NE1
NE2
业务1NE1云平台硬件
NE2
业务团队&运维团队1,2,3,…基础设施管理&运维团队
云平台软件
图4NFV分层运维模式转变
到的ICT融合。按照当前的情况,运营商面临要求每个工程师进行相应的ICT技能融合,还是把CT工程师和IT工程师进行人员的融合的问题。
先讨论技能融合。当前NFV主要应用还是核心网场景,核心网按照业务可以分为CS和PS,CS业务包含固网NGN、移动核心网CS、IMS等,PS业务包含程师一般都是CS和PS分开设立的。CT和IT相比,二USN、UGW、IGW、HSS等。目前负责核心网运维的工者之间的差别比较大,在当前情况下要求一个核心网工程师去熟练掌握NFVI的运维是非常困难的。如果在NFV运维场景下,要求核心网工程师去掌握NFVI的运维技能,基本上就是要求其具备5级工程师的技能水平。从运维成本和效率的角度来看,这种融合的方式并不是最优的方案。
再看人员融合的方案,按照NFV的分层解耦,上层的VNF和之前传统核心网网元的功能一样,这部分的运维仍然由传统的核心网工程师来负责;下层NFVI的运维是新引入的,同IT产品运维相似,运维就由专
职的IT工程师来负责。这种情况对当前工程师来说转型的难度较小,但是在遇到跨层问题的时候,如果VNF层和NFVI工程师互相不了解,就会带来故障难以定界的问题,这时候就还是需要有融合VNF和NFVI技能的专家工程师来协助解决故障。
所以,综合起来看,VNF和NFVI人员的融合是比
较适合的方案,可以保持较高的运维效率;同时依然需要高级别工程师在技能上也做到VNF和NFVI的融合。
对于传统核心网工程师,图5描述了建议的专业技能融合方向。
对于有志于向ICT运维专家发展的工程师来说,图6中包含的四大领域6个能力模块都是需要学习和发展的。
2.3分层监控与集中监控
在运维活动中,告警、性能和日志的监控处理是非常重要的日常活动。在NFV分层解耦的场景,每一层都有独立的监控工具。例如华为的产品,VNF层使
14
2019/12/DTPT
袁林,蔡超,黄庠奇联通创新
5G时代云化网络运维转型探讨ChinaUnicomInnovation
未来3~5年IMSIMSPSCSCSVoLTE网络业务运维能力深化,IT斤发育融合IMS&VoLTECS主要融合方向CS专业➝IMS&VoLTEPS专业➝IP未来5~10年CaaS,能力开放大数据分析自动化运维IoT某运营商省核心网维护人员数量(含区县)IMS∶PS∶CS≈1∶2∶5PS/EPCMBB技能深化InfrastructureIP融合核心网专业间:跨专业融合新引入CSIMS&EPC&SVoLTEDN/IPInfrastructure传统网络及云化网络业务/IT设施运维图5传统核心网工程师专业技能融合方向
建立开放的数字生态环境数字化业务敏捷开发与运营能力•数字化业务敏捷开发和运营能力•公有云、政企云运营和销售能力使能平台应用与维护能力•BSS运营能力•OSS运营能力•PAAS平台服务开发及管理能力虚拟化网络构建与运维能力•NFV技术能力•SDN技术能力大数据技术与应用能力•大数据业务价值和应用能力•大数据分析与挖掘方法能力•大数据平台规划和管理能力云数据中心构建与运营支撑能力•云数据中心运营能力•云数据中心构建与运维能力综合IT服务治理重构使能平台IT管理与IT治理•IT管理与IT治理能力•企业架构能力重构ICT基础设施图6ICT运维专家能力模型
用EMS(U2000),NFVI有FusionSphereOpenStackOM,v-center,硬件层有eSight。因为运维入口数量较多,运维工程师要频繁切换运维工具。在故障处理,特别一,会带来极大的困难。
因此,在NFV场景下,集中的监控运维平台也会提升运维效率。目前华为可以提供小闭环和大闭环的集中监控运维方案,分别针对华为VNF的场景和多厂家分层运维的场景(见图7)。其他厂家也有类似的方案,实现NFV分层解耦情况下的集中监控。2.4传统运维与互联网运维
传统的CT运维基本上依赖于工程师的经验和技能,自动化程度很低,更不要提智能化。目前运营商和设备商都普遍认同网络全面云化后,面对海量的运维数据,传统人工的运维方式已无法满足NFV运维的需求。电信运营商需要参考IT互联网运维,利用大数据分析、机器学习等技术实现运维自动化和智能化。是跨层故障定界定位时,由于各个运维平台的不统
化的实例,通过机器学习对海量告警数据的分析,可以自动梳理出NFVI告警和VNF告警的关联关系,再
NFV场景跨层告警关联就是一个自动化和智能
把这些关联关系作为规则,EMS或者IES系统可以自动对告警进行关联和压缩。通过这种方式,运维工程师可以比较快速地查找到根因告警(见图8)。
目前NFV自动化和智能化运维处在起步阶段,与互联网厂商的自动化和智能化相比还有很长的路要走,这个也是未来NFV运维解决方案开发的重点。
3总结和展望
网络云化是5G发展的基础,电信网络将会面临前所未有的发展契机,而中国目前正处于5G发展的启动期。尽管运营商在5G网络部署和运营过程中会面临各种挑战,但是5G网络的灵活切片能力和对垂直行业数字化、智能化改造的强大潜力将给运营商带来更大的机遇。电信运营商需要积极推进运维转型,加大力
邮电设计技术/2019/12
15
袁林,蔡超,黄庠奇
ChinaUnicomInnovation5G时代云化网络运维转型探讨
联通创新
运维解决方案OSSMonitoringEMSAnalysisMonitoringAuto-Healing1OpenStack2大闭环ACVIMAnalysisAuto-Healing闭环暗杆总体策略①有华为VNF小闭环场景,对于第三方CloudOS无eSight场景,运维依赖第三方VIM的能力而受限,硬件管理能力能能需定制②网元级和多个关联网元的告警、故障、性能、日志处理由小闭环/EMS负责③业务级(NS级)水平层面跨厂商的告警、故障、性能、日志处理由大闭环IES负责④小闭环/EMS的功能与大闭环是一个分布式协同关系,可以并行存在,但能力上有区分3+5组合场景实例说明典型项目2VNFMCloudIMSCloudEPCCloudSDMvCOTSvStoragevSwitchStorageSwitchCOTSNFVI1小闭环策略建议HWAPP:小闭环,MVAPPHWFS+E9000A运营商FS或者DC分层运维,推荐大第三方FS+HPE运营商/V运营商闭环E9000VM+E9000B运营商VMwaHWAPP:闭环能力部分场第三方VM+HPO运营商景受限,MVAPP或者DCUbuntu+OpenStack+HWD运营商RH2288Ubuntu/分层运维,推荐大闭环Redhat第三方Redhat+HPT运营商CloudOSCOTS实例有华为VNF的推荐小闭环,多厂家和分层运维场景则推荐大闭环图7华为小闭环和大闭环的集中监控运维方案
VNF和NFVI通过主机名、虚拟机名称、IP地址等关联媒体IPSIP心探测失败跳失败内部通网关探信故障测失败虚拟机端口故障IP地址冲突存储介质故障通信平面丢包vSBC虚拟机名称VMVMVMVMHostHostVMM3UA链H248链路故障路故障内部通Diameter信故障链路故障虚拟机端口故障IP地址冲突存储介质故障通信平面丢包HostvCSCIP地址+端口VMVMVMVMU2000关键参数失联过滤根因告警U2000上通过根因告警查询获得根因告警VMVMVMVMVMVMVMVMHostHostFM图8NFV场景下自动化跨层告警关联示例
IEEEWileySeries,2018.
度构建云化网络运维能力,提升运维效率,为即将到来的5G市场快速发展期打下良好基础。参考文献:
[1]李游素,寿国础.网络功能虚拟化NFV架构开发测试及应用
[M].北京:人民邮电出版社,2017.
[2]闫长江,吴东君,熊怡,等.SDN原理解析:转控分离的SDN架构
[M].北京:人民邮电出版社,2016.
[3]AL-DULAIMIA,WANGXB,LINIC.5Gnetworks:fundamentalre⁃
quirements,enablingtechnologies,andoperationsmanagement[M].
[4]LIYANAGEM,ANDREIG.软件定义移动网络:超越传统架构
[M].北京:机械工业出版社,2019.
作者简介:袁林,毕业于南京理工大学,学士,长期从事核心网络的维护管理工作;蔡超,毕业于西安电子科技大学,硕士,长期从事核心网、数据网、数据中心相关方向研究规划设计以及行业应用网络解决方案和网络产品研发工作;黄庠奇,毕业于哈尔滨工业大学,硕士,主要从事IP网络、光传输、信息安全及5G行业解决方案相关工作。16
2019/12/DTPT
因篇幅问题不能全部显示,请点此查看更多更全内容