政务云概述
政务云作为优化政府运营、管理和服务效率的一种创新形式,已成为加快政府数字化、服务化、智能化进程的重要手段。目前,我国政务云行业发展迅猛,在助力政务建设、打破信息孤岛、实现数据共享共治方面效果显著。
IDC认为政务云市场的厂商从商业模式上可以分为三类,分别是:纯运营模式、纯技术解决方案模式和端到端模式。第一类纯运营模式,单纯作为政务云服务运营商向客户提供政务云服务,核心云平台、基础架构软硬件通过合作伙伴采购,以运营商和当地系统集成商为主;第二类纯技术解决方案模式,以硬件厂商公司为主,单纯作为政务云服务运营的技术及配套服务提供方,提供以云平台为核心的解决方案;第三类端到端模式,是介于纯运营模式和纯技术模式的中间类型,公司不仅自身具备云建设和管理的相关技术资源和解决方案,还能够作为政务云服务运营方为政府客户提供政务云运营服务。
云计算模式下,“信息集成、资源共享”,各类数据汇集到一起,信息安全问题也已成为政务云面临的一项重要挑战。因此,在云计算时代,为进一步推动我国电子政务建设,需站在维护国家信息安全的高度进行规划设计,“确保信息安全、坚持自主可控”也是未来我国政务云市场的一个重要趋势。
政务云运维挑战
政务云从传统数据中心环境过渡到云环境甚至多云环境,运维对象数量爆发式增长、政务业务应用场景多、对安全和稳定性要求高,政务云运维面临诸多挑战。
● 基础环境复杂,对运维技术要求高
政务云底层基础架构复杂、关联度紧密、技术领域广,现有运维团队的技术能力难以完整覆盖,同时缺少持续更新云计算技术的环境和机制。
● 运维SLA要求苛刻
政务云环境涉及的产品和组件多,故障快速定位和恢复难度大,SLA指标达成风险高。持续运行后,随着需求增加,性能下降,隐患也逐步加大,同时,欠缺持续优化和改造能力,云环境越来越难以满足业务持续的发展需求。
● 运维体系不规范,运维平台不完善
缺少专业的运维组织和运维流程规范,监控对象覆盖不全面,缺少统一的运维平台,自动化能力不足,日常运维过程中容易出现因不规范操作导致人为事故,影响云上业务运行。
● 安全要求高,安全审计频繁
对安全要求高,不定期的等保测评、攻防演练、护网行动等频繁开展,安全检查、安全审计、安全整改相应增加了运维人员很大工作量。
● 业务迁移上云困难重重
政务业务系统间关联度高、核心业务系统技术架构复杂、大量采用闭源商用软件,必须通过专业的政务业务上云方法论,以及标准化的流程,进行充分的业务调研和分析,制订周全的迁移方案和计划,在各领域专家的共同保障下才可降低迁移上云的风险,保障客户满意度。
政务云运维最佳实践
“三分建设,七分运维”,由于多租户和服务化,让政务云的运维变得更加关键,运维的成功与否将直接影响政务云项目的成败及收益。在深刻理解政务云运维场景和实际需求的基础上,结合实际项目,新华三构建了能够满足政务云业务特点和要求的政务云运维参考框架。
政务云运维服务全景框架
政务云运维服务全景框架以模块化方式,构建了政务云运维领域全面的体系架构,结合国内外ITSS/ITIL/ ISO20000等IT标准和最佳实践,围绕组织、流程、工具三大运维核心要素,以政务云数据中心IT基础架构、应用和数据为运维对象,遵循安全管理要求和技术要求,通过运维组织架构和人员,使用监控平台、管理平台和控制平台进行云资源管理、云运维管理、云服务管理和云交付管理等活动。
政务云运维方案建议
对于政务云领域的云服务商而言,不同于传统的IT系统,云计算时代如果政务云环境中任何一个业务应用出现问题都会导致非常大的影响,不像以前一个局委办单位的独立业务应用宕机或者运行异常,最多会影响这一个单位,不会影响到全市甚至全省,所以安全性和稳定性是政务云平台建设方在运维层面务必保障和考虑的,同时还需要通过丰富的技术支撑手段确保运维平稳,保障SLA达成。对于政务云服务运营方而言,需要不断优化云资源利用率,同时提供更丰富的云服务,从而提高整体收益和利润。
对于政务云的租户(局委办单位)而言,运维要做到的是保证云租户像用电一样方便地使用各种云服务,这是终极目标。
〉运维组织
在政务云运维场景下,运维组织的建设是受多方面考虑和约束的,如人员编制、预算投入、SLA要求、7×24监控需求等,这些因素制约着现场运维团队的岗位设置。
总结国内政务云运维场景的经验案例,政务云建设初期组织架构最小化设置如下图所示。该架构从人力工作时间上来考虑,适用于不强制要求7×24监控的情况下,但是运维人员能做到7×24响应并进行远程或现场故障处置。
针对SLA指标苛刻、必须要7×24现场监控处置的场景,最佳的岗位设置是监控团队独立出来,这样可以保证一线运维团队有更多的精力进行日常云平台运维,有更多的时间去思考、优化云平台,更好地保障云平台稳定,同监控团队一同保障SLA指标达成。
同时,运维经理必须针对每个岗位设置各自的 KPI考核指标、考核管理办法、日常运维规范, 通过严格的考核流程来管理运维团队的日常工作质量,结合考核结果,制定人员改进计划和方案,监督改进。
〉政务云运维流程体系
俗话说:无规矩不成方圆,在政务云运维场景下,所谓的规矩就是指运维流程体系,通过规范化的运维流程来指导、约束日常运维动作,能提高运维交付质量,达成SLA指标,提升客户满意度。
为了保障云平台的服务质量,政务云运维团队首先应建立常用的流程,如变更管理、问题管理、事件管理、运维团队管理与考核;在运维步入正轨后,再结合实际情况由运维经理负责完善其他流程,如发布管理、容量管理、数据可持续性管理、日志管理、配置管理、服务台管理、监控管理、补丁管理、安全事件管理、资源扩容管理等诸多流程。
运维管理流程体系建设成果以文档资料的形式发布,该成果文档资料可以按照四级分档明确分类,内容全面,可涵盖日常运维交付的工作所需。
〉政务云统一运维平台
运维职责贯穿了政务云的生命周期,需要借助自动化、智能化的运维平台帮助运维工程师以最低的成本和最快的速度完成面向用户的服务交付和服务质量保障。政务云生命周期中使用的运维平台按照其所处的层次分为如下几类:云基础设施资源和监控平台、运维自动化平台、云资源配置管理平台、云服务运营管理平台、业务调度平台等。以新华三的U-Center统一运维管理平台为例,需具备下图所示的云运维服务能力:
● 基础设施资源和监控平台实现了全网全域云资源的集中式监控,提供面向IaaS+PaaS的综合运维监控视图,同时对云上业务的运维服务质量可感知、可评测。
● 运维自动化平台实现云资源和业务状态的全方位诊断分析,快速发布多维、多指标、多场景的巡检报告,政务云的整体情况一目了然。
● 云资源配置管理平台能够实时、动态监控云资源配置的变化情况,并以可视化方式展示云资源和业务的映射关系,有效优化云资源利用率,使得政务云保持“正确”的资源池大小。
● 依托云服务运营管理平台建立以服务为中心的政务云运维服务运营管理体系,并通过专业服务流程咨询设计和电子化落地规范政务云运维流程并持续完善,提升政务云运维服务的运营效率。
● 业务调度平台提供统一的运维管理门户,并支持移动端门户,拉通运维信息流进行统一的调度管理,并能有效整合第三方资源,提供“一体化”的云运维管理平台,实现投资成本回报最大化。
〉政务云应急响应机制
为建立健全政务云平台环境、网络环境与信息安全事件应急工作机制,提高现场运维团队应对突发云平台、网络与信息安全事件的能力,必须结合实际情况,建立完善的应急响应机制、应急流程和应急预案等体系。
首先按照云平台网络与信息安全事件的紧急程度、可能造成的危害和发展态势,对事件分级管理。其次建立政务云项目应急响应组织机构,将各个组织岗位的职责定义清楚。再次根据事件的等级制定预警发布、预警响应及预警解除的机制。最后通过已有应急预案,制定年度应急演练计划,并定期演练。
某省级政务云案例分享
政务云计算背景下,客户可根据云的商业模式、业务现状和自有运维能力,结合未来的发展规划,选择自维、协维或代维模式。新华三在杭州建设了可支持全国云计算项目的云运维服务中心,整合公司内外部资源,由各个技术领域的资深云计算运维专家组成专业化的服务团队,统一为客户提供各种级别的云运维服务,对云计算项目的交付质量负责。
2015年底,某省政务云领导小组创新性地提出了1+N+N+1的建设模式,即一个云监管平台,多个云服务商平台,多个部门整合平台和一个云灾备平台,采用新华三整体解决方案来构建,提供了全面的云服务。
客户对政务云的SLA可用性指标要求非常严格,即保证各个应用系统可用性不低于99.95%,全年单个政务应用失效时间之和不超过262.8分钟,采用了云基本驻场运维、云高级驻场运维和云远程运维三种运维服务相结合的运维模式。
此项目为云服务运营模式,所以整个运维分前端面向客户的内容、后端平台维护的内容,前后端通过运维经理的统筹协调和管理,保障SLA的达成,助力运营推广和项目营收目标达成。
〉客户价值























