ARM架构下的合胜全景运维管理平台——“监”、“管”、“控”一体化
发布时间: 2019-11-01
浏览量:1429
/诚敬创新,合作共赢/
自华为鲲鹏920驱动的旗舰系列“泰山”(TaiShan)三款服务器问世,合胜科技第一时间将泰山服务器纳入了合胜全景运维管理平台。该产品面向ARM架构平台,结合合胜科技十多年运维管理经验,面向数据中心日常运维,以“监”、“管”、“控”为主要服务功能。通过统一的运维管理架构、管理制度、管理流程、管理工具,可帮助客户逐步抛弃传统的粗放式、分散式管理模式,向标准化、规范化和流程化的运维管理转变,以满足数据集中后多层级、全覆盖的管理需要。
合胜全景运维管理平台是合胜科技自主研发的全新具备智能运维的管理平台,融合了集中监控、性能自告警、配置自动化、工单流程管理等功能模块,通过统一的Portal提供产品服务。
合胜全景运维平台通过数据总线的概念,以“监”、“管”、“控”为主要产品目标,基于ARM架构的服务器,可提供更便捷、更优成本、更高质量的ARM服务器监控与性能分析趋势预测数据分析的一站式智慧型基础运维监控服务,能够保障企业线业务的稳定、改进运营效率、创造更好的用户体验。
监控和运维(“监”)环节对处于运行状态的ARM服务器架构及运行于ARM服务器架构上的业务应用进行持续的监控,帮助管理人员从实时和历史的两个视角了解系统的运转情况。实时视角的管理帮助跟踪系统的运行状况,包括从业务视角进行管理;历史视角的管理帮助用户从运行的历史数据堆积获取规律及进行趋势分析。
| 性能及可用性管理: 通过平台化的技术对ARM架构
的各个对象进行监控,以确保系统资源处于健康范围,业务运转处于正常边界内。当有异常发生,平台将及时捕获,并帮助用户从现象追踪故障根源。
|
服务器监控
ARM服务器OS监控模板
| 事件告警管理: 合胜全景运维管理平台基于完整、可灵活配置的告警接收、告警丰富、 告警过滤、告警屏蔽、告警关闭的业务流程,将接收到的告警信息按照统一的业务流程进行分类处理,最终完成合并过滤等梳理操作,同时,根据配置规则,将告警信息通过微信/邮件等实时的发送通知给告警接收人。 |
告警业务流程处理
Ex. 对华为泰山服务器进行的CPU load告警 对于不同告警源提供的告警信息,
* 统一的告警主体 * 告警丰富信息后的详细展示 * 提供告警通知发送效果确认(如邮件,微信,语音等)
|
|
* 告警操作详细日志 * 若告警触发了特定的错误,详情中可以查看 * 提供三方对接(如一键开单等) 通过模块分离的设计,对三方系。如(工单,OA)等系统的对接,提供插拔式的功能清单 | |
| 仪表盘与分析: 对于不同层面不同视角的用户,仪表盘与分析能够呈现不同内容和风格的界面以适应其需求;可定制化的仪表盘可以将用户关心的数据呈现出来。 合胜全景运维管理平台,经由统一管理的分布式的采集任务,采集ARM服务器性能数据。通过用户定义的Dashboard,显示基于各设备主机监控指标的性能数据展现。 |
ARM服务器OS监控用户自定义Dashboard
ARM服务器性能指标最新数据展示
请求与支持(“管”)环节从流程角度规约了基于底层ARM架构服务器提供服务和业务消费服务的标准过程和方法。通常在这个环节进行:
| 服务请求管理: ARM架构IT服务的标准化,并能够友好的被访问,有序的被管理;IT还可以向内部外部用户提供自服务形态的接口来优化服务请求体验。 |
服务请求管理控制台
| 变更/发布管理: IT团队以标准化的方式管理日常变更以及应用发布,包括准确的变更影响分析,合适的变更排期,准确的匹配资源,变更结果跟踪等等。 |
变更/发布管理控制台
| 资产管理: IT团队可以对基于ARM架构服务器的资产进行有效的管理,包括与采购等外部系统整合,使IT资产的整个生命周期被纳入有序的管理。 |
配置管理控制台
供应和配置(“控”)环节在具体执行操作层面保证系统配置等工作以高效和标准化的方式进行。数据中心日常进行的各种规律化的工作都可以梳理为标准化的操作步骤,并通过自动化操作管理实现,例如合规检查、日常巡检、软件部署、补丁管理、系统部署、脚本管理、交互性系统操
作。固化的、标准化的并且访问控制的操作执行提升数据中心运维的效率、降低误操作率、减轻人力负担同时确保管理的可追溯性。
| ARM服务器配置自发现: 帮助IT团队实现基于ARM服务器操作系统及之上对象的管理,是自动化手段在数据中心应用最为广泛和最为成熟的管理技术。 基于自动化Ansible平台的定制化模块,合胜一体化智能运维平台提供体系化的配置项维护方法。在CMDB的支持下,将配置变更申请与识别及确认配置变更结合,通过联邦调和等手段,变更申请信息修改配置项相应信息或配置项间的关系;根据配置变更申请来源的不同,将更新结果进行反馈。 |
合胜全景运维管理平台自动识别的华为ARM架构”TaiShan”部分配置清单
华为ARM架构”TaiShan”自发现的关联数据
| 业务影响模型: 数据中心的环境对象复杂纷繁,它们之间的连接也密如蛛网,如何获取真实环境最为更新的当前配置是管理员及中高层管理者关心的,自动发现和依赖关系技术对既有环境进行定期或触发式的扫描,捕获数据中心内的系统对象及其互联关系。这些信息对于战术层面的操作和战略层面的规划都起着至关重要的作用,这些信息也是核心配置管理数据库CMDB的重要信息来源。 |
业务影响模型
合胜全景运维管理平台基于ARM创建的业务影响关系图
业务影响关系图中ARM服务器所处的节点示意
提供集展示、管理、监控、分析的一体化智能运维管理平台。
支持传统型数据中心以及云数据中心的基础架构监控管理。
提供智能化的机器算法,包括容量预测、性能基线算法以及交易趋势算法。
对于外部数据的接入提供标准的数据接口,并且对于外部数据具备管理功能。
| 合胜在多年的业务发展过程中积累了一批以银行为主,兼顾保险、证券等行业中的大中型企业的优质客户群体。在与优质客户合作的过程中,建立了良好的市场品牌形象。 |
| 合胜拥有十多年在金融行业的IT运维管理项目实施经验,尤其是金融行业关键业务IT运维管理的经验和方法论,为本产品提供了优质的技术保障。 |
| 合胜在多年的ITOM/ITOA业务实践中形成了稳定的核心管理团队和优秀的技术团队,均具有丰富的IT运维管理市场经验和项目管理能力。团队的多数技术人员具备在国际IT运维管理厂商的工作经历。 |
| 凭借多年来在IT运维管理行业的实践经验积累,具有快速的产品提炼、持续、综合的支持服务能力。合胜能根据金融行业的特点和业务模式,结合国际先进经验和技术,快速分析客户的需求、形成解决方案。 |