随着金融行业信息技术的迅速发展和数字化转型的加速,金融企业对IT系统服务的要求日益提升。IT运维作为保障金融系统稳定运行的核心力量,承担着提高服务质量与效率以及保护客户数据安全的重要职责。尽管其在金融行业中的地位愈发关键,但IT运维仍面临系统复杂性、技术快速更新和安全风险等多重挑战。
1. 系统复杂性:金融业务涉及多个系统和应用,这些系统之间存在复杂的依赖关系。IT运维人员需要深入了解各个系统的运行机制和交互方式,以便更好地监控和管理。
2. 技术更新换代:金融行业信息技术的快速发展使得IT运维人员需要不断学习新知识和技术,以适应新的运维需求。这需要IT运维人员具备良好的学习能力和快速适应能力。
3. 安全风险:随着网络攻击的不断升级,金融行业IT运维面临着日益严峻的安全风险。黑客攻击、病毒侵袭等都可能对银行系统造成严重影响,IT运维人员需具备强大的应对能力。
为帮助金融行业更好地应对IT运维的挑战,华胜天成与飞腾基于S5000C芯片强大的算力底座,联合推出了新一代开放、异构、全栈合一的国产智能IT运维平台解决方案。该方案依托华胜天成和飞腾在信创领域的技术积淀,将智能运维技术与信创领域的客户需求和业务场景紧密结合,为金融行业提供了创新的智能IT运维服务。该方案不仅提升了运维管理的灵活性、效率和可靠性,更为金融客户的业务持续发展提供了强有力的支持。
华胜天成 Mocha BSM Visto是针对信创产业链,在信创架构上部署的全方位、全适配的智能运维平台。
该产品被划分为 4 个层次,层次之间均通过 API 沟通。这 4 层分为:
1. 展现层:通过华胜天成 Mocha BSM Visto 图形化展现采集的监控数据;与用户互动,响应用户的操作与设定;以及集成第三方监控产品等。
2. 汇聚处理层:用于处理采集到的监控数据(例如,根据监控数据生成报警);同时也用于处理展现层传递的用户操作与设定(例如,将用户定义的监控策略下发到数据采集层)。
3. 数据采集层:用于采集被监控资源各项指标的数据,并上传至汇聚处理层。
4. 被监控层:被监控层主要包括华胜天成 Mocha BSM Visto 通过各种方式监控的客户资源,例如主机、应用、网络设备、业务服务、机房动力环境、Avaya、核心业务数据、行业专属 IT 设备等。
1. 接入层:包含了被监控资源,如服务器(操作系统&硬件)、网络设备、存储、数据库、应用/中间件、数据流、标准应用、机房动力环境、核心业务数据、行业专属IT设备、虚拟架构/云架构(VMWare、K8s、ZStack、OpenStack、公有云等)、第三方集成数据等。
2. 数据处理层:包含数据处理/存储和算法平台两部分。数据处理层将接入层的指标数据、日志数据、报警数据、第三方数据等集中进行存储、转换、清洗和解析。根据业务场景将数据接入至算法平台中,进行训练和调参,最后形成成熟的指标预测和优化建议方案。
3. 运维中台:整合全部平台功能,包括监控&告警中心、网络拓扑、全景3D机房、业务服务、日志解析中心、综合报表。
4. 可视化展现层:包含了3D机房展现、业务服务视图、全景拓扑、实时告警台、可视化大屏等。
1. 主机IPMI、OS监控:实现对各种主机服务器监控管理。包括主机硬件、操作系统性能、文件系统、进程和应用等。
2. 虚拟化及存储监控:光纤通道交换机、存储阵列、磁带库、HBA卡等存储资源的全面监控。虚拟机进行性能、可用性、配置的监控。
3. 数据库监控:数据库的重要配置参数以及运行状况的监控。如SGA使用率、表空间占用情况、锁竞争和使用情况、缓冲区命中率等。
4. 报表及报告:统一的报告和报表,多台设备性能比较,支持多种格式导出,可订阅的定期运维报告等提供灵活的、门类齐全的报表功能。
5. 自动化巡检:能够根据预设时间点,对监控资源的实时运行数据进行提取,形成报表,代替手工巡检。
6. 全景视图:用户的业务视图、网络视图、应用视图、虚拟化视图和存储视图融合在一起,完整展现用户统一的IT架构。
7. 统一展现:基于统一、集中的管理体系,统一的数据处理和展现,统一的告警平台,支持大屏展示。
8. 扩展性:采用技术成熟、先进并具有较强的集成性和可扩充性的管理平台。
1. 安全的管理系统:充分考虑用户在安全方面的关切,采取众多措施来保证系统的安全性。
2. 直观的界面展示:通过直观生动的可视化界面展示,打破了运维人员的技术壁垒。
3. 实时的告警展示:即时将告警信息展现给用户,避免延迟。
4. 灵活的权限控制:提供灵活、有效的权限控制,支持分级、分权的用户管理,支持设置用户角色。
5. 全面的统计分析:华胜天成Mocha BSM Visto有全面的统计分析功能,包括:实时分析、历史分析、统计报告、巡检报告。
6. 良好的扩展性:华胜天成Mocha BSM Visto的分布式部属架构,保证了管理平台管理节点的良好可扩展性。
某大型能源国企辅助式运维案例
运维现状:
基础运维团队10余人,1000+物理服务器及存储、网络设备50+、安全等其他IT设备20+的运维和管理工作;
应用运维团队5人,承担着生产和办公的应用系统、数据库、组件等的运维管理工作;
故障投诉多、设备管理混乱、设备故障没有管控工具;
排查故障以人工方式为主,故障定位和处理时间长、效率非常低;
随着业务系统越来越多,采购的设备种类、型号等也更加繁杂。
解决方案:
基础网管工具:纳管全部IT软硬件,实现故障的即时发现和报警;
业务架构分析与业务层面故障解析,提高运维效率,故障快速解决;
需要有快速监控新设备型号,全方位运维的能力。
产品亮点&能力:
实现IT基础架构软硬件的集中管理、故障发现、告警等;
全方位机房设备管理、动环监控;
业务架构拓扑呈现,故障回溯以及业务层面告警收敛;
扩展监控,采用标准模型扩展、指标扩充、快速准确的将新购设备纳入监控体系。支持脚本(支持多种脚本格式)、SQL语句等,易上手,快速解决软硬件更新换代的快节奏。