IT智能运维分析平台(ITOA)

   产品介绍

得力助手ITOA(IT运维分析)系统通过多种渠道,采集IT资产的海量数据;采用当前最前沿的大数据技术(并行计算技术、人工智能技术),对数据等进行挖掘建模和机器学习建模,通过数据挖掘发现隐藏于其后的规律或数据间的关系,充分挖掘这些数据的价值,从而形成能实际应用于IT运维的新生数据;协助运维人员快速检查分析故障、定位故障,辅助专家预测将来可能有出现的IT故障。

数据规模越大,处理的难度也越大,但对其进行挖掘可能得到的价值更大,这就是大数据热的原因。鉴于越来越大的数据规模,采用常规基于DBMS的数据分析工具和方法已经无法满足大规模数据分析的需求,目前一些大型互联网公司采用hadoop体系进行大规模数据的运算,结合hadoop体系结构与实际的运算需求结合,采用hadoop 体系结构的分布式运算模型,通过集群的方式实现大数据运算,为企业提供大数据的价值。

为适应ITOA的要求,同时提供ITOA的系统设计的依据,特制定计算平台的系统概要设计文档,为后期的系统详细设计和实现提供依据。

核心功能

日志管理

       可收集、索引和利用所有应用程序、服务器和设备(物理、虚拟和云中)生成的快速移动型计算机数据。从一个位置搜索并分析所有实时和历史数据。使用得力助手ITOA 处理计算机数据,可让您在快速解决问题、分析事件、定位根源故障。监视您的端对端基础结构,避免服务性能降低或中断。以较低成本满足合规性要求。关联并分析跨越多个系统的复杂事件。

性能数据管理

   存储IT监控平台采集的海量性能数据,高效的多维度分析。

    提高现有性能查询的效率,支持不同周期的快速查询,并用可视化的图形进行展示。

优化性能类巡检报表的生成效率,对于不同周期(日,月,季)的报表缩短生成时间,提高报表自定义生成效率。

提高设备性能指标的历史曲线对比展示的效率,尤其对于广域网主备线路,能够快速的进行接口带宽利用率历史曲线的比较。

智能分析

  面对复杂的业务监控和问题诊断,运维人员想找到指标和事件之间的关联关系,进行因果关系推导,并最终定位故障,基本依靠人的经验来进行。但随着业务和监控规模的膨胀,运维也希望能够更加自动化、智能化地达成保证服务高可用性的目标,即快速的问题发现、分析定位或止损。得力助手ITOA系统实现了:

   1、动态阈值设置。在某时刻出现数据波峰的骤降或波谷数据的骤增等变动情况时,恒定阈值法很难解决这类问题的精准异常判断。那么可以采用动态时间窗口的阈值设定法来解决周期性数据的异常判断。

   2、KPI趋势分析与预警。通过把监控指标的历史数据加入到学习系统,再构建最理想的趋势预测模型,使用预测模型自动预测指标在未来某个时间段的数据情况,有助于提前缓解风险。

   3、智能动态容量规划。针对一台服务器,分析某个指标与 CPU,内存,硬盘等资源间的潜在关联关系,选取相关指标数据进行关联分析与预测建模,合理预测指标的增长趋势,制定更完备的容量预估。

   4、智能告警关联。运维工程师可以把一些基础的关联关系配置到监控系统中,再通过一些关联挖掘方法可以让监控系统明白一些常态化的运维指标与其它指标是否存在关联,比如多服务器升级或者部署产生问题是否与数据中心或交换机异常有关等。

典型案例

  汉口银行

   吉林农信

   遵义商行

   ...


Copyright © 2017 北京得力助手信息技术有限公司 | 京ICP备16031303号