企业如何进行智能运维的建设?
1个回答
2023-01-25
展开全部
智能运维建设现在已经在各行各业的新一代运维建设中提上了日程安排,擎创科技作为国内首家专注于智能运维的解决方案提供方,针对百余家不同行业的企业运维管理者做了相关调研(其中部分数据来源于双态IT联盟的调研成果),就智能运维的展开路径情况做了细部征询,得出了如下分析结论。
按照企业规模和既有运维成熟度来看,企业规模越大,运维成熟度越高的,越倾向于运维大数据平台(或者运维数据中台)的能力建设,均认为运维数据的治理能力和质量提升是智能运维的关键基础,所以先从这个步骤入手是相当理性的选择。其中部分企业做了指标智能化管理的一些试点,取得了一些成绩,但同时也发现单独依靠指标异常检测去完成故障传播链分析和根因定位效果很难实现,于是开始考虑多样化数据融合的智能化场景。
相对规模小的,既有运维成熟度不是很高的,则倾向于场景化建设,针对告警繁杂处理不过来的,在告警抑制、告警智能化管理方面进行建设;针对监控误报漏报率高的,纳入指标异常检测替代固定阀值;希望从日志数据中直接发现异常,但又不想过多通过写SPL或者各类依赖正则的方式制作解析规则的,选择基于日志聚类的算法做实时异常检测。
根据这些实际状况的调研,再结合擎创数十家企业智能运维落地建设的经验,我们梳理出智能运维建设的三大原则和六步走路线。
1、从自身运维基础出发
不要被一堆美轮美奂的场景迷惑,异常检测、根因定位、故障自愈、知识图谱,不论哪一种智能运维场景都离不开自身的数据条件和运维基础,应从自身基础出发。
2、夯实运维数据处理能力自身能够有资源建设和维护一支高素养运维开发团队,首选考虑运维数据中台能力建设,先把数据能力夯实,再选择性看待一些智能化场景的落地。
3、循序渐进的场景化建设自身运维管理资源不足,只有若干运维开发人员,甚至多数为兼职的,优先考虑场景化建设,围绕存在不足和挑战的既有运维场景逐步做智能化改造,在改造中注意要循序渐进,不可贪多求全。
按照企业规模和既有运维成熟度来看,企业规模越大,运维成熟度越高的,越倾向于运维大数据平台(或者运维数据中台)的能力建设,均认为运维数据的治理能力和质量提升是智能运维的关键基础,所以先从这个步骤入手是相当理性的选择。其中部分企业做了指标智能化管理的一些试点,取得了一些成绩,但同时也发现单独依靠指标异常检测去完成故障传播链分析和根因定位效果很难实现,于是开始考虑多样化数据融合的智能化场景。
相对规模小的,既有运维成熟度不是很高的,则倾向于场景化建设,针对告警繁杂处理不过来的,在告警抑制、告警智能化管理方面进行建设;针对监控误报漏报率高的,纳入指标异常检测替代固定阀值;希望从日志数据中直接发现异常,但又不想过多通过写SPL或者各类依赖正则的方式制作解析规则的,选择基于日志聚类的算法做实时异常检测。
根据这些实际状况的调研,再结合擎创数十家企业智能运维落地建设的经验,我们梳理出智能运维建设的三大原则和六步走路线。
1、从自身运维基础出发
不要被一堆美轮美奂的场景迷惑,异常检测、根因定位、故障自愈、知识图谱,不论哪一种智能运维场景都离不开自身的数据条件和运维基础,应从自身基础出发。
2、夯实运维数据处理能力自身能够有资源建设和维护一支高素养运维开发团队,首选考虑运维数据中台能力建设,先把数据能力夯实,再选择性看待一些智能化场景的落地。
3、循序渐进的场景化建设自身运维管理资源不足,只有若干运维开发人员,甚至多数为兼职的,优先考虑场景化建设,围绕存在不足和挑战的既有运维场景逐步做智能化改造,在改造中注意要循序渐进,不可贪多求全。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询