|
|
51CTO旗下网站
|
|
移动端

1.2.4 智能运维阶段

《智能运维:从0搭建大规模分布式AIOps系统》第1篇开门见山:运维发展史,本篇主要展现运维的发展历史和经历的不同历史阶段,以及运维工作的现状。本节为大家介绍智能运维阶段。

作者:彭冬/朱伟/刘俊来源:电子工业出版社|2018-11-27 12:16

1.2.4 智能运维阶段

这个阶段是智能化的,当基础设施固定下来后,运维模式最终也会固定下来,这些模式会把可用性、扩容等场景在内的诸多运维方案包含进来,把开发平滑地加入运维架构。AIOps(Algorithmic IT Operations)最早由Gartner定义为采用人工智能算法(AI和机器学习),利用机器解决已知的问题和潜在的运维问题的一种技术解决方案。这里值得注意的是,根据Gartner定义,AIOps中的AI并不是Artificial Intelligence(人工智能),而是广义的算法。本书中也将遵从此定义,并且不严格区分智能运维与AIOps。

AIOps使用分析理论和机器学习等方法,分析和处理各种操作工具、服务和设备产生的大量数据。它能够自动发现问题,并且能够实时对问题做出反应。AIOps建立在大数据与机器学习(Machine Learning)基础之上,如图1-1所示。

举一个简单的例子。通常的报警策略是设置一个阈值范围(上、下界),当某个指标超出这个阈值范围时,则触发报警。这也是最直接、最简便的办法。然而,对于一些特定场景下的报警,设置可能没有这么简单。如图1-2所示是微博广告某产品某天的广告曝光次数走势图,从图中可以看出,每天早上4点到6点达到一天的***,上午将近11点达到一天的***。如果依然按照固定的阈值设置报警是非常不准确的,我们需要通过历史数据智能化地拟合出一条趋势线,以这条线的上、下界一定范围作为动态的报警阈值,以达到更加准确的报警。

另外,智能运维可以被用于故障分析,以快速定位问题,降低企业的损失。在AI中我们使用到的各类算法,比如基于指数平滑的二次平滑、三次平滑算法,基于ARIMA的算法,基于深度学习的前馈神经网络、循环神经网络(RNN)算法等,已经比较成熟,并大量使用在其他研究领域,比如图形图像处理、语音识别等领域。所以,在算法上,我们在很早之前就应该具备了这方面的理论基础。

在计算能力上,目前我们看到,基于大数据技术的数据处理能力已经足够,Hadoop、Spark等生态,包括时序数据的处理能力,都已经能够支撑智能化的复杂计算场景。

就目前来看,国内的百度、搜狗、宜信、阿里巴巴、微博等都已经探索尝试了AIOps,并且取得了不错的收益。在2017年InfoQ举办的QCon全球架构大会上,已经有不少与AIOps相关的议题,感兴趣的读者可以关注。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

16招轻松掌握PPT技巧

16招轻松掌握PPT技巧

GET职场加薪技能
共16章 | 晒书包

289人订阅学习

20个局域网建设改造案例

20个局域网建设改造案例

网络搭建技巧
共20章 | 捷哥CCIE

645人订阅学习

WOT2019全球人工智能技术峰会

WOT2019全球人工智能技术峰会

通用技术、应用领域、企业赋能三大章节,13大技术专场,60+国内外一线人工智能精英大咖站台,分享人工智能的平台工具、算法模型、语音视觉等技术主题,助力人工智能落地。
共50章 | WOT峰会

0人订阅学习

读 书 +更多

网管员必读—服务器与数据存储(第2版)

本书是在第1版的基础上全面更新、改版而成的,仍然是目前图书市场中唯一一本全面介绍硬件服务器的IT图书。本书针对近两年来所出现的新服务...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客