面向Web服务运维的故障发现与根因定位研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:noegen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
全文阅读
随着互联网的普及,特别是移动互联网的迅猛发展,Web服务已经深入到社会生活的各个方面。与此同时,服务故障也影响了用户的正常使用,并给企业造成损失。提高Web服务的运维效率,是保证线上服务质量与用户体验的关键。运维是Web服务生命周期的重要组成部分,其目的是确保线上服务安全稳定地运行。传统的Web服务运维主要依赖运维人员的领域知识和运维经验。然而,随着Web服务规模、类型和复杂度的剧增,依赖人工分析的传统运维方式已经无法解决大规模运维的难题。近年来,机器学习领域的深入发展为解决运维难题带来了曙光。Web服务场景拥有海量的运维数据,而机器学习算法善于在海量数据中自动学习和挖掘规则。因此,本研究通过机器学习算法来解决实际Web服务运维场景中模块间异常调用轨迹难以检测和异常模块根因难以定位的问题,进而提高运维中故障发现与根因定位的效率。本文的主要研究内容及创新点如下:(1)模块间调用轨迹异常检测。针对Web服务中模块间异常调用轨迹难以检测的问题,本研究提出了基于深度学习的调用轨迹异常检测算法:Trace Anomaly。该算法通过深度贝叶斯网络学习调用轨迹的正常模式,然后基于学习到的正常模式实现了对异常调用轨迹的精准检测,进而提高故障发现效率。Trace Anomaly已经应用在微众银行公司的18个线上Web服务中,线上及线下实验均表明,Trace Anomaly的召回率和精确率都在0.97以上。研究成果已经建立了Git Hub开源项目。(2)模块中根因机器自动定位。针对Web服务中异常模块的根因机器难以定位的问题,本研究提出了根因机器自动定位算法:Flux Rank。该算法通过核密度估计和聚类算法快速分析并提取机器监控指标的异常模式,然后基于提取的异常模式推荐出根因机器的排名。使用来自百度公司的70个真实故障数据对Flux Rank评估后,结果表明,其中55个故障的根因机器排名第一,66个故障的根因机器位列前三。Flux Rank已应用于7个线上Web服务,经过三个多月的线上运行,Flux Rank对59个线上故障进行了诊断,其中55个故障的根因机器排名第一。(3)机器中根因指标自动定位。针对Web服务模块中单个异常机器的根因监控指标难以定位的问题,本研究提出了根因指标自动定位算法:Flux Infer。该算法通过构建加权无向依赖图去表示监控指标之间的依赖关系,然后基于依赖关系图推荐出根因指标的排名。使用开源系统对Flux Infer评估后,其推荐结果中Top3和Top5的准确率分别达到了0.90和0.95。
其他文献
学位
学位
收支业务作为单位牵涉部门最多、流动性最强的一项业务,是保证单位正常运转的基础。近年来,“三公”经费的公开已成为社会热点,加上已被民众广泛认同的“阳光财政”“透明政府”等一系列新理念的提出,公民要求“知情权”的意愿越来越强烈,这也体现着我国公民法律意识的增强,以及建设法治中国法治社会取得初步进展。无论是事业单位自身的要求,还是大众对事业单位收支的关注,事业单位都应该加强收支业务内部控制建设。本文以地
洪水灾害是当今社会危害经济发展和人口安全的主要自然灾害之一。受国土地貌、气候等条件影响,我国洪水灾害问题十分突出,防洪减灾始终是水利工作的主要目标之一。洪水预报作为防洪决策的重要参考,理论研究和生产应用一直是水利科学研究的重点。如何准确的模拟流域洪水传播和淹没情况,是洪水预报工作的重要课题。水文模型和水力模型是洪水预报系统的核心组成。本研究实现了以扩散波方程为核心的分布式物理水文模型,可以描述降雨
近年来,随着拓扑量子物态的发现,拓扑物态和二维材料的结合使整个物理和材料领域迎来了新的机遇。在层状材料领域以往的研究主要集中于材料结构、电子、自旋、谷电子学,以及电荷密度波(CDW)和超导等,然而对其拓扑性质鲜有涉及。本文着重研究了过渡族金属硫族化合物(TMDCs)中1T’相MoTe2和1T相的PtTe2、Pt Se2的拓扑性质,以及单硫族化合物SnSe和CuTe的能带结构及其调控。主要研究成果如
学位
实现可持续城市化目标迫切需要城市科学指导,复杂性理论为城市科学带来新的研究范式。城市标度律,又称为城市异速标度律,定量描述城市各要素与人口规模之间的幂律规律,其背后理论机制可用于理解城市组织及演化,因此城市标度律研究受到多学科的广泛关注。本文在复杂性理论视角下,深入研究城市标度律的关键因素(包括城市边界定义、标度律计算方法)和定量应用分析模型,主要工作和研究成果如下:(1)自然城市边界提取:城市边
具有分级结构的BN纳米薄膜展现了优异的超疏水性,但由于该薄膜的制备过程复杂、成本昂贵,不适宜大规模的生产和应用。与之相比,基于疏水BN粉体的超疏水涂层的应用将更为便捷。本研究采用镁热还原氮化燃烧合成法结合酸洗工艺制备了疏水的单相BN粉体,水接触角为(144.6±2.4)°,疏水性可以归因于BN粉体颗粒具有的微纳分级结构。在此基础上,以这种燃烧合成的疏水BN粉体为填料制备的BN/氟硅树脂复合涂层进一