|
|
51CTO旗下网站
|
|
移动端

2.4.3 群集运行状况报告诊断分析(2)

《Microsoft Azure 管理与开发(下册)平台服务PaaS》本书由世纪互联蓝云Microsoft Azure 开发技术支持团队的资深工程师们编写,主要阐述MicrosoftAzure PaaS 服务的开发应用,涉及计算服务、集成认证服务、数据存储服务、大数据服务等方面的内容。本节为大家介绍群集运行状况报告诊断分析。

作者:世纪互联蓝云公司来源:电子工业出版社|2018-07-12 18:29

2.4.3 群集运行状况报告诊断分析(2)

5. 分区系统运行状况报告

创建分区状态。System.FM 是管理分区的主要服务,当创建分区且成功创建后,System.FM 会报告正常的运行状况。当删除分区时,它会通知删除相应的信息。如果分区的数量小于目标副本的计数,而大于最小的副本计数,System.FM 报告警告的运行状况;如果低于最小副本计数或者创建分区失败,则会报告错误的运行状况,这时就需要人工干预去排查具体原因,其他一些情况也会触发警告信息,例如:构建服务超过预期的值。该情况运行状况报告内容见表2.4.3-7。

表2.4.3-7

副本冲突约束。System.PLB 检测到副本约束冲突,导致无法在分区创建副本,则会报告警告的运行状况。因为这种情况是副本发生约束冲突,但并不会影响主副本的运行和提供服务,所以发出警告级别的报告,管理人员需要根据这些信息,改进服务的分区设计。该情况运行状况报告内容见表2.4.3-8。

表2.4.3-8

6. 副本系统运行状况报告

副本状态。System.RA 表示重新配置代理组件,是用于处理副本状态的主管组件。该情况运行状况报告内容见表2.4.3-9。

表2.4.3-9

副本打开状态。此运行状况报告描述副本打开的状态,也记录了API 调用的开始时间。如果副本打开时间超过配置时间内打开(默认30 分钟),System.RA 就会发送警告的报告;如果影响了服务可用性,系统会以更快的速度发送报告(默认30 秒);如果打开完成,则发送正常的报告。该情况运行状况报告内容见表2.4.3-10。

表2.4.3-10

服务API 调用缓慢。如果对用户API 服务的调用超过配置的时间,则System.RAP 或者System.Replicator 会报告警告的运行状况;当调用完成时,警告就会被清除。一般出现这种情况的原因是应用服务出现了异常,导致服务启动出现了问题。在后续调查该问题时,需要在本地多次尝试调试服务。该情况运行状况报告内容见表2.4.3-11。

表2.4.3-11

复制队列已满。如果复制的队列已满,则System.Replicator 会发送警告的运行状况报告。在主副本上,由于一个或者多个辅助副本需要确认操作,所以通常会发生这种情况;在辅助副本上,当服务应用操作速度较慢时,通常也会发生这种问题。当队列不再慢时,警告就会被清除。该情况运行状况报告内容见表2.4.3-12。

表2.4.3-12

命名操作速度慢。System.NamingService 是负责注册和发现服务的主要服务。当NamingService 操作应用服务发生超时时,System.NamingService 就会报告主副本的运行状况。例如CreateService 和DeleteService 都是NamingService 的操作示例,当这些操做出现超时现象,NamingService 就会针对该服务的主副本发送警告的报告;如果操作过程完成时出现错误,则会升级为错误级别的报告;如果正常完成,警告的报告将被清除。每个命名操作失败的原因都可能不相同,在分析时,需要针对具体节点上报告服务相关的日志信息进行排查。该情况运行状况报告内容见表2.4.3-13。

表2.4.3-13

7. 已部署应用系统运行状况报告

System.Hosting 是已部署应用和服务的主管服务,它负责管理和监控已部署应用程序和服务的运行状态。

激活状态。当应用程序激活时,如果正常激活,System.Hosting 会发送正常的报告;如果出现异常情况,System.Hosting 会发送错误的报告,并将异常信息写在报告的描述中。一般应用程序激活失败是由于应用程序配置或者服务配置导致。后续分析问题时,可以依据错误信息进行排查。该情况运行状况报告内容见表2.4.3-14。

表2.4.3-14

节点下载应用失败。在激活应用程序包之前,节点需要下载对应的应用程序包,如果这时出现问题,会发送错误的运行状况报告。如果遇到该类错误,可尝试重新操作;如果重新操作依然报错,建议联系技术支持。该情况运行状况报告内容见表2.4.3-15。

表2.4.3-15

升级验证。如果进行应用或者服务升级时,在升级验证过程中发生错误,System.Hosting会发送错误的运行状况报告,并在描述中描述具体的错误信息,一般这种情况是由于应用程序包的配置问题导致。该情况运行状况报告内容见表2.4.3-16。

表2.4.3-16


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

网管员必读——故障排除

本书是《网管员世界》杂志社推出的一本集知识性和实用性于一身的网络管理技术书籍,书中收集了《网管员世界》自创刊以来“故障诊断”栏目中...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊