关于故障的发现

关于故障的发现

课程中,我们都是通过手动stop的方式模拟宕机场景,有一个疑问是,如果在生产环境中,那么多机器,那么多中间件同时在运行,怎么能非常及时的知道哪个节点宕机了,从而做到快速修复呢?因为就算做了高可用,如果宕机的节点不能够及时发现,系统的可用性就会逐步降低的.

正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

1回答
风间影月 2020-05-26 14:51:39

这个就涉及到运维了,一般来说线上环境如果出不类似现象会通过邮件和短信主动发送给相关人员的。

  • 提问者 红嘴鲤鱼 #1
    老师,关于这一块运维监控系统的搭建,维护方面的知识,属不属于架构师的能力要求范围内的呢,还是说是运维人员自己负责的.比如说,到了一家初创的公司,需要搞一套监控,结果作为系统架构不会,或者不熟,会不会有问题.
    2020-05-26 15:15:18
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师