IT资讯 社区新知 | MindSpore 社区健康监测服务上线!

trayvon · 2021-08-17 15:30:05 · 热度: 5

社区新知 | MindSpore 社区健康监测服务上线!

概述

随着社区不断发展壮大,参与社区的开发者和上线的越来越多,社区服务的健康监测也愈发重要,为了保证社区用户体验,及时响应服务异常事件,MindSpore社区最近上线了基于UptimeRobot的社区基础设施健康监测服务,Uptimerobot是时下比较流行的服务监测解决方案提供商,他支持Http(s)、Port、Ping、CronJob等多种监测手段,同时也支持邮件,短信,电话,Slack等多种提醒方,甚至还支持自定义服务展示界面和自定义域名,由于服务轻量,配置简单易用,目前已有包括GoDaddy,NASA,IBM,RockyLinux等在内的超过150万用户在采购使用

社区新知 | MindSpore 社区健康监测服务上线!

详请

通过点击社区官网底部的服务状态菜单项,就可以进入MindSpore社区的服务监测展示页面,这里我们可以看到服务监测的汇总。首先映入眼帘的就是服务的整体状态指示灯,当我们存在异常服务时,指示灯会变为黄色,而且会告知异常的具体服务以及持续时间。

社区新知 | MindSpore 社区健康监测服务上线! 社区新知 | MindSpore 社区健康监测服务上线!

接下来便是具体监控服务的状态和历史事件数据,每个服务的一个矩形代表一天,颜色从绿到红代表服务该天的平均健康度,我们也可以点击进去查看服务的历史总详情, 这里会包含更多细节,包括最近24小时/7天/30天/90天的服务可用率,以及响应时间曲线图,服务历史异常事件等。

这些数据对帮助我们识别问题并持续改进非常重要, 举一个栗子,在我们监测服务上线后,运维人员发现社区邮件列表会定期出现访问延时抖动,甚至是502(Bad Gateway)错误,通过对该服务的调用链分析,最终识别到上游社区Web框架在特定情况下会出现工作进程概率阻塞的问题。类似的还有隧道连接不稳,网关配置文件重加载失败导致代理失效等问题,通过监测告警推动社区服务可用性不断优化,进而保障用户和开发者的社区体验

社区新知 | MindSpore 社区健康监测服务上线!

目前整个社区包含的基础设施服务都已经加入监控列表:

社区新知 | MindSpore 社区健康监测服务上线!

另外,监测服务也支持消息订阅,如果你对社区基础设施感兴趣,你可以通过点击右上角的铃铛图标添加邮箱订阅,这样关于任何基础设施的维护,告警等信息都会第一时间推送给你。

社区新知 | MindSpore 社区健康监测服务上线!

后记

MindSpore作为国内开放活跃的AI社区,社区内开发者和用户一直是我们关注的重点,我们也在持续不断的打造产品,提升体验,如果你对AI,开源感兴趣欢迎加入MindSpore社区(https://mindspore.cn/)。

猜你喜欢:
暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册