跳到主要内容

告警分析

在告警分析“告警分析”模块,您可以根据业务需求设置告警规则、告警指标和告警推送方式,以便及时监控线上版本和场景的性能波动情况。 您可以从0到1新建告警规则,设置详细的告警信息、指标和推送模式。您也可以通过告警模版管理,基于业务告警模版快速创建告警。在告警配置列表,你可以设置告警规则的生效状态。在告警历史模块,你可以查看项目近期的告警趋势、告警数组成及告警明细数据。

1. 新建告警规则

点击“新建告警规则”按钮进入创建页。 Alt text

1)步骤一:配置告警规则

表单填写说明如下

  • 基本信息
表单字段描述
指标类型默认支持基础性能指标类型
告警类型展示筛选条件下的小时级流水数据
告警平台默认选择当前平台,不同平台告警规则不互通
告警名称告警名称,可自定义设置
失效时间告警规则的失效时间,需要手动设置
最小对局数可选,设置告警触发最小对局数,对局数低于设置值暂不触发告警
任务执行间隔设置多久执行一次告警检测任务
指标统计时间段统计指标值的时间范围,如设置最近1天,则执行告警检测时统计最近一天的数据
  • 筛选条件 设置告警检测的版本、场景、机型和设置项。版本和场景为必选,机型和设置项默认选择全部。
  • 告警规则
表单字段描述
告警规则选择同时满足所有规则还是任意满足任一规则的判定逻辑,默认同时满足所有规则
告警指标选择不同告警指标、同比/环比/数值的波动判定规则。变化阈值可以设定为数值,也可以设定为变化比例。你可以通过“AI阈值推荐”功能自动设置告警阈值
告警分组告警分组默认关闭,开启后对筛选条件下的数据进行分组告警,任意分组满足条件都会产生告警
  • 告警预览 点击告警预览后,你可以实时预览过去一段时间的真实指标趋势和告警触发情况,左上角切换不同规则进行预览查看。

Alt text

1)步骤二:告警通知配置

表单填写说明如下:

表单字段描述
告警推送语言设置告警推送语言为中文或英文,默认为中文告警
推送条件默认设置仅有告警时推送消息,可以切换为按检测时间均推送
生效时段默认全时段生效,可指定生效时段
接收邮件告警(可选)输入用于接受告警的邮箱,多个邮箱之间用英文分号分隔
通知机器人Webhook支持企业微信/钉钉/飞书/Slack的机器人Webhook地址配置,企业微信支持填写需要at的用户
简报类型支持文字告警和图片报表告警
  • 发送测试告警 完成告警配置后,支持发送测试告警,以确认告警方式配置成功.

Alt text

2. 告警模版管理

你也可以将告警配置另存为告警模版,后续可直接通过模版快速创建告警。你可以在告警配置列表中对告警模版进行管理。 Alt text Alt text

3. 告警配置列表

在告警配置列表中,你可以查看项目历史创建的告警及其基础信息,以及单条告警规则的告警日趋势。在操作栏,您可以设置告警的生效状态,克隆、编辑和删除告警,也可以查看单条告警的操作记录。 Alt text

4. 告警历史

在告警历史模块,您可以查看项目全平台当天告警数,近24h和近30天总告警趋势。

1)告警数列表

告警数组成列表,您可以按照时间倒序查看最近触发的告警规则及条数。 Alt text 列表中点击单条触发告警的条数或规则内容都可以进入规则告警详情页。

2)告警详情页

可查看单条告警规则的告警趋势和详情对局数、指标和指标差值。 点击“查看全部告警数”可查看该规则对应的历史触发全部告警。 点击“性能分析”可跳转查看性能分析页深入分析告警原因。 Alt text