平台使用说明

创建报警

1 基本信息

创建报警首先要填写报警基本信息,如下图所示:

  • 产品分类:可创建传统互联网及移动互联网的报警任务。
  • 任务类型:根据需求进行任务类型选择。

  • 报警类型:根据需求选择对应任务的类型。

1、应用性能:

  • 监测点维度:根据监测点所测试的数据进行错误统计;
  • 目标主机维度:以博睿监测点数据反推出主机对各地支持覆盖效果;
  • 任务域名维度:测试页面中,按域名错误进行统计;

2、访问错误:根据访问错误进行错误统计, 访问错误报警主要是从访问错误方面的数据进行报警,访问错误必须同应用性能中的一种同时配置,不能单独配置访问错误报警;

3、网站劫持:DNS劫持及页面篡改信息的统计;

4、内容同步:CDN更新通过报警方式进行呈现;

  • 注:内容同步配置方法:在监测任务列表中选择回源的任务,在CDN 对比中的比较任务里选择CDN 的任务。之后在CDN 对比中的Header 里设置需要对比的Header 信息,通常使用Last-Modified 或/和Etag进行对比,多个值之间使用英文逗号进行分隔。当CDN 任务中元素的ResponseHeader中的Last-Modified或/和Etag与源站中对应的值不同时会发出CDN 更新报警。

  • 任务列表:把需要配置报警的任务添加至右框内;(可以选择多个任务,进行批量创建,但要求所有报警参数相同)

  • 报警名称:对该报警进行名称设定,但不支持特殊符号。

2 报警规则

报警规则为报警汇总、计算时遵守的一定规则,如下:

  • 样本范围:样本范围就是配置采样的时间段。设定取多久时间段内的数据进行报警计算,最小采样周期为当前配置的监测任务设定的监测周期,即一倍任务周期时间段。(采样范围只影响取数据范围,不影响报警邮件发送的频率,邮件的发送最高频率维5分钟,报警也是5分钟计算一次;1分钟频率任务,报警1分钟计算一次)

例如,当前报警设定的监测任务的监测周期为60 分钟,则最小采样范围为60 分钟;若配置的样本范围是“2倍”,则采样范围为120分钟;

  • 样本数阈值:每个城市运营商(域名、主机)的样本数达到此值时,触发报警;
  • 样本比例:默认设置为50%,当本周期样本数达到这个比例时,开始计算报警;
  • 数据筛选器:可选择用户预先保存的筛选器,依据筛选后的数据进行判断(也可以重新创建)
  • 监测点范围:可选择“全部”城市报警也可以具体到“详细”城市报警,详细代表着可以逐个选择城市;
  • 计算方式:

1)按全部样本平均值计算:全部样本的平均值进行平均后进行统计

2)按样本所在城市运营商分别计算:每一个城市运营商取平均值,并跟配置的阈值进行比较,达到配置的城市运营商个数后触发报警;

  • 报警间隔:就是第二次及以后的报警时间设置(距离下次报警时间间隔,如果空白或0,默认为报警间隔为240分钟)

如果报警计算时一直没有触发报警解除条件,默认是间隔240分钟后发送第二次报警信息,说明问题或故障仍然存在;同时也防止客户在短时间内收到过多重复性通知。

如果我们收到报警解除信息,不会发送第二次报警信息但有日志记录,说明问题或是故障已经恢复。

  • 补偿测试次数:达到触发报警条件时,进行的补偿测试次数;

例如:如果补偿测试设置为1次,这一次的测试结果会混合到相应的周期中,如果配置是按总体报警,则会一起计算平均值,若还是达到报警条件则进行报警。

注:补偿测试实际上就是这任务多做了几次,测试数据记录到散点图中,补偿测试是为了验证该监测网站是否出现了故障,而非验证是否是监测点异常,导致出错的。

5次补偿,是针对一个报警周期内的,一个触发了报警的城市运营商(不光是错误点还可以是其他选定节点)进行补偿测试

  • 解除报警通知:通过该项可设定报警条件解除后是否进行通知;

  • 报警语言:中文、英文两种选择,供用户根据需要进行选择。

3 报警条件

3.1 应用性能

报警条件是设置报警计算时各个指标需要触发的级别、指标的阈值,以及必要条件,如下图:

阈值报警支持静态阈值和动态阈值两种类型。

  • 静态阈值:所谓静态阈值是指监测任务的数据与用户设定的报警阈值进行比较,如果超过报警阈值,则满足该报警条件;
  • 动态阈值:所谓动态阈值是指当前监测数据与之前数据(如昨天,上周当天,上月当天,上周,上月等)的平均数值进行比较,如果超过之前时间平均数值+用户设定阈值,则满足该报警条件。例如用户设定动态阈值,对比时间为昨天,整体性能大于2s,则该项表示如果当前监测的整体性能大于昨天平均整体性能+2s,则满足该报警条件;

  • 技术指标:根据需求添加或删除触发报警的指标项;

  • 必要条件:必要条件为复选框,选择必要条件时,代表着必须触发该指标时才会报警,例如:首屏用时大于2s选择必要条件,若整体性能到达报警条件,而首屏用时未达到2s时,不报警;

  • 错误:根据需求进行错误元素个数及可用性进行添加及删除。

  • 错误类型:

全部:代表全部错误进行设定;

自定义:根据需求进行设定。

3.2 网站劫持

  • 劫持比例:劫持比例是指当监测次数中发生的劫持达到该比例时触发报警,例如:
  • 劫持报警周期:劫持报警周期是指劫持报警发送周期,这个值只对劫持报警有效。劫持报警周期配置的是多少,该报警的发送频率就是多少。
  • 监测节点范围:监测节点范围是指针对哪些监测点的数据进行报警,支持全部和自定义。(注:如果配置的有数据筛选器,会先按监测节点去查数据,然后才会按数据筛选器过滤数据)
  • 选择全部时,会对所有的监测点的数据进行统计,看是否达到报警条件。
  • 选择自定义时(即:选择详细时),是指对选中的那部分监测点的数据进行统计(没选择中的监测点的数据不统计在内),看是否达到报警条件。
  • 解除报警通知:通过该项可设定报警解除后是否进行通知。比如:采样周期是30分钟,并配置了解除报警通知;第一个30分钟发生了报警,第二个30分钟发生了报警,第三个30分钟也发生了报警,但是第四个30分钟没有发生报警,那这时要给客户发送解除报警的通知。

3.3 内容同步

对比任务是配置对比的任务,只有在报警类型选择“内容同步”时,才会出现;并且,选择“内容同步”后,只能配置对比任务,以及用于对比的header属性,不能配置其他的性能指标和错误指标。如下图所示:

“内容同步”报警的报警条件中只有“header”和“对比任务”两项配置,任务中元素的ResponseHeader中设置的header值(如:Last-Modified或Etag)与源站中对应的值不同是会发出CDN 更新报警。

  • Header:设置需要对比的Header 信息,这里填写的是header中的属性名。通常使用Last-Modified 或/和Etag进行对比,多个值之间使用半角类型的分号进行分隔。

  • 对比任务:选择用于报警任务的源站任务,只能选择一个对比任务。

4 报警方式

报警方式中来设置报警的通知方式、通知时间段等。

  • 可配置邮件报警和短信报警两种形式,每种形式可按照普通级别和严重级别分别设置不同的邮箱或手机号码。

  • 其中,除默认设置外,每项中还设有自定义配置,邮件报警的自定义配置中可设置使用用户自己的STMP地址,邮件服务器用户名和密码发送报警邮件,短信报警的自定义配置中可由用户设置使用自己的短信网关发送报警短信,并可以在短信报警开始时间中设置报警短信发送时间段,设置后则只在该时间段发送报警短信。

  • 钉钉报警为钉钉机器人的自定义通知功能,设置时可以将钉钉讨论组的自定义机器人的token填入其中,这样钉钉讨论组就可以收到报警通知了,通知格式同邮件中报警通知基本信息相同。