从原始告警洪流 → 去重 → 收敛 → 风暴抑制 → 关联根因,
OpsDash 用四层算法把噪音降低 80%+,让运维团队聚焦真正的问题。
告警从产生到通知,经过 4 层算法过滤,每层有明确的职责和可调参数
相同事件重复触发时不产生重复记录,从根本消除告警噪音。
滑动窗口内同设备同类型告警合并,更新计数器而非新建。
告警突发超过阈值即识别为风暴,抑制期内只发一次通知。
沿拓扑链路遍历,同一故障引发的所有下游告警归入同组。
同一事件多次触发时只保留一条;监控重试 / 网络抖动 / 多源重发都不会污染告警列表
一台设备 CPU 抖动在 5 分钟内连续触发 8 次告警 → 合并为 1 条,notify 仅发一次
当告警产生速度异常(某设备 5 分钟内超过 10 条),自动识别为风暴,10 分钟内新告警被标记不再通知
利用拓扑关系,以故障根因为起点遍历下游链路,自动将同一故障引发的告警归入同一组
在告警规则页面可视化配置,支持设备/软件/自定义指标,覆盖全部 16 种监控协议
4 渠道并发分发 + 自动重试,保证故障告警第一时间触达决策者
从确认到解决的完整生命周期,系统自动维护数据的时效性
一眼把告警中心的所有关键指标记在心里