功能特性

三引擎统一监控、AI 原生运维、智能告警、远程批量执行、IoT 全栈管理 —— 一个平台覆盖全部运维场景

三引擎统一监控架构

一个平台聚合三大监控引擎,覆盖传统 IT 基础设施、IoT 工业设备与统一时序存储,消除监控孤岛

Zabbix 7.0

传统 IT
  • SNMP / ICMP / SSH / IPMI
  • WMI / JMX / HTTP / TCP
  • 10 类设备类型全覆盖
  • Proxy 分布式多级部署
  • TLS / PSK 加密通信
  • 自动注册与模板绑定

企业级传统 IT 监控引擎,支持 Proxy Group 高可用架构,离线安装包覆盖 15 种操作系统平台

EMQX 5.8

IoT / 工业
  • MQTT / CoAP / Modbus
  • 物模型与遥测管理
  • 地理围栏引擎
  • OTA 固件升级
  • 网关→子设备拓扑
  • 设备心跳自动检测

海量 IoT 设备并发接入,Rule Engine 实时数据路由,HTTP Auth 统一认证,支持设备控制下发与批量配置

VictoriaMetrics

时序存储
  • PromQL 原生查询
  • 高基数高性能写入
  • 90 天历史数据存储
  • 毫秒级查询响应
  • 自动注入 customer_id
  • CPU / 内存 / 磁盘一站查询

统一存储 Zabbix 与 IoT 全部时序数据,资源利用率 Top N、趋势分析、健康热力图均由 PromQL 驱动

AI 原生运维

从第一行代码起就为 AI 智能体设计,内置 MCP Server 让 Claude Code、Cursor、OpenClaw、Hermes Agent 等 AI 助手直接以自然语言执行运维操作

MCP Server

189 个标准化工具

189 个 MCP 工具

跨 17 个模块:设备、告警、监控、远程运维、IoT、凭据、Proxy、IPMI、标签、审计等全栈覆盖

6 个核心工作流

故障排查 / 每日巡检 / 扫描纳管 / 批量导入 / 风暴处置 / 拓扑构建 —— 预置 Prompt 开箱即用

两步审批安全模型

所有写操作采用 prepare → confirm 机制,AI 不会静默执行危险操作,5 分钟确认过期

11 个实时 Resources

运维概览、活跃告警、系统健康、IoT 总览、待审批任务等实时上下文,AI 自动订阅获取

"北京机房有哪些严重告警?" —— AI 直接查询并返回结果,无需切换界面。
OpsDash AI 智能体对话

智能告警引擎

从原始告警到人工介入,自动完成去重、收敛、关联分析与升级通知,告警噪音降低 80%+

OpsDash 告警管理
告警聚合

四层智能降噪

收敛去重

时间窗口内相同来源的重复告警自动合并,计数聚合,只展示一条有效信息

风暴抑制

单设备告警超过阈值时自动触发风暴模式,抑制后续同类告警,避免通知轰炸

关联分析

BFS 拓扑遍历自动发现级联故障链,同位置设备关联分组,快速定位根因

升级策略

30 秒轮询调度引擎,告警超时未响应自动按策略升级通知:邮件 → 钉钉 → 飞书 → 企业微信

多通道通知

邮件 / 钉钉 / 飞书 / 企业微信四通道并发推送,3 次自动重试,独立数据库会话防阻塞

远程运维中心

SSH 批量执行、脚本库管理、配置备份、IPMI 管理、多厂商 CLI 适配 —— 全面覆盖远程运维场景

批量命令执行

SSH 并发连接,实时 WebSocket 输出流,虚拟滚动大输出(>32KB 自动文件存储),支持分页读取与全文搜索

脚本库管理

参数化模板渲染,6 种参数类型(字符串/数字/布尔/选择/密码/多行),导入导出,版本管理

配置备份

SHA-256 去重存储,配置变更审计日志,Monaco Editor Unified Diff 对比,一键回滚

IPMI 管理

远程电源开关机/重启/PXE 引导,传感器读数实时采集,系统事件日志(SEL)查询,FRU 资产信息

多厂商 CLI 适配

内置 10 大网络厂商驱动:华为 / H3C / Cisco IOS / Cisco NX-OS / Juniper / 锐捷 / Fortinet / PaloAlto / MikroTik / Aruba

执行策略引擎

滚动执行 / 金丝雀发布 / 分组执行,失败阈值自动暂停,高危命令 11 条内置规则风险评估 + 审批拦截

工作流编排

DAG 拓扑排序多步骤流水线

条件分支 / 变量传递 / 步骤依赖 / on_failure 策略 —— 将复杂运维操作编排为可复用的工作流模板。支持暂停、恢复、取消,实时 WebSocket 推送执行进度。

OpsDash 远程运维

IoT 全栈管理

从设备接入到数据可视化,从告警模板到固件升级,构建完整的 IoT 运维闭环

EMQX 深度集成

六大 IoT 核心能力

物模型管理

telemetry_specs 定义遥测指标规格,services_schema 定义控制服务接口,5 个预置环境监测模型开箱即用

遥测数据可视化

ECharts Gauge 仪表盘按物模型动态渲染,越限自动变红;历史折线图 PromQL 驱动,支持多指标叠加

地理围栏引擎

圆形(haversine)和多边形(ray casting)双算法,GPS Webhook 实时检测,进出围栏自动触发告警

OTA 固件升级

固件版本管理,OTA 任务创建与进度跟踪,MQTT 通知设备拉取更新,支持批量推送

网关拓扑

gateway_device_id 自引用 FK 构建网关→子设备树形拓扑,可视化展示设备层级关系

数据质量看板

完整度 / 及时性 / 越限比例三维雷达图,实时评估 IoT 数据健康度,异常数据自动标记

OpsDash IoT 监控 OpsDash 地理围栏

网络发现与企业安全

自动发现网络中的设备与服务,结合企业级 RBAC、SSO、审计日志,构建安全运维基座

网络发现

自动扫描

IP 段 / 子网扫描,SNMP / ICMP / TCP 多协议探测,Proxy 模式支持跨网段发现

设备指纹

TTL OS 探测 + SNMP sysDescr 解析 + 端口组合识别,自动判断设备类型

服务检测

开放端口扫描,服务类型自动识别,推荐监控模板匹配

智能纳管

扫描结果一键审批纳管,自动类型推断,批量绑定模板,MAC/IP 去重校验

企业安全

RBAC 5 级角色

admin / engineer / viewer / dept_engineer / dept_viewer,65 权限 × 20 资源维度,部门级隔离

SSO 单点登录

飞书 / 钉钉 / 企业微信三大平台 OAuth 集成,一键登录无缝衔接

审计日志

全操作审计记录,自动捕获 HTTP 上下文回填,RequestID 全链路追踪

凭据保险库

Fernet 加密存储,10 种凭据类型,智能匹配推荐,连通性测试,作用域继承(全局→子网→设备类型→设备)

操作回滚

OperationSnapshot 30 天自动过期,关键操作一键撤回,支持设备/软件/告警规则回滚

5 分钟开始监控

Docker 一键部署,免费支持 20 台设备

立即开始