MCP 工具目录

189 个标准化 AI 工具,覆盖全栈运维能力

189 个工具,覆盖 21 个模块

认证与系统

4
工具名称描述
authenticate登录认证,使用 API 密钥连接 OpsDash
whoami查看当前身份、角色、权限列表及 MCP Server 运行统计
confirm_action执行待确认的写操作(两步审批的第二步)
list_pending_confirmations查看所有未过期的挂起操作列表

仪表盘与概览

11
工具名称描述
get_dashboard_overview全局概览:设备统计、客户列表、实时告警
get_ops_briefing运维简报:系统概览 + 未解决告警 + 7 天趋势 + CPU Top 5 + SLA
get_customer_overview客户运维全景:客户信息 + 设备列表 + 未解决告警
get_system_health监控引擎健康:Zabbix / EMQX / VictoriaMetrics 连通状态
get_sla_overviewSLA 效能概览:MTTA / MTTR / 达成率
update_sla_targets更新 SLA 目标(MTTA / MTTR 分钟数,支持全局 / 部门 / 级别)
get_resource_topn资源利用率 Top N(CPU / 内存 / 磁盘)
get_resource_trend全局资源趋势(指定指标的平均利用率变化)
get_health_heatmap设备健康热力图(按部门 / 类型 / 位置分组)
get_ops_calendar运维事件日历:维护窗口、重大告警、变更事件
get_mcp_statsMCP Server 运行统计:启动时间、工具数、活跃会话数

设备管理

17
工具名称描述
search_devices搜索设备(模糊匹配名称 / IP / 主机名 / MAC / 序列号)
get_device_detail设备详情:关联客户、已安装软件、链路关系
diagnose_device设备健康诊断:设备信息 + 指标 + 未解决告警
create_device创建设备(自动同步到 Zabbix)
update_device修改设备信息
delete_device删除设备(级联删除关联软件和链路)
batch_tag_devices批量打标签
assign_device_proxy指定设备监控代理(Proxy)
get_device_sla查询设备 SLA 指标
get_device_location获取设备 GPS 位置
export_devices导出设备列表(CSV / Excel)
import_devices_preview导入预览:校验 + 去重 + 冲突检测
import_devices_confirm确认导入设备
execute_ssh_commandSSH 远程命令执行(单台设备)
search_all全局搜索:同时搜索设备、软件、部门、告警
device_batch_action统一设备批量操作(推荐入口,delete/update 二合一)
device_lifecycle_action统一设备生命周期操作(推荐入口,decommission/restore 二合一)

软件资产

7
工具名称描述
list_software查询软件列表(按设备 / 类型 / 状态 / 客户筛选)
create_software添加软件记录
update_software修改软件信息
delete_software删除软件记录
list_software_dependencies查看软件依赖关系(依赖了谁 + 被谁依赖)
add_software_dependency添加软件依赖关系
remove_software_dependency删除软件依赖关系

告警处理

14
工具名称描述
list_alerts查询实时告警(按级别 / 来源 / 已解决状态筛选)
get_alert_detail告警详情:完整字段含级别、消息、触发时间、来源
get_alert_trend告警趋势:按天按级别统计(1-30 天)
get_alert_trend_detail告警趋势明细数据
diagnose_alert告警诊断报告:告警 + 设备 + 指标 + 关联告警
batch_diagnose_alerts批量告警诊断
get_root_cause_hint获取告警根因分析提示
list_alert_correlation_groups列出告警关联组(同一级联故障归为一组)
get_correlation_group_detail关联组详情:组内告警 + 根因分析
batch_resolve_correlation_group批量解决关联组内所有告警
list_alert_exclusions列出维护窗口排除规则
create_alert_exclusion创建维护窗口(时间段内告警自动标记排除)
delete_alert_exclusion删除维护窗口
alert_action统一告警写操作(推荐入口,单条/批量 × 确认/解决 四合一)

告警规则

5
工具名称描述
list_alert_rules查询告警规则列表
create_alert_rule创建告警规则(指标名 + 阈值 + 持续时间)
create_alert_rule_from_template从模板创建告警规则
toggle_alert_rule启用 / 禁用告警规则
delete_alert_rule删除告警规则

客户 / 部门管理

5
工具名称描述
list_customers查询客户 / 部门列表
get_customer_detail客户详情:关联设备和软件统计
create_customer创建客户 / 部门
update_customer修改客户信息
delete_customer删除客户(级联删除关联设备和软件)

扫描发现

10
工具名称描述
list_scan_tasks查看扫描任务列表
create_scan_task创建扫描任务(子网列表 + 可选自动纳管)
run_scan_task启动扫描任务
get_scan_task_status查看扫描进度
cancel_scan_task取消运行中的扫描任务
list_discovered_devices发现设备列表(按状态 / 任务 ID 筛选)
approve_discovered_device纳管发现的设备
batch_approve_devices批量纳管发现的设备
reject_discovered_device拒绝发现的设备
probe_ip探测单个 IP(SNMP / 端口 / OS 识别)

监控查询

3
工具名称描述
query_metricsPromQL 监控查询(瞬时 / 范围查询)
list_metric_names列出可用监控指标名称
list_templates统一模板查询(OpsDash + Zabbix 合并)

拓扑与链路

5
工具名称描述
get_topology获取拓扑图数据(节点 + 连线)
list_device_links查询设备链路关系
create_device_link创建设备链路(主链路 / 备份链路)
delete_device_link删除设备链路
analyze_impact故障影响分析(BFS 拓扑分析下游设备和软件服务)

通知与升级策略

7
工具名称描述
list_notification_configs查询告警通知配置列表(邮件 / 钉钉 / 飞书 / 企微)
create_notification_config创建告警通知配置
update_notification_config更新通知配置
delete_notification_config删除告警通知配置
test_notification测试通知发送
list_escalation_policies列出升级策略
create_escalation_policy创建升级策略

远程运维

25
工具名称描述
list_remote_jobs查询远程任务列表(按状态 / 类型筛选)
get_remote_job_detail远程任务详情:各设备执行状态 + 重试链
get_target_output获取设备执行输出(stdout / stderr)
execute_remote_command批量执行远程命令(SSH / CLI 多设备并发)
execute_remote_script批量执行脚本(从脚本库选择)
get_job_batches查询任务批次详情(滚动 / 金丝雀执行进度)
list_remote_scripts查询脚本库列表(分类 / 设备类型 / 关键词)
create_remote_script创建运维脚本
update_remote_script更新运维脚本
backup_device_config触发配置备份(SHA-256 去重)
list_config_backups查询配置备份列表
get_config_backup_content获取配置备份内容
diff_config_backups对比配置备份差异(unified diff)
get_remote_stats_overview远程运维统计概览(任务数 / 成功率 / 平均耗时)
get_remote_stats_trend任务趋势(按天统计)
get_remote_top_scripts最常用脚本排名
get_remote_failure_devices失败率最高设备排名
get_remote_efficiency执行效率分析
list_risk_rules列出风险评估规则(含 11 条内置规则)
create_risk_rule创建自定义风险规则
delete_risk_rule删除自定义风险规则
list_approvals查询审批列表(高风险任务审批记录)
job_approval_action统一远程任务审批决策(推荐入口,approve/reject 二合一)
remote_job_control_action统一远程任务控制操作(推荐入口,pause/resume 二合一)
remote_job_outcome_action统一远程任务终态处理(推荐入口,cancel/retry 二合一)

工作流编排

8
工具名称描述
list_workflows查询工作流列表(模板 / 执行实例)
get_workflow_detail工作流详情:步骤执行状态 + 输出变量
create_workflow创建工作流模板(DAG 步骤定义 + 变量)
update_workflow更新工作流模板
delete_workflow删除工作流
execute_workflow执行工作流(模板自动复制为实例)
cancel_workflow取消工作流及所有未完成步骤
workflow_control_action统一工作流控制操作(推荐入口,pause/resume 二合一)

批量操作

3
工具名称描述
batch_import_devices批量导入设备 + 链路(Web 审批,分阶段执行)
poll_batch_approval查询批量审批单状态
execute_batch_approval执行已审核的批量操作

IoT 设备管理

23
工具名称描述
list_iot_models列出物模型
get_iot_model_detail物模型详情(含 telemetry_specs / services_schema)
get_iot_telemetry_latest设备最新遥测值
get_iot_telemetry_history遥测历史数据(PromQL 查询 VM)
get_iot_dashboard_summaryIoT 概览统计(在线率 / 告警 / 质量评分)
batch_config_iot_devices批量配置下发(按设备 ID / 标签 / 物模型)
list_iot_gateways列出网关设备
get_gateway_children获取网关子设备
add_gateway_child绑定子设备到网关
list_iot_alert_templates列出 IoT 告警模板(含 7 个预置)
list_iot_geofences列出地理围栏
get_geofence_events查询围栏进出事件
list_iot_firmwares列出固件版本
create_iot_firmware上传固件版本
create_ota_task创建 OTA 升级任务
list_ota_tasks列出 OTA 任务
get_ota_task_detailOTA 任务详情
get_iot_data_quality数据质量看板(完整度 / 及时性 / 越限比例)
get_iot_heartbeat_statusIoT 设备心跳状态
bind_device_model绑定或解绑设备的物模型(写操作,需确认)。model_id 为 None 表示解绑
iot_model_action统一物模型 CRUD(推荐入口,create/update/delete 三合一)
iot_geofence_action统一地理围栏 CRUD(推荐入口,create/update/delete 三合一)
send_device_command向 IoT 设备下发控制命令(写操作,需确认)

凭据管理

7
工具名称描述
list_credentials列出凭据(脱敏,不返回密码原文)
get_credential_detail凭据详情(脱敏)
create_credential创建凭据(SSH / SNMP / IPMI 等 10 种协议)
update_credential更新凭据
test_credential测试凭据连通性
recommend_credential智能推荐凭据(按设备类型 / 位置 / 历史匹配)
match_credentials自动匹配凭据(scope 优先级:device > subnet > type > global)

标签管理

4
工具名称描述
list_tags列出所有标签
create_tag创建标签
delete_tag删除标签
merge_tags合并标签(将多个标签合并为一个)

Proxy 监控代理

16
工具名称描述
list_proxies列出监控代理(按状态筛选)
get_proxy_detailProxy 详情 + 健康状态
get_proxy_health所有 Proxy 健康状态汇总
list_proxy_tasksProxy 任务列表(安装 / 重启 / 升级 / 卸载)
get_proxy_config_historyProxy 配置变更历史
install_proxy安装 Proxy(离线模式,自动检测 OS / 架构)
uninstall_proxy卸载 Proxy + ARP Helper
restart_proxy重启 Proxy
upgrade_proxy升级 Proxy(自动版本兼容性检查)
get_proxy_hosts获取 Proxy 关联的设备列表
proxy_preflight安装前预检(OS / Docker / 磁盘 / 端口 / 连通性)
get_proxy_health_historyProxy 健康状态变更历史(7 天)
get_proxy_metricsProxy 性能指标(CPU / 内存 / 队列)
list_proxy_groups列出 Proxy Group
manage_proxy_group管理 Proxy Group(创建 / 更新 / 删除)
list_auto_registration_rules列出自动注册规则

Agent 探针管理

7
工具名称描述
install_agent安装 Zabbix Agent(离线模式)
batch_install_agent批量安装 Agent
get_agent_status查询 Agent 状态
uninstall_agent卸载 Agent
upgrade_agent升级 Agent
bind_template绑定监控模板到设备
list_recommended_templates推荐适合设备的监控模板

IPMI 硬件管控

5
工具名称描述
ipmi_power_actionIPMI 电源操作(开机 / 关机 / 重启 / 重置)
get_ipmi_sensors读取 IPMI 传感器数据(温度 / 风扇 / 电压)
get_ipmi_sel获取 IPMI 系统事件日志
get_ipmi_fru获取 IPMI FRU 硬件信息(序列号 / 制造商)
batch_ipmi_power批量 IPMI 电源操作

操作审计与回退

3
工具名称描述
list_audit_logs查询操作审计日志
list_recent_operations查询可回退操作快照(回收站)
undo_operation恢复操作快照(撤销删除或回退修改)

未找到匹配的工具