task-supervisor
$
npx mdskill add aAAaqwq/AGI-Super-Team/task-supervisorMonitor agent tasks and auto-remediate failures.
- Detects stuck, aborted, or silent agents to prevent task failure.
- Uses session lists, message logs, and custom cron triggers.
- Classifies issues by severity to trigger alerts or auto-retry.
- Posts concise status reports to group channels for human review.
SKILL.md
.github/skills/task-supervisorView on GitHub ↗
--- name: task-supervisor description: 定时巡检 agent 任务执行状态,识别卡住、abort、无产出等异常并触发催促或告警。 --- # Task Supervisor Skill — 任务监工 ## 概述 每 15 分钟自动巡检所有 agent 的工作状态,发现偷懒/卡死/abort 立即告警。 ## 触发 - Cron: 每 15 分钟 - 手动: `task-supervisor check` ## 巡检流程 ### Step 1: 获取活跃 session 列表 ``` sessions_list(activeMinutes=20, messageLimit=1) ``` ### Step 2: 逐个检查 对每个 agent session: 1. **是否活跃** — updatedAt 在 15min 内? 2. **是否 abort** — lastMessage.stopReason == "aborted"? 3. **是否完成** — 有没有发群汇报? 4. **是否偷懒** — 收到任务但没有产出文件? ### Step 3: 异常分类 | 等级 | 情况 | 动作 | |------|------|------| | 🔴 P0 | session aborted/crash | 重发任务 + 告警 | | 🟡 P1 | 15min 无进展 | 发催促 | | 🟢 OK | 正常工作中 | 不打扰 | ### Step 4: 汇报 发到群里(accountId=default, target=-1003890797239): ``` 🔍 监工巡检 [HH:MM] ━━━━━━━━━━━━━━ ✅ 小quant: [状态] ✅ 小content: [状态] ❌ 小code: [问题] → [处理] ... ``` ### Step 5: 自动处理 - abort 的 session: 自动用 sessions_send 重发最近的任务 - 超时的 agent: 发催促消息 - 全部正常: 静默不汇报(不打扰 Daniel) ## 关键规则 1. **全部正常时不汇报** — 只在发现问题时告警 2. **不重复催促** — 同一 agent 15min 内只催一次 3. **深夜模式** — 23:00-08:00 不催促,只记录 4. **汇报精简** — ≤200字,只说问题和处理