10 KiB
10 KiB
Bookworm Smart Assistant v5.6 — 项目介绍
一句话定位
基于 Claude Code 的自进化智能路由系统,将单一 AI 助手扩展为 50 专家技能 + 10 智能体的协作网络,实现"说人话,干专家活"。
1. 项目背景与痛点
痛点
| 问题 | 表现 |
|---|---|
| AI 助手是"万金油" | 什么都能答,但什么都不够专业 |
| 上下文容易丢失 | 长对话中忘记之前的决策和约定 |
| 无法自我改进 | 同样的错误反复出现,没有学习能力 |
| 质量不可控 | 没有门控机制,低质量输出直达用户 |
| 基建维护靠人工 | 配置漂移、版本不一致需要人工排查 |
机会
Claude Code 提供了 Hooks、MCP、Agent、Skill 四大扩展机制,但缺少一个将它们有机编排、持续进化的系统层。Bookworm 填补了这个空白。
2. 解决方案
核心架构:7 层流水线
用户输入
↓
L1 路由层 ─── Neural Gateway: BM25 + TF-IDF + 上下文融合 → [BWR] 指令
↓
L2 门控层 ─── 5 个 PreToolUse 钩子: 文件保护 / 危险拦截 / 合规校验
↓
L3 执行层 ─── 50 专家技能 + 10 智能体 + 6 MCP 服务
↓
L4 后处理层 ─ 变更感知 / 构建追踪 / 活动日志
↓
L5 会话结束 ─ 合规审计 + 磁盘清理
↓
L6 学习闭环 ─ 显式纠正 + 隐式反馈 → 权重回注 L1
↓
L7 自进化 ── 感知 → 审计 → 修复 → 记录 (无人值守)
核心能力
能力一:语义路由引擎
用户只需用自然语言描述需求,系统自动匹配最合适的专家技能:
"React 页面加载慢" → performance-expert (非 frontend)
"API 安全漏洞" → security-expert (非 backend)
"帮我写个 PRD" → product-manager-expert
"从零搭建电商后台" → orchestrator (多技能编排)
- 27 条消歧规则处理模糊边界(如"测试"一词在不同上下文路由到 5 个不同技能)
- 19 组同义词展开覆盖中英文混合输入
- 会话滑动窗口保持上下文连贯性
能力二:多层安全门控
L2 门控三道防线:
├─ block-sensitive-files → 保护 hooks/*.js 不被意外修改
├─ block-dangerous-commands → 拦截 rm -rf / DROP TABLE 等危险操作
└─ route-compliance-gate → 确保 Skill 调用匹配路由指令
能力三:自进化闭环
文件修改 → drift-detector 感知
→ self-auditor 8 维审计
→ self-healer 自动修复元数据
→ evolution-log 记录进化轨迹
路由反馈 → 显式纠正 + 隐式信号
→ 权重学习 (5 天半衰期指数衰减)
→ 限幅 [-0.5, +0.5] 安全约束
→ 回注路由引擎
3. 系统规模
| 维度 | 数量 | 说明 |
|---|---|---|
| 专家技能 | 50 | 覆盖前端/后端/架构/安全/DevOps/AI/产品/商业等 20+ 领域 |
| 智能体 | 10 | 2 Opus (编排+审查) + 8 Sonnet (审计/修复/测试/构建等) |
| 钩子 | 17 | 13 已注册 + 4 备用 (按需激活,减少默认延迟) |
| MCP 服务 | 6 | 深度研究 / 实时文档 / 结构化推理 / 浏览器自动化 |
| 消歧规则 | 27 | 外部化 JSON,可热更新 |
| 同义词组 | 19 | 中英文双语覆盖 |
| 加权关键词 | 2,393 | 三层权重 (core/strong/extended) + TF-IDF 区分度 |
| 编译规则 | 92 | 合规门控 pattern |
| 完整性校验 | 24 文件 | SHA256 + HMAC 机器绑定签名 |
| 测试用例 | 1,371 | 46 个测试文件,全绿 |
| 脚本模块 | 45 | 路由/学习/健康/报告/清理等 |
4. 健康度量体系
10 维健康评分引擎
┌──────────────────────────────────────────────────────┐
│ H1 配置一致性 13% ████████████████████ 100 │
│ H2 行为基线 13% ████████████████████ 100 │
│ H3 磁盘健康 10% ████████████████████ 100 │
│ H4 钩子完整性 13% ████████████████████ 100 │
│ H5 技能索引 9% ████████████████████ 100 │
│ H6 规则缓存 9% ████████████████████ 100 │
│ H7 路由准确率 13% ████████████████████ 100 │
│ H8 学习收敛 10% ██████████████████░░ 90 │
│ H9 路由合规 10% ████████████████████ 100 │
│ H10 Hook有效性 9% ████████████████████ 100 │
├──────────────────────────────────────────────────────┤
│ 总分: 99 / 100 │
└──────────────────────────────────────────────────────┘
关键运营指标
| 指标 | 当前值 | 说明 |
|---|---|---|
| 路由准确率 | 100% | 455 条反馈,0 误路由 |
| 权重收敛状态 | 零漂移 | 学习系统已完全收敛 |
| 测试通过率 | 100% | 1371/1371 |
| 完整性校验 | 24/24 PASS | SHA256 + HMAC 全部通过 |
5. 技术亮点
5.1 BM25 + 上下文融合评分
综合得分 = BM25基础分(0.6) + 会话上下文(0.2) + 项目类型(0.1) + 工作流模式(0.1)
不是简单的关键词匹配,而是结合当前对话历史、项目类型、操作序列的多维评分。
5.2 管道检测 (v5.6 新增)
# 传统方式: exitCode 被 tail 覆盖,误判为成功
vitest run | tail -5 # exitCode = 0 (tail 的退出码)
# Bookworm: 解析输出内容,识别 12 种测试框架的汇总行
# "3 failed" → failure "0 failed, 12 passed" → success
5.3 自愈安全约束
self-healer 只修改元数据层 (版本号、计数、注册表条目、索引),绝不修改技能逻辑、智能体行为、钩子业务代码。
5.4 学习安全基座
- 技能名白名单校验 — 防止学习虚构技能
- 权重限幅 [-0.5, +0.5] — 防止单一反馈暴走
- 5 天半衰期衰减 — 旧反馈自然退出
- Holdout 验证集 — 评估学习效果
6. 版本演进
v4.8 关键词共现匹配, 6 维健康检查
↓
v4.9 BM25 评分, TF-IDF 加权, 三层关键词, 隐式反馈
↓
v5.0 会话追踪, 项目检测, 工作流模式, 路由融合
↓
v5.1 IQR+Z-score 异常检测, EWMA 动态阈值, 技能链推荐
↓
v5.2 Neural Gateway 强制路由, 意图分类, 合规门控
↓
v5.3 会话路由记忆, A/B 实验框架, Hook 并行派遣
↓
v5.4 消歧规则引擎 (18规则), 学习安全基座, 关键词缺口检测
↓
v5.5 架构评审修复, dispatcher 委托模式, 消歧外部化 (22规则)
↓
v5.6 闭环校验: actualSkill 合规闭环, 管道检测, 0-failed 修复
消歧 27 规则, 同义词 19 组, 1371 tests 全绿 ← 当前版本
7. 项目结构
.claude/
├── CLAUDE.md # 系统主配置 (路由规则/偏好/架构声明)
├── settings.json # Hook 注册 + MCP 配置
├── skills-index.json # 50×2393 编译索引
├── stats-compiled.json # 实时统计快照
├── checksums.json + .sig # 24 文件完整性签名
│
├── skills/ # 50 个专家技能
│ ├── frontend-expert/SKILL.md
│ ├── backend-builder/SKILL.md
│ └── ...
│
├── agents/ # 10 个智能体
│ ├── orchestrator.md # Opus - 多技能编排
│ ├── self-auditor.md # Sonnet - 8 维审计
│ └── ...
│
├── hooks/ # 17 个钩子
│ ├── route-interceptor.js # 路由入口 (UserPromptSubmit)
│ ├── route-compliance-gate.js # 合规校验 (PreToolUse)
│ ├── build-outcome-tracker.js # 构建追踪 (PostToolUse)
│ ├── route-auditor.js # 合规审计 (Stop)
│ └── ...
│
├── scripts/ # 45 个脚本模块
│ ├── route-analyzer.js # BM25 评分引擎
│ ├── health-check.js # 10 维健康评分
│ ├── generate-stats.js # 统计生成器
│ └── ...
│
└── debug/ # 运行时数据
├── route-weights.json # 学习权重
├── route-feedback.jsonl # 路由反馈日志
└── evolution-log.jsonl # 进化轨迹
8. 适用场景
| 场景 | 说明 |
|---|---|
| 全栈独立开发者 | 一个人 = 50 个专家,覆盖开发全生命周期 |
| 技术团队 Leader | 架构评审、代码审查、技术选型的 AI 副驾驶 |
| 创业者 | 从 BP 撰写到产品开发到部署上线,端到端支持 |
| Claude Code 深度用户 | 将原生能力扩展 10 倍,且持续自我进化 |
9. 核心价值
┌────────────────────────────────────────────────────┐
│ │
│ 普通 AI 助手: 用户适应 AI │
│ │
│ Bookworm: AI 适应用户 │
│ │
│ - 自动识别意图,路由到最合适的专家 │
│ - 从每次交互中学习,持续提升准确率 │
│ - 多层门控确保输出质量 │
│ - 无人值守自愈,配置永不漂移 │
│ │
└────────────────────────────────────────────────────┘
Bookworm Smart Assistant v5.6 | 2026-03-01 | 健康评分 99/100