# Bookworm Smart Assistant v5.6 — 项目介绍

---

## 一句话定位

**基于 Claude Code 的自进化智能路由系统，将单一 AI 助手扩展为 50 专家技能 + 10 智能体的协作网络，实现"说人话，干专家活"。**

---

## 1. 项目背景与痛点

### 痛点

| 问题 | 表现 |
|------|------|
| AI 助手是"万金油" | 什么都能答，但什么都不够专业 |
| 上下文容易丢失 | 长对话中忘记之前的决策和约定 |
| 无法自我改进 | 同样的错误反复出现，没有学习能力 |
| 质量不可控 | 没有门控机制，低质量输出直达用户 |
| 基建维护靠人工 | 配置漂移、版本不一致需要人工排查 |

### 机会

Claude Code 提供了 Hooks、MCP、Agent、Skill 四大扩展机制，但缺少一个**将它们有机编排、持续进化**的系统层。Bookworm 填补了这个空白。

---

## 2. 解决方案

### 核心架构：7 层流水线

```
用户输入
  ↓
L1 路由层 ─── Neural Gateway: BM25 + TF-IDF + 上下文融合 → [BWR] 指令
  ↓
L2 门控层 ─── 5 个 PreToolUse 钩子: 文件保护 / 危险拦截 / 合规校验
  ↓
L3 执行层 ─── 50 专家技能 + 10 智能体 + 6 MCP 服务
  ↓
L4 后处理层 ─ 变更感知 / 构建追踪 / 活动日志
  ↓
L5 会话结束 ─ 合规审计 + 磁盘清理
  ↓
L6 学习闭环 ─ 显式纠正 + 隐式反馈 → 权重回注 L1
  ↓
L7 自进化 ── 感知 → 审计 → 修复 → 记录 (无人值守)
```

### 核心能力

**能力一：语义路由引擎**

用户只需用自然语言描述需求，系统自动匹配最合适的专家技能：

```
"React 页面加载慢"  → performance-expert (非 frontend)
"API 安全漏洞"      → security-expert (非 backend)
"帮我写个 PRD"      → product-manager-expert
"从零搭建电商后台"  → orchestrator (多技能编排)
```

- 27 条消歧规则处理模糊边界（如"测试"一词在不同上下文路由到 5 个不同技能）
- 19 组同义词展开覆盖中英文混合输入
- 会话滑动窗口保持上下文连贯性

**能力二：多层安全门控**

```
L2 门控三道防线:
├─ block-sensitive-files  → 保护 hooks/*.js 不被意外修改
├─ block-dangerous-commands → 拦截 rm -rf / DROP TABLE 等危险操作
└─ route-compliance-gate  → 确保 Skill 调用匹配路由指令
```

**能力三：自进化闭环**

```
文件修改 → drift-detector 感知
       → self-auditor 8 维审计
       → self-healer 自动修复元数据
       → evolution-log 记录进化轨迹

路由反馈 → 显式纠正 + 隐式信号
       → 权重学习 (5 天半衰期指数衰减)
       → 限幅 [-0.5, +0.5] 安全约束
       → 回注路由引擎
```

---

## 3. 系统规模

| 维度 | 数量 | 说明 |
|------|------|------|
| 专家技能 | **50** | 覆盖前端/后端/架构/安全/DevOps/AI/产品/商业等 20+ 领域 |
| 智能体 | **10** | 2 Opus (编排+审查) + 8 Sonnet (审计/修复/测试/构建等) |
| 钩子 | **17** | 13 已注册 + 4 备用 (按需激活，减少默认延迟) |
| MCP 服务 | **6** | 深度研究 / 实时文档 / 结构化推理 / 浏览器自动化 |
| 消歧规则 | **27** | 外部化 JSON，可热更新 |
| 同义词组 | **19** | 中英文双语覆盖 |
| 加权关键词 | **2,393** | 三层权重 (core/strong/extended) + TF-IDF 区分度 |
| 编译规则 | **92** | 合规门控 pattern |
| 完整性校验 | **24 文件** | SHA256 + HMAC 机器绑定签名 |
| 测试用例 | **1,371** | 46 个测试文件，全绿 |
| 脚本模块 | **45** | 路由/学习/健康/报告/清理等 |

---

## 4. 健康度量体系

### 10 维健康评分引擎

```
┌──────────────────────────────────────────────────────┐
│  H1  配置一致性  13%  ████████████████████  100      │
│  H2  行为基线    13%  ████████████████████  100      │
│  H3  磁盘健康    10%  ████████████████████  100      │
│  H4  钩子完整性  13%  ████████████████████  100      │
│  H5  技能索引     9%  ████████████████████  100      │
│  H6  规则缓存     9%  ████████████████████  100      │
│  H7  路由准确率  13%  ████████████████████  100      │
│  H8  学习收敛    10%  ██████████████████░░   90      │
│  H9  路由合规    10%  ████████████████████  100      │
│  H10 Hook有效性   9%  ████████████████████  100      │
├──────────────────────────────────────────────────────┤
│                              总分:  99 / 100         │
└──────────────────────────────────────────────────────┘
```

### 关键运营指标

| 指标 | 当前值 | 说明 |
|------|--------|------|
| 路由准确率 | **100%** | 455 条反馈，0 误路由 |
| 权重收敛状态 | **零漂移** | 学习系统已完全收敛 |
| 测试通过率 | **100%** | 1371/1371 |
| 完整性校验 | **24/24 PASS** | SHA256 + HMAC 全部通过 |

---

## 5. 技术亮点

### 5.1 BM25 + 上下文融合评分

```
综合得分 = BM25基础分(0.6) + 会话上下文(0.2) + 项目类型(0.1) + 工作流模式(0.1)
```

不是简单的关键词匹配，而是结合当前对话历史、项目类型、操作序列的多维评分。

### 5.2 管道检测 (v5.6 新增)

```bash
# 传统方式: exitCode 被 tail 覆盖，误判为成功
vitest run | tail -5    # exitCode = 0 (tail 的退出码)

# Bookworm: 解析输出内容，识别 12 种测试框架的汇总行
# "3 failed" → failure    "0 failed, 12 passed" → success
```

### 5.3 自愈安全约束

self-healer 只修改**元数据层** (版本号、计数、注册表条目、索引)，绝不修改技能逻辑、智能体行为、钩子业务代码。

### 5.4 学习安全基座

- 技能名白名单校验 — 防止学习虚构技能
- 权重限幅 [-0.5, +0.5] — 防止单一反馈暴走
- 5 天半衰期衰减 — 旧反馈自然退出
- Holdout 验证集 — 评估学习效果

---

## 6. 版本演进

```
v4.8  关键词共现匹配, 6 维健康检查
  ↓
v4.9  BM25 评分, TF-IDF 加权, 三层关键词, 隐式反馈
  ↓
v5.0  会话追踪, 项目检测, 工作流模式, 路由融合
  ↓
v5.1  IQR+Z-score 异常检测, EWMA 动态阈值, 技能链推荐
  ↓
v5.2  Neural Gateway 强制路由, 意图分类, 合规门控
  ↓
v5.3  会话路由记忆, A/B 实验框架, Hook 并行派遣
  ↓
v5.4  消歧规则引擎 (18规则), 学习安全基座, 关键词缺口检测
  ↓
v5.5  架构评审修复, dispatcher 委托模式, 消歧外部化 (22规则)
  ↓
v5.6  闭环校验: actualSkill 合规闭环, 管道检测, 0-failed 修复
       消歧 27 规则, 同义词 19 组, 1371 tests 全绿 ← 当前版本
```

---

## 7. 项目结构

```
.claude/
├── CLAUDE.md                    # 系统主配置 (路由规则/偏好/架构声明)
├── settings.json                # Hook 注册 + MCP 配置
├── skills-index.json            # 50×2393 编译索引
├── stats-compiled.json          # 实时统计快照
├── checksums.json + .sig        # 24 文件完整性签名
│
├── skills/                      # 50 个专家技能
│   ├── frontend-expert/SKILL.md
│   ├── backend-builder/SKILL.md
│   └── ...
│
├── agents/                      # 10 个智能体
│   ├── orchestrator.md          # Opus - 多技能编排
│   ├── self-auditor.md          # Sonnet - 8 维审计
│   └── ...
│
├── hooks/                       # 17 个钩子
│   ├── route-interceptor.js     # 路由入口 (UserPromptSubmit)
│   ├── route-compliance-gate.js # 合规校验 (PreToolUse)
│   ├── build-outcome-tracker.js # 构建追踪 (PostToolUse)
│   ├── route-auditor.js         # 合规审计 (Stop)
│   └── ...
│
├── scripts/                     # 45 个脚本模块
│   ├── route-analyzer.js        # BM25 评分引擎
│   ├── health-check.js          # 10 维健康评分
│   ├── generate-stats.js        # 统计生成器
│   └── ...
│
└── debug/                       # 运行时数据
    ├── route-weights.json       # 学习权重
    ├── route-feedback.jsonl     # 路由反馈日志
    └── evolution-log.jsonl      # 进化轨迹
```

---

## 8. 适用场景

| 场景 | 说明 |
|------|------|
| 全栈独立开发者 | 一个人 = 50 个专家，覆盖开发全生命周期 |
| 技术团队 Leader | 架构评审、代码审查、技术选型的 AI 副驾驶 |
| 创业者 | 从 BP 撰写到产品开发到部署上线，端到端支持 |
| Claude Code 深度用户 | 将原生能力扩展 10 倍，且持续自我进化 |

---

## 9. 核心价值

```
┌────────────────────────────────────────────────────┐
│                                                    │
│   普通 AI 助手:  用户适应 AI                        │
│                                                    │
│   Bookworm:     AI 适应用户                        │
│                                                    │
│   - 自动识别意图，路由到最合适的专家                  │
│   - 从每次交互中学习，持续提升准确率                  │
│   - 多层门控确保输出质量                             │
│   - 无人值守自愈，配置永不漂移                       │
│                                                    │
└────────────────────────────────────────────────────┘
```

---

*Bookworm Smart Assistant v5.6 | 2026-03-01 | 健康评分 99/100*