bookworm-smart-assistant/docs/project-introduction.md

10 KiB
Raw Permalink Blame History

Bookworm Smart Assistant v5.6 — 项目介绍


一句话定位

基于 Claude Code 的自进化智能路由系统,将单一 AI 助手扩展为 50 专家技能 + 10 智能体的协作网络,实现"说人话,干专家活"。


1. 项目背景与痛点

痛点

问题 表现
AI 助手是"万金油" 什么都能答,但什么都不够专业
上下文容易丢失 长对话中忘记之前的决策和约定
无法自我改进 同样的错误反复出现,没有学习能力
质量不可控 没有门控机制,低质量输出直达用户
基建维护靠人工 配置漂移、版本不一致需要人工排查

机会

Claude Code 提供了 Hooks、MCP、Agent、Skill 四大扩展机制,但缺少一个将它们有机编排、持续进化的系统层。Bookworm 填补了这个空白。


2. 解决方案

核心架构7 层流水线

用户输入
  ↓
L1 路由层 ─── Neural Gateway: BM25 + TF-IDF + 上下文融合 → [BWR] 指令
  ↓
L2 门控层 ─── 5 个 PreToolUse 钩子: 文件保护 / 危险拦截 / 合规校验
  ↓
L3 执行层 ─── 50 专家技能 + 10 智能体 + 6 MCP 服务
  ↓
L4 后处理层 ─ 变更感知 / 构建追踪 / 活动日志
  ↓
L5 会话结束 ─ 合规审计 + 磁盘清理
  ↓
L6 学习闭环 ─ 显式纠正 + 隐式反馈 → 权重回注 L1
  ↓
L7 自进化 ── 感知 → 审计 → 修复 → 记录 (无人值守)

核心能力

能力一:语义路由引擎

用户只需用自然语言描述需求,系统自动匹配最合适的专家技能:

"React 页面加载慢"  → performance-expert (非 frontend)
"API 安全漏洞"      → security-expert (非 backend)
"帮我写个 PRD"      → product-manager-expert
"从零搭建电商后台"  → orchestrator (多技能编排)
  • 27 条消歧规则处理模糊边界(如"测试"一词在不同上下文路由到 5 个不同技能)
  • 19 组同义词展开覆盖中英文混合输入
  • 会话滑动窗口保持上下文连贯性

能力二:多层安全门控

L2 门控三道防线:
├─ block-sensitive-files  → 保护 hooks/*.js 不被意外修改
├─ block-dangerous-commands → 拦截 rm -rf / DROP TABLE 等危险操作
└─ route-compliance-gate  → 确保 Skill 调用匹配路由指令

能力三:自进化闭环

文件修改 → drift-detector 感知
       → self-auditor 8 维审计
       → self-healer 自动修复元数据
       → evolution-log 记录进化轨迹

路由反馈 → 显式纠正 + 隐式信号
       → 权重学习 (5 天半衰期指数衰减)
       → 限幅 [-0.5, +0.5] 安全约束
       → 回注路由引擎

3. 系统规模

维度 数量 说明
专家技能 50 覆盖前端/后端/架构/安全/DevOps/AI/产品/商业等 20+ 领域
智能体 10 2 Opus (编排+审查) + 8 Sonnet (审计/修复/测试/构建等)
钩子 17 13 已注册 + 4 备用 (按需激活,减少默认延迟)
MCP 服务 6 深度研究 / 实时文档 / 结构化推理 / 浏览器自动化
消歧规则 27 外部化 JSON可热更新
同义词组 19 中英文双语覆盖
加权关键词 2,393 三层权重 (core/strong/extended) + TF-IDF 区分度
编译规则 92 合规门控 pattern
完整性校验 24 文件 SHA256 + HMAC 机器绑定签名
测试用例 1,371 46 个测试文件,全绿
脚本模块 45 路由/学习/健康/报告/清理等

4. 健康度量体系

10 维健康评分引擎

┌──────────────────────────────────────────────────────┐
│  H1  配置一致性  13%  ████████████████████  100      │
│  H2  行为基线    13%  ████████████████████  100      │
│  H3  磁盘健康    10%  ████████████████████  100      │
│  H4  钩子完整性  13%  ████████████████████  100      │
│  H5  技能索引     9%  ████████████████████  100      │
│  H6  规则缓存     9%  ████████████████████  100      │
│  H7  路由准确率  13%  ████████████████████  100      │
│  H8  学习收敛    10%  ██████████████████░░   90      │
│  H9  路由合规    10%  ████████████████████  100      │
│  H10 Hook有效性   9%  ████████████████████  100      │
├──────────────────────────────────────────────────────┤
│                              总分:  99 / 100         │
└──────────────────────────────────────────────────────┘

关键运营指标

指标 当前值 说明
路由准确率 100% 455 条反馈0 误路由
权重收敛状态 零漂移 学习系统已完全收敛
测试通过率 100% 1371/1371
完整性校验 24/24 PASS SHA256 + HMAC 全部通过

5. 技术亮点

5.1 BM25 + 上下文融合评分

综合得分 = BM25基础分(0.6) + 会话上下文(0.2) + 项目类型(0.1) + 工作流模式(0.1)

不是简单的关键词匹配,而是结合当前对话历史、项目类型、操作序列的多维评分。

5.2 管道检测 (v5.6 新增)

# 传统方式: exitCode 被 tail 覆盖,误判为成功
vitest run | tail -5    # exitCode = 0 (tail 的退出码)

# Bookworm: 解析输出内容,识别 12 种测试框架的汇总行
# "3 failed" → failure    "0 failed, 12 passed" → success

5.3 自愈安全约束

self-healer 只修改元数据层 (版本号、计数、注册表条目、索引),绝不修改技能逻辑、智能体行为、钩子业务代码。

5.4 学习安全基座

  • 技能名白名单校验 — 防止学习虚构技能
  • 权重限幅 [-0.5, +0.5] — 防止单一反馈暴走
  • 5 天半衰期衰减 — 旧反馈自然退出
  • Holdout 验证集 — 评估学习效果

6. 版本演进

v4.8  关键词共现匹配, 6 维健康检查
  ↓
v4.9  BM25 评分, TF-IDF 加权, 三层关键词, 隐式反馈
  ↓
v5.0  会话追踪, 项目检测, 工作流模式, 路由融合
  ↓
v5.1  IQR+Z-score 异常检测, EWMA 动态阈值, 技能链推荐
  ↓
v5.2  Neural Gateway 强制路由, 意图分类, 合规门控
  ↓
v5.3  会话路由记忆, A/B 实验框架, Hook 并行派遣
  ↓
v5.4  消歧规则引擎 (18规则), 学习安全基座, 关键词缺口检测
  ↓
v5.5  架构评审修复, dispatcher 委托模式, 消歧外部化 (22规则)
  ↓
v5.6  闭环校验: actualSkill 合规闭环, 管道检测, 0-failed 修复
       消歧 27 规则, 同义词 19 组, 1371 tests 全绿 ← 当前版本

7. 项目结构

.claude/
├── CLAUDE.md                    # 系统主配置 (路由规则/偏好/架构声明)
├── settings.json                # Hook 注册 + MCP 配置
├── skills-index.json            # 50×2393 编译索引
├── stats-compiled.json          # 实时统计快照
├── checksums.json + .sig        # 24 文件完整性签名
│
├── skills/                      # 50 个专家技能
│   ├── frontend-expert/SKILL.md
│   ├── backend-builder/SKILL.md
│   └── ...
│
├── agents/                      # 10 个智能体
│   ├── orchestrator.md          # Opus - 多技能编排
│   ├── self-auditor.md          # Sonnet - 8 维审计
│   └── ...
│
├── hooks/                       # 17 个钩子
│   ├── route-interceptor.js     # 路由入口 (UserPromptSubmit)
│   ├── route-compliance-gate.js # 合规校验 (PreToolUse)
│   ├── build-outcome-tracker.js # 构建追踪 (PostToolUse)
│   ├── route-auditor.js         # 合规审计 (Stop)
│   └── ...
│
├── scripts/                     # 45 个脚本模块
│   ├── route-analyzer.js        # BM25 评分引擎
│   ├── health-check.js          # 10 维健康评分
│   ├── generate-stats.js        # 统计生成器
│   └── ...
│
└── debug/                       # 运行时数据
    ├── route-weights.json       # 学习权重
    ├── route-feedback.jsonl     # 路由反馈日志
    └── evolution-log.jsonl      # 进化轨迹

8. 适用场景

场景 说明
全栈独立开发者 一个人 = 50 个专家,覆盖开发全生命周期
技术团队 Leader 架构评审、代码审查、技术选型的 AI 副驾驶
创业者 从 BP 撰写到产品开发到部署上线,端到端支持
Claude Code 深度用户 将原生能力扩展 10 倍,且持续自我进化

9. 核心价值

┌────────────────────────────────────────────────────┐
│                                                    │
│   普通 AI 助手:  用户适应 AI                        │
│                                                    │
│   Bookworm:     AI 适应用户                        │
│                                                    │
│   - 自动识别意图,路由到最合适的专家                  │
│   - 从每次交互中学习,持续提升准确率                  │
│   - 多层门控确保输出质量                             │
│   - 无人值守自愈,配置永不漂移                       │
│                                                    │
└────────────────────────────────────────────────────┘

Bookworm Smart Assistant v5.6 | 2026-03-01 | 健康评分 99/100