bookworm-smart-assistant/docs/project-introduction.md

273 lines
10 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Bookworm Smart Assistant v5.6 — 项目介绍
---
## 一句话定位
**基于 Claude Code 的自进化智能路由系统,将单一 AI 助手扩展为 50 专家技能 + 10 智能体的协作网络,实现"说人话,干专家活"。**
---
## 1. 项目背景与痛点
### 痛点
| 问题 | 表现 |
|------|------|
| AI 助手是"万金油" | 什么都能答,但什么都不够专业 |
| 上下文容易丢失 | 长对话中忘记之前的决策和约定 |
| 无法自我改进 | 同样的错误反复出现,没有学习能力 |
| 质量不可控 | 没有门控机制,低质量输出直达用户 |
| 基建维护靠人工 | 配置漂移、版本不一致需要人工排查 |
### 机会
Claude Code 提供了 Hooks、MCP、Agent、Skill 四大扩展机制,但缺少一个**将它们有机编排、持续进化**的系统层。Bookworm 填补了这个空白。
---
## 2. 解决方案
### 核心架构7 层流水线
```
用户输入
L1 路由层 ─── Neural Gateway: BM25 + TF-IDF + 上下文融合 → [BWR] 指令
L2 门控层 ─── 5 个 PreToolUse 钩子: 文件保护 / 危险拦截 / 合规校验
L3 执行层 ─── 50 专家技能 + 10 智能体 + 6 MCP 服务
L4 后处理层 ─ 变更感知 / 构建追踪 / 活动日志
L5 会话结束 ─ 合规审计 + 磁盘清理
L6 学习闭环 ─ 显式纠正 + 隐式反馈 → 权重回注 L1
L7 自进化 ── 感知 → 审计 → 修复 → 记录 (无人值守)
```
### 核心能力
**能力一:语义路由引擎**
用户只需用自然语言描述需求,系统自动匹配最合适的专家技能:
```
"React 页面加载慢" → performance-expert (非 frontend)
"API 安全漏洞" → security-expert (非 backend)
"帮我写个 PRD" → product-manager-expert
"从零搭建电商后台" → orchestrator (多技能编排)
```
- 27 条消歧规则处理模糊边界(如"测试"一词在不同上下文路由到 5 个不同技能)
- 19 组同义词展开覆盖中英文混合输入
- 会话滑动窗口保持上下文连贯性
**能力二:多层安全门控**
```
L2 门控三道防线:
├─ block-sensitive-files → 保护 hooks/*.js 不被意外修改
├─ block-dangerous-commands → 拦截 rm -rf / DROP TABLE 等危险操作
└─ route-compliance-gate → 确保 Skill 调用匹配路由指令
```
**能力三:自进化闭环**
```
文件修改 → drift-detector 感知
→ self-auditor 8 维审计
→ self-healer 自动修复元数据
→ evolution-log 记录进化轨迹
路由反馈 → 显式纠正 + 隐式信号
→ 权重学习 (5 天半衰期指数衰减)
→ 限幅 [-0.5, +0.5] 安全约束
→ 回注路由引擎
```
---
## 3. 系统规模
| 维度 | 数量 | 说明 |
|------|------|------|
| 专家技能 | **50** | 覆盖前端/后端/架构/安全/DevOps/AI/产品/商业等 20+ 领域 |
| 智能体 | **10** | 2 Opus (编排+审查) + 8 Sonnet (审计/修复/测试/构建等) |
| 钩子 | **17** | 13 已注册 + 4 备用 (按需激活,减少默认延迟) |
| MCP 服务 | **6** | 深度研究 / 实时文档 / 结构化推理 / 浏览器自动化 |
| 消歧规则 | **27** | 外部化 JSON可热更新 |
| 同义词组 | **19** | 中英文双语覆盖 |
| 加权关键词 | **2,393** | 三层权重 (core/strong/extended) + TF-IDF 区分度 |
| 编译规则 | **92** | 合规门控 pattern |
| 完整性校验 | **24 文件** | SHA256 + HMAC 机器绑定签名 |
| 测试用例 | **1,371** | 46 个测试文件,全绿 |
| 脚本模块 | **45** | 路由/学习/健康/报告/清理等 |
---
## 4. 健康度量体系
### 10 维健康评分引擎
```
┌──────────────────────────────────────────────────────┐
│ H1 配置一致性 13% ████████████████████ 100 │
│ H2 行为基线 13% ████████████████████ 100 │
│ H3 磁盘健康 10% ████████████████████ 100 │
│ H4 钩子完整性 13% ████████████████████ 100 │
│ H5 技能索引 9% ████████████████████ 100 │
│ H6 规则缓存 9% ████████████████████ 100 │
│ H7 路由准确率 13% ████████████████████ 100 │
│ H8 学习收敛 10% ██████████████████░░ 90 │
│ H9 路由合规 10% ████████████████████ 100 │
│ H10 Hook有效性 9% ████████████████████ 100 │
├──────────────────────────────────────────────────────┤
│ 总分: 99 / 100 │
└──────────────────────────────────────────────────────┘
```
### 关键运营指标
| 指标 | 当前值 | 说明 |
|------|--------|------|
| 路由准确率 | **100%** | 455 条反馈0 误路由 |
| 权重收敛状态 | **零漂移** | 学习系统已完全收敛 |
| 测试通过率 | **100%** | 1371/1371 |
| 完整性校验 | **24/24 PASS** | SHA256 + HMAC 全部通过 |
---
## 5. 技术亮点
### 5.1 BM25 + 上下文融合评分
```
综合得分 = BM25基础分(0.6) + 会话上下文(0.2) + 项目类型(0.1) + 工作流模式(0.1)
```
不是简单的关键词匹配,而是结合当前对话历史、项目类型、操作序列的多维评分。
### 5.2 管道检测 (v5.6 新增)
```bash
# 传统方式: exitCode 被 tail 覆盖,误判为成功
vitest run | tail -5 # exitCode = 0 (tail 的退出码)
# Bookworm: 解析输出内容,识别 12 种测试框架的汇总行
# "3 failed" → failure "0 failed, 12 passed" → success
```
### 5.3 自愈安全约束
self-healer 只修改**元数据层** (版本号、计数、注册表条目、索引),绝不修改技能逻辑、智能体行为、钩子业务代码。
### 5.4 学习安全基座
- 技能名白名单校验 — 防止学习虚构技能
- 权重限幅 [-0.5, +0.5] — 防止单一反馈暴走
- 5 天半衰期衰减 — 旧反馈自然退出
- Holdout 验证集 — 评估学习效果
---
## 6. 版本演进
```
v4.8 关键词共现匹配, 6 维健康检查
v4.9 BM25 评分, TF-IDF 加权, 三层关键词, 隐式反馈
v5.0 会话追踪, 项目检测, 工作流模式, 路由融合
v5.1 IQR+Z-score 异常检测, EWMA 动态阈值, 技能链推荐
v5.2 Neural Gateway 强制路由, 意图分类, 合规门控
v5.3 会话路由记忆, A/B 实验框架, Hook 并行派遣
v5.4 消歧规则引擎 (18规则), 学习安全基座, 关键词缺口检测
v5.5 架构评审修复, dispatcher 委托模式, 消歧外部化 (22规则)
v5.6 闭环校验: actualSkill 合规闭环, 管道检测, 0-failed 修复
消歧 27 规则, 同义词 19 组, 1371 tests 全绿 ← 当前版本
```
---
## 7. 项目结构
```
.claude/
├── CLAUDE.md # 系统主配置 (路由规则/偏好/架构声明)
├── settings.json # Hook 注册 + MCP 配置
├── skills-index.json # 50×2393 编译索引
├── stats-compiled.json # 实时统计快照
├── checksums.json + .sig # 24 文件完整性签名
├── skills/ # 50 个专家技能
│ ├── frontend-expert/SKILL.md
│ ├── backend-builder/SKILL.md
│ └── ...
├── agents/ # 10 个智能体
│ ├── orchestrator.md # Opus - 多技能编排
│ ├── self-auditor.md # Sonnet - 8 维审计
│ └── ...
├── hooks/ # 17 个钩子
│ ├── route-interceptor.js # 路由入口 (UserPromptSubmit)
│ ├── route-compliance-gate.js # 合规校验 (PreToolUse)
│ ├── build-outcome-tracker.js # 构建追踪 (PostToolUse)
│ ├── route-auditor.js # 合规审计 (Stop)
│ └── ...
├── scripts/ # 45 个脚本模块
│ ├── route-analyzer.js # BM25 评分引擎
│ ├── health-check.js # 10 维健康评分
│ ├── generate-stats.js # 统计生成器
│ └── ...
└── debug/ # 运行时数据
├── route-weights.json # 学习权重
├── route-feedback.jsonl # 路由反馈日志
└── evolution-log.jsonl # 进化轨迹
```
---
## 8. 适用场景
| 场景 | 说明 |
|------|------|
| 全栈独立开发者 | 一个人 = 50 个专家,覆盖开发全生命周期 |
| 技术团队 Leader | 架构评审、代码审查、技术选型的 AI 副驾驶 |
| 创业者 | 从 BP 撰写到产品开发到部署上线,端到端支持 |
| Claude Code 深度用户 | 将原生能力扩展 10 倍,且持续自我进化 |
---
## 9. 核心价值
```
┌────────────────────────────────────────────────────┐
│ │
│ 普通 AI 助手: 用户适应 AI │
│ │
│ Bookworm: AI 适应用户 │
│ │
│ - 自动识别意图,路由到最合适的专家 │
│ - 从每次交互中学习,持续提升准确率 │
│ - 多层门控确保输出质量 │
│ - 无人值守自愈,配置永不漂移 │
│ │
└────────────────────────────────────────────────────┘
```
---
*Bookworm Smart Assistant v5.6 | 2026-03-01 | 健康评分 99/100*