LLM Wiki 全流程指南
概述
LLM Wiki 本质上是一个由 AI 持续维护、增量积累的个人知识库。原始材料进入收件箱,经由 AI 清洗为结构化草稿,审阅后归档到正式 Wiki 层,最终可按需发布到 Hexo 博客。
整条数据流如下:
1 | 00_收件箱/ ──ingest──▶ 99_AI初稿/ ──review──▶ approved ──maintain──▶ 01_项目/02_领域/03_资料库/06_术语/ ──publish──▶ 98_发布/ ──deploy──▶ Hexo 博客 |
三大核心原则:
- AI 是 maintainer,负责整理、互链、归档、保鲜;用户负责提问、提供来源、做高层判断
- 正式 Wiki 层是唯一的真相来源,
98_发布/是编译产物 - 能用脚本的不调 LLM,确定性操作走 CLI,语义判断走 Agent
目录架构全览
| 层次 | 目录 | 角色 | 谁写 |
|---|---|---|---|
| 来源层 | 00_收件箱/ |
剪藏、文章、原始材料,只读 | 用户放入 |
| 草稿层 | 99_AI初稿/ |
带 frontmatter 的草稿,待审阅 | AI 写,用户审 |
| 正式层 | 01_项目/ 02_领域/ 03_资料库/ 06_术语/ |
稳定、可被引用的正式页面 | AI 维护,用户拍板 |
| 归档层 | 04_归档/ |
降级/过期/被替代的历史页面 | AI |
| 导航层 | 05_导航/ |
入口页、Canvas 概念图、Base 动态视图 | AI |
| 发布层 | 98_发布/ |
Hexo 格式的编译产物 + 图片资产 | 脚本生成 |
| 系统层 | 95_系统/ |
脚本、配置、taxonomy、skills、日志 | 工程层 |
辅助文件:
| 文件 | 用途 |
|---|---|
index.md |
正式页面总索引(按目录分组,含标题、摘要、元信息) |
log.md |
append-only 操作日志(ingest/archive/refresh/query/lint) |
AGENTS.md |
AI 行为最高优先约定 |
CLAUDE.md |
工程关键信息速查 |
95_系统/config/taxonomy.json |
tags/categories/types 受控词表 |
操作一:Init(初始化仓库)
入口:llmwiki-init skill
触发:创建全新 Wiki 仓库、重建标准目录骨架。
流程:
从 95_系统/templates/wiki_starter/ 复制模板 → 创建标准目录 → 生成 AGENTS.md / taxonomy.json / 核心脚本 → 验证所有文件到位。
产出:一个结构完整、立即可用的 Wiki 仓库。
操作二:Ingest / Capture(入库)
Ingest 入口:llmwiki-ingest skill
Capture 入口:llmwiki-capture skill
触发:
- Ingest:用户把文件放进
00_收件箱/,或说「把 X 入库」 - Capture:对话中产出了可复用的结论、根因、踩坑、设计决策
流程(Ingest 标准六步):
阅读原文 → 查 taxonomy.json 复用 active 词 → 按 Draft Schema 组织内容 → 写到 99_AI初稿/ → validate 校验(必须通过) → find-similar 影响面分析
Ingest 完整 CLI:
1 | # 分步(agent 标准流程) |
Draft Schema(AI 初稿 frontmatter 必填字段):
title · type(note/guide/reference/spec/qa/glossary)· category · status: ai_draft · tags · source · summary · updated
约束:列表禁止嵌套、新 tag/category 自动登记为 candidate、必须跑 validate、必须跑 find-similar。
操作三:Review(审阅)
入口:llmwiki-review skill
触发:草稿已写完,用户说「审阅」「看看」「检查」。
流程:
生成集中审阅包 → 逐篇标记状态(approved / rejected / deferred) → 输出审阅结论
CLI:
1 | python 95_系统/scripts/wiki_cli.py review-packet "99_AI初稿/<草稿>.md" |
📝 用户也可以直接口头确认归档,跳过 formal review 流程
操作四:Maintain(归档 + 互链)
入口:llmwiki-maintain skill
触发:草稿已审阅通过,用户说「归档」「发布」「转正」。
流程:
选 bucket(01~06)和子目录 → validate 兜底 → taxonomy 决策(approve/replace/defer) → dry-run 预览 → 正式 archive → auto-link 互链 → refresh 索引 → lint –fix 补 related_notes
CLI:
1 | # 预览 |
产出:正式页面(status 变为 active)、更新后的 index.md、log.md 操作记录、taxonomy 变更、互链关系。
操作五:Query(检索)
入口:llmwiki-query skill
触发:用户提问、检索现有结论、做综述/对比。
三档模式:
| 档位 | 场景 | 行为 |
|---|---|---|
| quick | 一句话能回答 | 直接回答,不沉淀 |
| standard | 需要跨页面综合 | 回答 + 判断是否沉淀 |
| deep | 需要深度推理/对比 | 回答 + 必须给出沉淀判断(不自动落稿) |
关键规则:
- 回答前先读
index.md - 若答案值得沉淀,必须在回答末尾显式询问用户是否落稿(沉淀握手)
操作六:Publish(发布到 Hexo)
入口:llmwiki-publish skill
触发:「发布到博客」「推到 Hexo」「生成博客文章」「本地测试」
流程:
Wiki 正式页 → publish 脚本做纯规则转换(wikilink→markdown link、callout→emoji、frontmatter 映射) → 输出到 98_发布/<slug>.md + <slug>/ 图片资产 → --deploy 同步到 Hexo source/_posts/ → hexo g 生成 → 可选 hexo s 本地预览
转换逻辑(确定性,不调 LLM):
| Obsidian 语法 | Hexo 语法 |
|---|---|
[[页面]] |
[页面](页面)(若同被发布)/ **页面**(粗体降级) |
![[image.png]] |
 |
> [!warning] |
> ⚠️ **WARNING** |
^block-id |
清除 |
| Wiki frontmatter 字段 | Hexo 字段(title/date/tags/categories/description) |
CLI:
1 | # 登记 Hexo 工程位置(仅首次) |
当前痛点:98_发布/ 到 Hexo source/_posts/ 是 shutil.copy2 拷贝,每次需传 --deploy。推荐用 Windows 目录交接(mklink /J)让两者指向同一物理位置,消除拷贝步骤。
操作七:Lint / Evolve(巡检保鲜)
Lint 入口:llmwiki-lint skill
Evolve 入口:llmwiki-evolve skill
Lint 检查项:
| 检测项 | 说明 | 自动修复 |
|---|---|---|
| missing_frontmatter | 缺少必填字段 | 否 |
| missing_term_page | 正文有 [[术语]] 但 06_术语/ 无对应页 |
否(触发 llmwiki-term) |
| orphan_page | 无入链的孤立页 | 否 |
| taxonomy_candidate_backlog | 长期未审批的 candidate | 否 |
| stale_related | related_notes 与实际 wiki-link 不一致 | --fix 可修 |
| nested_list | 列表嵌套违规 | 否 |
| broken_wikilink | 指向不存在页面的双链 | 否 |
Evolve 检查项:过期结论检测、冲突检测、重构候选识别。
CLI:
1 | # 健康体检 |
辅助操作:Term(术语管理)
入口:llmwiki-term skill
触发:用户问「X 是什么」,但 06_术语/ 中尚无该词条。
流程:web 搜索 → 整理解释 → 落到 06_术语/<术语>.md → validate → 归档 → 全库 auto-link 回链。
CLI 命令速查
| 命令 | 用途 |
|---|---|
wiki_cli.py validate <path> [--fix] |
校验 frontmatter + taxonomy |
wiki_cli.py ingest-finalize <draft> |
资产搬运 → validate → find-similar 三合一 |
wiki_cli.py archive <draft> <bucket> [--dry-run] |
AI初稿 → 正式目录 |
wiki_cli.py approve <bucket> <name> |
审批 taxonomy candidate |
wiki_cli.py find-similar <draft> [--top N] |
影响面分析 |
wiki_cli.py auto-link [--only <path>] [--dry-run] |
加术语双链 |
wiki_cli.py refresh |
重建 index.md |
wiki_cli.py lint [--fix] |
健康体检 |
wiki_cli.py review-packet <draft> |
生成审阅包 |
wiki_cli.py workbench |
生成待审工作台 |
wiki_cli.py evolve |
保鲜巡检 |
wiki_cli.py publish <path> [--deploy] [--server-bg] |
发布到 Hexo |
wiki_cli.py deprecate <path> [--reason] |
降级到归档 |
wiki_cli.py status [--json] |
仓库总览 |
wiki_cli.py canvas <center> |
生成 Canvas 概念图 |
Skills 映射
| Skill | 对应操作 | 流程阶段 |
|---|---|---|
llmwiki-init |
Init | 仓库创建 |
llmwiki-ingest |
Ingest | 收件箱 → 草稿 |
llmwiki-capture |
Capture | 对话 → 草稿 |
llmwiki-review |
Review | 草稿审阅 |
llmwiki-maintain |
Maintain | 归档 + 互链 |
llmwiki-query |
Query | 检索回答 |
llmwiki-term |
Term | 术语创建 |
llmwiki-publish |
Publish | Wiki → Hexo |
llmwiki-lint |
Lint | 健康体检 |
llmwiki-evolve |
Evolve | 保鲜巡检 |
硬约束速查
- 写正式页面前先写草稿到
99_AI初稿/ - 草稿写完必须跑
validate,通过才能下一步 - ingest/capture 后必须跑
find-similar影响面分析 - 正式层写入后必刷新 index.md 和 log.md
- 所有操作在 log.md 留痕
- 归档前 taxonomy candidate 需审批(不能 AI 自批)
- 列表禁止嵌套
- 能用脚本的不调 LLM
- 破坏性操作先列计划等确认
- 沉淀优先于聊天:稳定结论应主动落进 Wiki