soul-archive

GitHub 作者 LeoYeAI/openclaw-master-skills

Soul Archive — A digital personality persistence system that silently builds your digital soul clone through everyday AI conversations, while continuously improving AI capabilities. Four modes: Soul Extract, Soul Chat, Soul Report, AI Self-Improvement. | 灵魂存档 —— 通过日常对话静默构建数字人格克隆体，同时持续改进 AI 自身能力。四大模式：灵魂沉淀、灵魂对话、灵魂报告、AI 自我改进。Trigger words: soul extract, soul archive, soul update, soul sync, soul snapshot, soul sediment, soul report, soul chat, self-reflect, self-improve, learn from mistakes, 灵魂沉淀, 灵魂提取, 灵魂存档, 灵魂报告, 灵魂对话, 自我反思, 自我批评, 自我学习.

安装 / 下载方式

TotalClaw CLI推荐

totalclaw install github:LeoYeAI~openclaw-master-skills~soul-archive

cURL直接下载，无需登录

curl -fsSL https://skills.taituai.com/api/skills/github%3ALeoYeAI~openclaw-master-skills~soul-archive/file -o soul-archive.md

# 🧬 灵魂存档（Soul Archive）

> "每一次对话都是灵魂的一个切片。足够多的切片，就能重建一个完整的你。"

## 概述

灵魂存档是一个**数字人格持久化系统**。它在与用户的日常对话中，静默提取并归档用户的：

- 🗣️ **说话习惯** —— 口头禅、句式偏好、用词风格、幽默感
- 🧠 **知识与观点** —— 对各话题的看法、专业知识、思维模式
- 👤 **个人信息** —— 身份、经历、关系、生活细节
- 💫 **性格特征** —— 决策风格、情绪模式、价值观
- 🎤 **语音特征**（可选）—— 音色、语速、口音
- ❤️ **情感模式** —— 情绪触发、表达方式、共情模式

最终形成一个**数字灵魂副本**，可以：
1. **生前**：以用户的风格代为行事、回复消息
2. **身后**：让亲友继续与"你"对话，延续情感连接

## 核心原则

### 🔒 隐私第一
- 所有数据存储在用户主目录 `~/.skills_data/soul-archive/` 下，**不上传任何云端**
- `~/.skills_data/soul-archive/` 通过 Python 的 `Path.home()` 解析，三大平台均可使用：
  - macOS / Linux: `~/.skills_data/soul-archive/` → `/Users/xxx/.skills_data/soul-archive/` 或 `/home/xxx/.skills_data/soul-archive/`
  - Windows: `%USERPROFILE%\.skills_data\soul-archive\` → `C:\Users\xxx\.skills_data\soul-archive\`
- 用户可通过 `config.json` 精细控制采集维度
- 敏感话题（健康、财务、亲密关系）默认需确认后才记录

### 🤫 静默采集
- 不打断对话流，不额外追问
- 在对话自然进行中提取信息
- 只在发现**新的、有价值的**信息时才更新存档

### 📐 高置信度
- 每条信息附带置信度分数
- 用户明确表述 > 推断得出 > 模糊暗示
- 矛盾信息标记冲突，不自动覆盖

---

## 架构：Skill 与数据分离

```
{SKILL_DIR}/                               ← Skill（你在这里）
~/.skills_data/soul-archive/                           ← 数据（灵魂本体，存放于用户主目录下）
```

Skill 是提取引擎，`~/.skills_data/soul-archive/` 是灵魂数据。数据在用户主目录下，不管用什么 IDE、AI 工具、工作目录，只要在同一台机器上都能访问同一份灵魂数据。

> `{SKILL_DIR}` 在 macOS/Linux 上通常是 `~/.workbuddy/skills/soul-archive/`，
> 在 Windows 上是 `%USERPROFILE%\.workbuddy\skills\soul-archive\`。
>
> `~/.skills_data/soul-archive/` 在代码中通过 `Path.home() / ".skills_data" / "soul-archive"` 解析，Windows 上实际为 `C:\Users\<用户名>\.skills_data\soul-archive\`。

---

## 数据目录结构

```
~/.skills_data/soul-archive/
├── profile.json                  # 灵魂核心档案（完整度、版本）
├── config.json                   # 隐私与采集配置
├── identity/
│   ├── basic_info.json           # 姓名、年龄、职业、地点...
│   └── personality.json          # 性格、价值观、MBTI...
├── memory/
│   ├── episodic/                 # 情景记忆（按日期的经历提取）
│   │   └── YYYY-MM-DD.jsonl
│   ├── semantic/
│   │   ├── topics.json           # 话题兴趣与观点图谱
│   │   └── knowledge.json        # 专业知识与认知
│   └── emotional/
│       └── patterns.json         # 情感触发与反应模式
├── style/
│   ├── language.json             # 语言指纹（口头禅、句式）
│   └── communication.json        # 沟通偏好
├── voice/                        # 语音数据（可选）
│   ├── samples/
│   └── voice_profile.json
├── relationships/
│   └── people.json               # 人际关系图谱
├── agent/                        # 🆕 AI 自我改进
│   ├── patterns.json             # 行为模式库
│   ├── episodes/                 # 工作经历（按日期）
│   │   └── YYYY-MM-DD.jsonl
│   ├── corrections.jsonl         # 自我批评/纠正日志
│   └── reflections.jsonl         # 自我反思日志
└── soul_changelog.jsonl          # 灵魂变更日志
```

---

## 四大工作模式

### 模式 1：🔍 灵魂沉淀（Soul Extract）

**触发**：用户说以下任意触发词，或在每次对话结束时自动触发。

> **存档触发词**（均可触发灵魂沉淀）：
> - 沉淀类：灵魂沉淀、沉淀一下、让灵魂沉淀
> - 提取/提炼类：灵魂提取、灵魂提炼、提炼灵魂、分析我
> - 存档/记录类：灵魂存档、存档一下、记录灵魂、灵魂记录、灵魂归档
> - 采集/收集类：灵魂采集、采集灵魂、灵魂收集、收集灵魂
> - 更新/刷新类：灵魂更新、更新灵魂、灵魂刷新、刷新灵魂
> - 其他：灵魂快照、灵魂切片、灵魂印记、灵魂备份、灵魂写入、灵魂同步、灵魂结晶、灵魂凝练
> - 英文：soul extract、soul archive、soul update、soul sync、soul snapshot、soul sediment

**流程**：
1. 读取当前对话内容
2. 运行 `scripts/soul_extract.py`，对对话进行多维度分析
3. 将提取结果合并到 `~/.skills_data/soul-archive/` 各数据文件
4. 更新 `profile.json` 的完整度分数
5. 追加 `soul_changelog.jsonl`

**提取维度**：

| 维度 | 提取内容 | 存储位置 |
|------|---------|---------|
| 身份信息 | 姓名、年龄、职业、地点、教育 | identity/basic_info.json |
| ↳ 生活习惯 | 作息、饮食偏好、审美风格、消费习惯、音乐/电影/书籍品味 | identity/basic_info.json |
| ↳ 数字身份 | 常用App、社交平台、网名风格、技术水平 | identity/basic_info.json |
| 性格特征 | MBTI、大五人格、价值观、决策风格 | identity/personality.json |
| ↳ 行为模式 | 风险偏好、拖延程度、完美主义、计划性、学习方式、工作风格 | identity/personality.json |
| ↳ 社交风格 | 社交能量、群体角色、信任方式、冲突处理 | identity/personality.json |
| ↳ 驱动力 | 成就/金钱/认可/自由/好奇心等核心动机 | identity/personality.json |
| 语言风格 | 口头禅、常用表情、句式偏好、幽默类型 | style/language.json |
| ↳ 深度指纹 | 方言特征、语气词、说服方式、叙事风格、同意/不同意时的表达 | style/language.json |
| 沟通模式 | 直接/委婉、逻辑/感性、详细/简洁 | style/communication.json |
| 话题观点 | 感兴趣的话题、对各话题的立场和观点 | memory/semantic/topics.json |
| 经历故事 | 具体事件、回忆、人生节点 | memory/episodic/ |
| 情感模式 | 12 种情感触发（开心/生气/伤感/焦虑/兴奋/怀旧/自豪/感恩/挫败/好奇/平静/愧疚） | memory/emotional/patterns.json |
| ↳ 情感深度 | 共情能力、情绪觉察、安慰活动、庆祝方式 | memory/emotional/patterns.json |
| 人际关系 | 提到的人物及关系 | relationships/people.json |

**提取规则**：
- 只提取有把握的信息（置信度 > 0.6）
- 新信息与已有信息冲突时，标记冲突而非覆盖
- 每次提取后输出简报：发现了什么新信息、更新了哪些维度

**执行方式**：
```bash
# 使用默认数据目录（~/.skills_data/soul-archive/）
python3 scripts/soul_extract.py \
  --input "<对话内容或文件路径>" \
  --mode auto

# 指定自定义数据目录
python3 scripts/soul_extract.py \
  --soul-dir "/custom/path" \
  --input "<对话内容>" \
  --mode auto
```

> 注：脚本位于 `{SKILL_DIR}/scripts/`，`{SKILL_DIR}` 即本 Skill 所在目录。
> Windows 用户请使用 `python` 替代 `python3`。

### 模式 2：💬 灵魂对话（Soul Chat）

**触发**：用户说"灵魂对话"、"soul chat"、"让XX跟我说话"。

**流程**：
1. 加载 `~/.skills_data/soul-archive/` 全部数据
2. 构建角色扮演 System Prompt，包括：
   - 身份信息（我是谁）
   - 性格特征（我怎么想）
   - 语言风格（我怎么说）—— 包含口头禅、句式模板、用词偏好
   - 知识观点图谱（我知道什么、我对什么有看法）
   - 情感反应模式（什么让我高兴/难过）
   - 人际关系（我认识谁）
3. 以克隆体身份进行对话

**关键约束**：
- ⚠️ **绝不编造**：只基于存档中有记录的信息回答。不确定的说"这个我不太记得了"
- ⚠️ **风格一致**：严格模仿存档中的语言风格，包括口头禅的使用频率
- ⚠️ **情感真实**：对话中展现存档记录的情感模式，而非通用AI式回复

**执行方式**：
```bash
python3 scripts/soul_chat.py \
  --mode interactive
```

### 模式 3：📊 灵魂报告（Soul Report）

**触发**：用户说以下任意触发词。

> **报告触发词**（均可触发生成 HTML 画像报告）：
> - 报告类：灵魂报告、生成报告、总结报告、获取报告、查看报告、展示报告
> - 画像类：我的画像、生成画像、总结画像、获取画像、查看画像、展示画像
> - 英文：soul report

**流程**：
1. 读取 `~/.skills_data/soul-archive/` 全部数据
2. 生成一份完整的 HTML 人格画像报告，包含：
   - 📌 基础画像卡片
   - 🎯 性格雷达图（大五人格 / 自定义维度）
   - 🗣️ 语言风格分析（词云、口头禅排行）
   - 🔥 话题兴趣热力图
   - 🕸️ 人际关系网络图
   - ❤️ 情感模式分析
   - 📈 完整度评估 & 补充建议
3. 输出为可交互的 HTML 文件

**执行方式**：
```bash
python3 scripts/soul_report.py \
  --output ~/.skills_data/soul-archive/reports/soul_report.html
```

### 模式 4：🔄 AI 自我改进（Self-Improvement）

**触发**：用户说以下任意触发词，或 AI 完成实质性任务后自动触发。

> **自我改进触发词**：
> - 反思类：自我反思、反思一下、总结教训、学到了什么
> - 批评类：自我批评、改进记录
> - 学习类：自我学习、查看改进
> - 英文：self-reflect、self-improve、learn from mistakes

**四大能力**：

#### 4.1 自我反思（Self-Reflection）
任务完成后回顾工作，评估做得好/不好的地方。

```python
builder.add_reflection(
    task='迁移数据目录',
    outcome='success',
    went_well=['全面扫描了路径'],
    went_wrong=['遗漏了一个目录'],
    lesson='迁移前应全面扫描所有目录'
)
```

#### 4.2 自我批评（Self-Critique）
被用户纠正时记录错误、分析原因、标记改进方向。

```python
builder.add_critique(
    trigger='user_correction',
    user_said='不要胡扯，就填我发的',
    what_i_did_wrong='多写了不存在的细节',
    root_cause='过度发挥',
    correction='严格按用户指令执行',
    severity='high',
    pattern_id='pat-strict-instruction-following'
)
```

#### 4.3 自我学习（Self-Learning）
从经验中抽象出可复用的行为模式，存入 patterns.json。

```python
builder.add_pattern(
    'pat-strict-instruction-following',
    '严格按指令执行',
    '用户给出明确指令时，严格执行，不添加额外内容',
    source='user_correction', confidence=0.95
)
```

#### 4.4 自组织记忆（Self-Organized Memory）
记忆量增长后自动：合并重复模式、调整置信度、清理过时记忆。

**数据目录**：

```
~/.skills_data/soul-archive/agent/
├── patterns.json          ← 行为模式库
├── episodes/              ← 工作经历（按日期）
│   └── YYYY-MM-DD.jsonl
├── corrections.jsonl      ← 自我批评/纠正日志
└── reflections.jsonl      ← 自我反思日志
```

**执行方式**：
```bash
# 查看 AI 自我改进状态
python3 scripts/soul_reflect.py --mode status

# 查看行为模式库
python3 scripts/soul_reflect.py --mode patterns
```

---

## 初始化

首次使用时，运行初始化脚本创建数据目录：

```bash
python3 scripts/soul_init.py
```

> 默认在 `~/.skills_data/soul-archive/`（用户主目录）下创建完整的目录结构和默认配置文件。
> 可通过 `--soul-dir /custom/path` 指定自定义路径。
> Bash 版 `soul_init.sh` 仍保留供 macOS/Linux 用户使用。

---

## 自动触发机制

### 对话结束时的自动分析（所有 Agent 通用）

当 `config.json` 中 `auto_extract` 为 `true` 时，**每次与用户的实质性对话结束后**，AI 必须自动执行以下两项：

**1. 灵魂沉淀（用户维度）**：
1. 回顾本次对话内容
2. 识别是否包含新的人格信息
3. 如果有，调用 `soul_extract.py` 进行提取
4. 静默更新存档，不打断用户

**2. 自我反思（AI 维度）**：
1. 回顾本次工作过程
2. 识别做得好和做得不好的地方
3. 如果用户纠正过 AI，记录为自我批评（correction）
4. 如果发现可复用的经验，抽象为行为模式（pattern）
5. 调用 `soul_reflect.py` 的 `AgentMemory.save_extraction()` 保存

> ⚠️ **这是指令级约束**：加载了本 SKILL.md 的任何 Agent 都必须遵守此规则，不依赖 hooks 机制。
> 类似于 WorkBuddy 的 working_memory 机制——通过提示词约束 AI 在每次对话结束后自动写入记录。

### Hooks 自动触发（支持 hooks 的 Agent）

如果你的 Agent 支持 hooks（如 Claude Code），可以配置自动触发：

```json
{
  "hooks": {
    "PostToolUse": [
      {
        "matcher": "Bash",
        "hooks": [
          {
            "type": "c