xhs-skill

GitHub 作者 LeoYeAI/openclaw-master-skills

小红书(创作者中心)登录拿 cookies、发布笔记、导出数据的单一入口技能(浏览器交互委托 agent-browser-stealth)

安装 / 下载方式

TotalClaw CLI推荐
totalclaw install github:LeoYeAI~openclaw-master-skills~xhs-skill
cURL直接下载,无需登录
curl -fsSL https://skills.taituai.com/api/skills/github%3ALeoYeAI~openclaw-master-skills~xhs-skill/file -o xhs-skill.md
本技能是 `xhs-*` 的合并版,目标是让用户只需要 `clawhub install xhs-skill` 一次即可开始使用。

约束:

- 所有浏览器交互(打开页面/点击/输入/上传/截图/登录/导出)全部委托 `agent-browser-stealth`。
- 禁止在本仓库编写/维护发布编排脚本(如 `publish_from_payload`);发布动作必须在会话中由 `agent-browser-stealth` 执行。
- 禁止使用 `agent-browser`(旧通道禁用,统一使用 `agent-browser-stealth`)。
- 所有敏感数据(cookies、导出文件、截图)只落地在本机 `data/` 目录,不要粘贴到聊天里。

执行硬约束(稳定性):

- 同一 `agent-browser-stealth` session 禁止并发操作(串行执行),否则容易触发 `os error 35` 假失败。
- `snapshot` 的 ref 会漂移:关键动作前后必须重抓 `snapshot -i`,并用 `placeholder/role/text` 做二次定位兜底。
- 扫码不等于登录成功;必须做后验校验(见下方 A 节“登录成功判定”)。

## 安装

```bash
clawhub install xhs-skill
cd skills/xhs-skill
npm i
```

说明:`npm i` 仅用于本技能自带的本地 CLI(二维码解码、cookies 工具)。如果你不需要解码二维码/转换 cookies,也可以只用 `agent-browser-stealth` 完成扫码与导出。

## 目录约定(本机)

建议在你运行命令的工作目录下准备:

- `data/xhs_login_qr.png`:登录页二维码截图(PNG)
- `data/raw_cookies.json`:导出的原始 cookies(JSON)
- `data/xhs_cookies.json`:归一化后的 cookies(JSON)
- `data/exports/<YYYY-MM-DD>/`:导出数据(CSV/XLSX/截图)
- `data/assets/<YYYY-MM-DD>/`:发布笔记用的图标/配图素材与来源记录

```bash
mkdir -p data
```

## A. 登录(扫码)并保存 cookies

目标:登录小红书创作者中心并导出 cookies,避免频繁重复登录。

1. 用 `agent-browser-stealth` 打开登录页:

- `https://creator.xiaohongshu.com/login`
- 若默认展示「手机号/验证码登录」,点击「扫码」切换到二维码视图

2. 让 `agent-browser-stealth` 截图保存二维码(PNG)到 `data/xhs_login_qr.png`

3. (可选)用本地 CLI 解码二维码文本并打印 ASCII 二维码:

```bash
node ./bin/xhs-skill.mjs qr show --in ./data/xhs_login_qr.png
```

OpenClaw 回传规范(强制):

- 禁止只回传文件路径(例如仅说 `data/xhs_login_qr.png`)。
- 必须先执行 `node ./bin/xhs-skill.mjs qr show --in ./data/xhs_login_qr.png`,然后把输出的二维码文本 + ASCII 二维码直接发给用户。
- 若会话支持图片渲染,再附上二维码截图绝对路径(或图片附件)作为补充。
- 发完二维码后必须暂停,等待用户确认“已扫码”再继续 cookies 导出。

推荐回传模板:

```text
请用小红书 App 扫这个二维码登录。
二维码文本: <qr_text>
<ASCII QR>
```

4. 用小红书 App 扫码完成登录后,导出 cookies 到 `data/raw_cookies.json`(不走 DevTools):

```bash
agent-browser-stealth cookies --json > ./data/raw_cookies.json
```

5. 归一化 cookies 并保存到 `data/xhs_cookies.json`:

```bash
node ./bin/xhs-skill.mjs cookies normalize --in ./data/raw_cookies.json --out ./data/xhs_cookies.json
node ./bin/xhs-skill.mjs cookies status --in ./data/xhs_cookies.json
```

5.1 推荐用脚本做后验校验(可执行门禁):

```bash
# 例:先让 agent-browser-stealth 记录当前 URL 与后台探测后的 URL
CURRENT_URL="$(agent-browser-stealth get url)"
agent-browser-stealth open https://creator.xiaohongshu.com/creator/home
PROBE_FINAL_URL="$(agent-browser-stealth get url)"

node ./scripts/verify_login.mjs \
  --cookies ./data/xhs_cookies.json \
  --current-url "$CURRENT_URL" \
  --probe-final-url "$PROBE_FINAL_URL" \
  --json
```

登录成功判定(强制):

- 必须同时满足以下 2 条才可回报“登录完成”(`web_session` 不再作为硬依赖):
- 当前 URL 已离开 `/login`
- 可访问创作者后台页面,且不会 401/回跳登录
- 加分项:cookies 中存在“session-like cookie”(例如 `web_session`,或 cookie 名含 `session`)。没有也可能可用,但稳定性更差。
- 任一强制条件不满足,必须回报“登录失败/未完成”,并重试登录流程;禁止误报成功。

登录结果输出契约(JSON):

```json
{
  "task": "xhs_login",
  "ok": true,
  "checks": {
    "left_login": true,
    "backend_not_rejected": true,
    "has_session_like_cookie": true
  },
  "artifacts": {
    "qr_png": "data/xhs_login_qr.png",
    "raw_cookies": "data/raw_cookies.json",
    "normalized_cookies": "data/xhs_cookies.json"
  }
}
```

失败时 `ok=false`,并给出失败项(例如仍在 `/login`、或 probe 回跳),禁止输出“已完成”。

6. (可选)生成 `Cookie:` header:

```bash
node ./bin/xhs-skill.mjs cookies to-header --in ./data/xhs_cookies.json
```

失败回退:

- 二维码解码失败:通常是没有切到扫码视图或二维码太小,让 `agent-browser-stealth` 放大后重新截图(仍为 PNG)。
- cookies 归一化失败:保留原始 `data/raw_cookies.json`,后续再扩展兼容分支。

## A1. 防封/限流运行规范(强制)

核心结论:小红书风控主要看“节奏 + 指纹 + 行为 + IP + 账号权重”。工具本身不是主因,使用方式才是主因。

强制策略:

1. 真人节奏:
- 禁止连续无停顿点击/填写;关键动作之间必须随机停顿(建议 `1.2s~7s`)。
- 输入优先 `type --delay`(逐字),避免全量瞬时 `fill`。

2. 固定指纹:
- 运行发布流程时优先固定 `--profile`,并启用 `--headed`。
- 推荐同一账号长期复用同一个 profile 目录,不要每次新建临时环境。

3. 发布频率门禁:
- 同一 profile 默认 `24h <= 3` 篇。
- 两次发布最小间隔默认 `30` 分钟。
- 命中门禁必须中止,不允许强发。

4. 发布前预热行为:
- 先做一次短时正常浏览(首页/创作者后台停留 + 滚动),再进入发布页。
- 禁止“打开页面后立刻提交”。

5. 网络与设备:
- 禁止机房 IP / 高频切换代理。
- 优先家庭网络或手机热点;同账号尽量保持设备/IP 稳定。

6. 被限流后的处理:
- 限流:停自动化,回归手动正常使用 `3~7` 天。
- 封号:仅能申诉;换号时要同时更换 `profile + IP + 设备环境`。

## B. 发布笔记(图文/视频)

输入(用户提供):

- 笔记类型:图文 或 视频
- 标题、正文、标签(必填)
- 话题(必填;做热点发布时必须是“今天热点”)
- 图片/视频路径(本机绝对路径优先)
- 图标/配图需求(可选):关键词、风格(扁平/拟物/线性)、主色、是否透明背景
- 热点来源(必填):来源名、来源 URL、来源日期(`YYYY-MM-DD`)

发布硬门禁(强制):

1. 先把发布素材整理为 `data/publish_payload.json`(示例):

```json
{
  "topic": "今日热点:xxxx",
  "source": {
    "name": "央视新闻",
    "url": "https://example.com/news",
    "date": "2026-02-12",
    "evidence_snippet": "2月12日该媒体报道提到:......",
    "key_facts": ["关键事实1(含日期/数字)", "关键事实2(含日期/数字)"]
  },
  "post": {
    "title": "20字内标题示例",
    "body": "不少于 80 字的正文......",
    "tags": ["#热点", "#今日新闻", "#小红书运营"],
    "real_topics": ["#人工智能", "#AI资讯", "#科技观察"],
    "media": ["/abs/path/cover.png", "/abs/path/card_1.png"]
  }
}
```

2. 发布前必须执行校验脚本:

```bash
# 普通模式
node ./scripts/verify_publish_payload.mjs --in ./data/publish_payload.json --policy ./config/verify_publish_policy.json --tag-registry ./data/tag_registry.json --min-registry-tags 12 --require-source-evidence on --strict-anti-ai on --json

# 今天热点模式(强制 source.date = 今天)
node ./scripts/verify_publish_payload.mjs --in ./data/publish_payload.json --policy ./config/verify_publish_policy.json --tag-registry ./data/tag_registry.json --min-registry-tags 12 --require-source-evidence on --strict-anti-ai on --mode hot --json
```

3. 发布前必须执行内容审核脚本(分层规则 + AI):

```bash
node ./scripts/review_publish_payload.mjs --in ./data/publish_payload.json --policy ./config/review_policy.json --taxonomy ./config/review_taxonomy.json --ai-provider auto --require-ai off --mode hot --json
```

4. 只有当校验和审核结果都 `ok=true` 才允许进入发布页点击“发布/提交”。
   校验策略在 `./config/verify_publish_policy.json`,审核策略在 `./config/review_policy.json`,分层风险路径在 `./config/review_taxonomy.json`。
5. 任一门禁失败必须中止流程并提示补齐,禁止“只传截图直接发”。

禁止链接(强制):

- 标题/正文/标签里禁止出现任何链接或域名形态(`http/https`、`www.`、`xxx.com/.cn/...`)。否则有封禁风险。
- 如果内容生成遇到困难或校验不通过:宁可中止,不要“随便发一条”。

反 AI 识别与真实标签(强制):

- 不承诺“100% 不被识别为 AI”;目标是显著降低风险。
- 正文必须有“个人视角 + 具体事实信号(数字/日期/来源提及)”,并规避模板腔。
- 发布前必须通过 `review_publish_payload` 审核门禁,要求 `decision=pass`,并输出 `risk_path`、证据和 `review_queue` 供复核。
- `source.evidence_snippet` 与 `source.key_facts` 必填,且能回溯到来源事实。
- 标签与 `post.real_topics` 都必须来自真实话题池 `data/tag_registry.json`,禁止自造标签。
- 禁止自动把 `#标签` 拼进正文冒充话题。
- 发布前必须在小红书发布页手动选择至少 3 个真实话题,然后由 `agent-browser-stealth` 执行最终点击发布。

示例:准备真实标签池(建议每天更新):

```bash
cat > ./data/tag_registry.json <<'JSON'
{
  "updated_at": "2026-02-24",
  "source": {
    "platform": "xiaohongshu",
    "method": "manual_from_publish_topic_picker",
    "url": "https://creator.xiaohongshu.com/creator/publish"
  },
  "tags": ["#AI热点", "#人工智能", "#行业观察", "#科技新闻", "#AI资讯", "#科技观察"]
}
JSON
```

发布执行方式(唯一):

- 本仓库只负责“数据准备 + 门禁校验 + 审核校验”;不再提供发布自动化脚本。
- 浏览器动作必须由 `agent-browser-stealth` 串行执行:预检 -> 填充 -> 读回校验 -> 发布 -> 回查。
- 若任一门禁失败(`verify/review` 非 `ok=true`),必须停止在“发布前”,禁止继续点击提交。

P0:发布编排器(流程编排,不是仓库脚本):

1. 预检:
- 入口路由固定从 `https://creator.xiaohongshu.com/publish/publish` 进入;禁止把 `/creator/*` 作为首入口。
- 若被跳到 `https://creator.xiaohongshu.com/new/home`(“你访问的页面不见了”),立即回到 `/publish/publish` 重试。
- 进入发布页后先切到“图文”模式,再上传图片;未切图文不进入后续步骤。
2. 填充:
- 写标题、正文、标签/话题、可见性。
3. 读回校验:
- 校验通过才允许点击发布。
4. 发布:
- 点击发布后等待页面状态稳定并记录 URL。
5. 回查:
- 先检查 URL 参数包含 `published=true`;
- 再从页面菜单进入“笔记管理”做二次确认,不允许硬编码管理页直链回查。

P0:路由与状态稳定性(强制):

- 稳定入口只认 `/publish/publish`;其他页面只作为中转,不作为成功判定依据。
- “发布页可用”不等于“管理页可用”:发布后必须菜单跳转二次查验。
- 若发布页元素未出现,先检查是否处于“图文模式 + 图片已上传”状态,再判断失败。

P0:选择器双通道(强制):

- 第一通道(默认):语义定位(`placeholder + role + 可见性 + 附近文案`)。
- 第二通道(兜底):DOM 结构线索定位(例如标题输入框 placeholder 语义 + 正文编辑器 `tiptap/ProseMirror` 语义类名)。
- 禁止只依赖 `snapshot ref` 或 `@e1/@e2` 序号;每个关键动作前后都要 `snapshot -i` 二次确认。
- DOM 兜底只作为会话级临时手段,命中后仍需“读回校验”确认字段正确,不把脆弱 selector 当硬依赖。

P0:写入可靠性(强制):

- 标题字段必须满足:单行、可见、可编辑、placeholder 命中“标题”语义。
- 正文字段必须满足:多行或 `contenteditable`、可见、可编辑、placeholder/附近文本命中“正文/内容”语义。
- 写入后必须做“双向读回校验”:同时读取标题和正文,计算 `title_len` 与 `body_len`。
- 错位判定:若 `title_len > 20` 且 `body_len < 80`,或标题命中长段正文特征(大量换行/句号),判定为写入错位。
- 错位自愈:自动执行“交换重写”一次(清空标题与正文 -> 标题写短标题 -> 正文写正文 -> 读回再校验);仍失败则中止并回报失败,不允许继续提交。
- 强制规则:标题禁止包含 `#` 标签、长段正文、链接;标签必须通过小红书发布页“标签/话题交互”选择,不把标签文本塞进标题。

P0:草稿确认闭环(强制):

1. 点击“暂存离开”后,必须等待并验证“保存成功/