skill-tester-assets-sample-skill

TotalClaw 作者 totalclaw

示例文本处理技能,演示 claude-skills 生态的基本结构与 BASIC 层级要求,支持词频统计、字符分析与文本转换,输出 JSON 与可读格式。

安装 / 下载方式

TotalClaw CLI推荐
totalclaw install totalclaw:totalclaw~skill-tester-assets-sample-skill
cURL直接下载,无需登录
curl -fsSL https://skills.taituai.com/api/skills/totalclaw%3Atotalclaw~skill-tester-assets-sample-skill/file -o skill-tester-assets-sample-skill.md
## 概述(中文)

示例文本处理技能,演示 claude-skills 生态的基本结构与 BASIC 层级要求,支持词频统计、字符分析与文本转换,输出 JSON 与可读格式。

## 技能正文

# 示例文本处理器

---

**名称**:sample-text-processor
**层级**:BASIC
**类别**:文本处理
**依赖**:无(仅 Python 标准库)
**作者**:Claude Skills Engineering Team
**版本**:1.0.0
**最后更新**:2026-02-16

---

## 描述

示例文本处理器是一个简单技能,用于演示 claude-skills 生态中预期的基本结构与功能。本技能提供基础文本处理能力,包括词数统计、字符分析与基本文本转换。

本技能作为 BASIC 层级要求的参考实现,可作为创建新技能的模板。它展示符合生态最佳实践的文件结构、文档标准与实现模式。

本技能处理文本文件,并以人类可读与 JSON 两种格式提供统计与转换结果,展示 claude-skills 仓库中技能的双输出要求。

## 功能

### 核心功能
- **词数分析**:统计总词数、唯一词数与词频
- **字符统计**:分析字符数、行数与特殊字符
- **文本转换**:转换为大写、小写或标题格式
- **文件处理**:处理单个文本文件或批量处理目录
- **双输出格式**:以 JSON 与人类可读格式生成结果

### 技术特性
- 带完整参数解析的命令行接口
- 常见文件与处理错误的错误处理
- 批量操作的进度报告
- 可配置的输出格式与详细级别
- 仅标准库依赖的跨平台兼容

## 用法

### 基础文本分析
```bash
python text_processor.py analyze document.txt
python text_processor.py analyze document.txt --output results.json
```

### 文本转换
```bash
python text_processor.py transform document.txt --mode uppercase
python text_processor.py transform document.txt --mode title --output transformed.txt
```

### 批量处理
```bash
python text_processor.py batch text_files/ --output results/
python text_processor.py batch text_files/ --format json --output batch_results.json
```

## 示例

### 示例 1:基础词数统计
```bash
$ python text_processor.py analyze sample.txt
=== TEXT ANALYSIS RESULTS ===
File: sample.txt
Total words: 150
Unique words: 85
Total characters: 750
Lines: 12
Most frequent word: "the" (8 occurrences)
```

### 示例 2:JSON 输出
```bash
$ python text_processor.py analyze sample.txt --format json
{
  "file": "sample.txt",
  "statistics": {
    "total_words": 150,
    "unique_words": 85,
    "total_characters": 750,
    "lines": 12,
    "most_frequent": {
      "word": "the",
      "count": 8
    }
  }
}
```

### 示例 3:文本转换
```bash
$ python text_processor.py transform sample.txt --mode title
Original: "hello world from the text processor"
Transformed: "Hello World From The Text Processor"
```

## 安装

本技能仅需 Python 3.7 或更高版本及标准库,无外部依赖。

1. 克隆或下载技能目录
2. 进入 scripts 目录
3. 直接用 Python 运行文本处理器

```bash
cd scripts/
python text_processor.py --help
```

## 配置

文本处理器通过命令行参数支持多种配置:

- `--format`:输出格式(json、text)
- `--verbose`:启用详细输出与进度报告
- `--output`:指定输出文件或目录
- `--encoding`:指定文本文件编码(默认:utf-8)

## 架构

本技能采用简单模块化架构:

- **TextProcessor 类**:核心处理逻辑与统计计算
- **OutputFormatter 类**:处理双输出格式生成
- **FileManager 类**:管理文件 I/O 与批量处理
- **CLI 接口**:命令行参数解析与用户交互

## 错误处理

本技能包含以下情况的全面错误处理:
- 文件未找到或权限错误
- 无效编码或损坏的文本文件
- 超大文件的内存限制
- 输出目录创建与写入权限
- 无效的命令行参数

## 性能考虑

- 通过流式处理高效使用大文本文件内存
- 使用字典查找优化词数统计
- 大数据集批量处理带进度报告
- 可配置编码检测以支持国际化文本

## 贡献

本技能作为参考实现,欢迎贡献以展示最佳实践:

1. 遵循 PEP 8 编码标准
2. 包含完整 docstring
3. 添加带示例数据的测试用例
4. 新功能更新文档
5. 确保向后兼容

## 限制

作为 BASIC 层级技能,部分高级功能有意省略:
- 复杂文本分析(情感、语言检测)
- 高级文件格式支持(PDF、Word 文档)
- 数据库集成或外部 API 调用
- 超大数据集的并行处理

本技能展示 claude-skills 生态中 BASIC 层级技能所需的基本结构与质量标准,同时保持简单并聚焦核心功能。