Word Reader
读取 Word 文档(.docx 和 .doc 格式)并提取文本内容。支持文档解析、表格提取、图片处理等功能。使用当用户需要分析 Word 文档内容、提取文本信息或批量处理文档时。
New
Join 0+ developers using this skill
skill
Data & Analytics
beginner
读取 Word 文档(.docx 和 .doc 格式)并提取文本内容。支持文档解析、表格提取、图片处理等功能。使用当用户需要分析 Word 文档内容、提取文本信息或批量处理文档时。
Real data. Real impact.
Emerging
Developers
Per week
Open source
Skills give you superpowers. Install in 30 seconds.
使用 Python 解析 Word 文档,提取文本内容和结构化信息。
python3 {baseDir}/scripts/read_word.py <文件路径>
# JSON 输出 python3 {baseDir}/scripts/read_word.py <文件路径> --format json纯文本输出
python3 {baseDir}/scripts/read_word.py <文件路径> --format text
Markdown 格式
python3 {baseDir}/scripts/read_word.py <文件路径> --format markdown
# 只提取文本 python3 {baseDir}/scripts/read_word.py <文件路径> --extract text提取表格数据
python3 {baseDir}/scripts/read_word.py <文件路径> --extract tables
获取文档元数据
python3 {baseDir}/scripts/read_word.py <文件路径> --extract metadata
# 处理目录下所有 .docx 文件 python3 {baseDir}/scripts/read_word.py <目录路径> --batch
| 参数 | 说明 | 默认值 |
|---|---|---|
| 输出格式(json/text/markdown) | text |
| 提取内容类型(text/tables/images/metadata/all) | all |
| 批量处理模式 | false |
| 输出文件路径 | stdout |
| 文本编码(utf-8/gb2312) | utf-8 |
{ "metadata": { "title": "文档标题", "author": "作者姓名", "created": "2024-01-01T10:00:00", "modified": "2024-01-01T12:00:00" }, "text": "文档全文内容...", "tables": [ [ ["表头1", "表头2"], ["行1列1", "行1列2"], ["行2列1", "行2列2"] ] ], "images": [ { "filename": "image1.png", "description": "图片描述", "size": "1024x768" } ] }
# 文档标题作者:作者姓名
创建时间:2024-01-01 10:00:00正文内容
这是文档的正文内容...
表格示例
表头1 表头2 行1列1 行1列2 行2列1 行2列2
图片列表
image1.png (1024x768) - 图片描述
python3 {baseDir}/scripts/read_word.py 项目需求.docx --format markdown
python3 {baseDir}/scripts/read_word.py 会议记录.docx --extract text
python3 {baseDir}/scripts/read_word.py ./文档目录 --batch --format json --output results.json
pip3 install python-docx
对于 .doc 格式支持:
# Ubuntu/Debian sudo apt-get install antiwordmacOS
brew install antiword
脚本会自动处理以下文档元素:
No automatic installation available. Please visit the source repository for installation instructions.
View Installation Instructions1,500+ AI skills, agents & workflows. Install in 30 seconds. Part of the Torly.ai family.
© 2026 Torly.ai. All rights reserved.