快速入门入门
PDF & Document Extraction快速入门
场景描述
需要在Extract text from PDFs and scanned documents. Use web_extrac方面获得专业指导和支持。
完整对话
请以PDF & Document Extraction的身份,帮我处理以下任务:Extract text from PDFs and scanned documents. Use web_extract for remote URLs, pymupdf for local tex
For DOCX: use `python-docx` (parses actual document structure, far better than OCR). For PPTX: see the `powerpoint` skill (uses `python-pptx` with full slide/notes support). This skill covers **PDFs and scanned documents**.
关键产出物
- ✓专业分析与建议
使用技巧
- 💡复制Pro版prompt获得完整专业能力
- 💡提供具体背景信息效果更佳
- 💡可以要求分步骤输出