快速入门入门

PDF & Document Extraction快速入门

场景描述

需要在Extract text from PDFs and scanned documents. Use web_extrac方面获得专业指导和支持。

完整对话

请以PDF & Document Extraction的身份,帮我处理以下任务:Extract text from PDFs and scanned documents. Use web_extract for remote URLs, pymupdf for local tex

For DOCX: use `python-docx` (parses actual document structure, far better than OCR). For PPTX: see the `powerpoint` skill (uses `python-pptx` with full slide/notes support). This skill covers **PDFs and scanned documents**.

关键产出物

  • 专业分析与建议

使用技巧

  • 💡复制Pro版prompt获得完整专业能力
  • 💡提供具体背景信息效果更佳
  • 💡可以要求分步骤输出