- 形态
- Agent Skill
- 是否开源
- 是
- GitHub Stars
- ★ 1.0k
- 收录来源
- skill-github
能力说明
该技能可以将幻灯片图片、PDF文件或基于图像的PPTX文件转换为可编辑的PowerPoint文档。它通过OCR识别文本,并尽量恢复为原生文本框,简单几何形状恢复为PowerPoint形状,复杂视觉元素保留为独立图片资产。适合需要将截图式或图片式的幻灯片转换为易于二次编辑的PPT。使用时建议在Codex中开启完全访问权限以避免频繁中断。
能力点
- ▪图片转可编辑PPT
- ▪PDF转可编辑PPT
- ▪图片版PPT转可编辑PPT
- ▪OCR文字识别
- ▪简单几何形状恢复
- ▪复杂视觉元素保留
适用场景
将单张或多张slide图片转换为可编辑PPT将多页PDF转换为多页PPT将图片版PPT页面转换为可编辑PPT复刻单页视觉设计并保留文本可编辑性
接入方式
依赖:API KeyNode 环境
无需手动安装,AI会在执行过程中自动安装依赖。
以上信息由 AI 基于公开资料整理,可能存在偏差,以来源为准。
常见问题
是否需要配置第三方API?
推荐配置百度PaddleOCR-VL的Token以提高文字识别质量,但非必须。
运行时间长吗?
是的,特别是多页PPT转换可能需要较长时间。
相关 Skill
interview-coach-skill
可转工具面试教练技能,覆盖从简历优化到模拟面试的整个求职周期。
Agent Skill
cli
Google Workspace CLI,为人类和AI代理提供统一的命令行工具。
Agent Skill
pm-claude-skills
可转工具207个专业AI技能,涵盖21个职业领域。
Agent Skill
gpt-image2-ppt-skills
用 OpenAI gpt-image-2 生成高审美、高完成度的 PPT。
Agent Skill
mcp-atlassian
Atlassian 工具(Confluence、Jira)的 MCP 服务器。
MCP
whatsapp-mcp
WhatsApp MCP 服务器,允许 AI 读取和发送 WhatsApp 消息。
MCP