unstract

unstract

基于LLM的非结构化数据提取工具,支持API部署和ETL流程。

MCP数据与分析开源
形态
MCP
传输协议
http
是否开源
GitHub Stars
★ 6.7k
收录来源
mcp-github

能力说明

Unstract使用大语言模型从文档(如PDF、图片等)中提取结构化JSON数据。用户可以通过自然语言提示定义要提取的内容,并将其部署为API或ETL管道。适用于金融、保险、医疗保健、KYC/合规等多个领域。通过Prompt Studio定义提取模式,几分钟内即可处理新文档类型。支持多种LLM提供商(如OpenAI、Anthropic等),并可通过MCP协议连接到AI代理。

能力点

  • 自然语言定义提取模式
  • 快速处理新文档类型
  • 支持多种LLM提供商
  • API部署和ETL管道
  • MCP协议连接AI代理

适用场景

金融文档自动化处理保险理赔文件解析医疗记录结构化合规性检查

接入方式

依赖:Docker & Docker Compose8 GB RAMLinux或macOS
git clone https://github.com/Zipstack/unstract.git; cd unstract; ./run-platform.sh

以上信息由 AI 基于公开资料整理,可能存在偏差,以来源为准。

常见问题

如何开始使用Unstract?

克隆仓库后运行./run-platform.sh,访问http://frontend.unstract.localhost登录即可。

支持哪些操作系统?

支持Linux和macOS(Intel或M系列)。

相关 Skill