- 形态
- MCP
- 传输协议
- stdio
- 是否开源
- 是
- GitHub Stars
- ★ 1.5k
- 收录来源
- mcp-github
能力说明
webclaw 是一个快速且本地优先的网页内容提取工具,专为LLM设计。它可以抓取、爬取并提取结构化数据,支持Rust编写。提供CLI、REST API和MCP服务器等多种接入方式。通过webclaw,AI可以将网页转换为干净的Markdown、JSON或LLM可用的上下文。适用于需要从网页中提取有用信息的场景,如文档爬取、竞争对手分析等。
能力点
- ▪抓取单个网页
- ▪爬取整个网站
- ▪提取结构化数据
- ▪生成LLM优化文本
- ▪仅保留主要内容
- ▪包含或排除特定选择器
适用场景
文档爬取和整理竞争对手定价页面对比品牌资产提取网页内容变化监控
接入方式
依赖:Node 环境
npx create-webclaw
以上信息由 AI 基于公开资料整理,可能存在偏差,以来源为准。
常见问题
如何安装webclaw?
使用 `npx create-webclaw` 快速安装。
webclaw支持哪些格式输出?
支持Markdown、JSON、LLM优化文本等。