Reworkd
Reworkd 是一个完全托管的网页数据提取平台,能够端到端地运行你的抓取流程。你只需指向网站,它就会扫描页面、生成提取代码、运行爬虫、验证输出,并交付结构化数据,而无需你维护脚本或基础设施。
该平台使用代理读取页面结构,编写有针对性的提取器,而不是从提示中猜测字段。当网站布局或内容发生变化时,自我修复的爬虫能够检测故障并实时修复流程。这种以代码为核心的方法,避免了常见于仅通过提示进行抓取工具中的虚假字段问题。
Reworkd 针对需要大规模可靠网页数据但不愿意看护代理、无头浏览器、分页逻辑或脆弱的维护脚本的数据团队、分析师和工程师。公司宣布将于2025年2月6日停止此产品的服务。
代理读取页面并为您需要的准确字段生成提取代码
自愈爬虫自动检测网站变化并修复失败的流水线
通过一个管理的流水线从网站提取文本、图片和文档
交互式分析仪表板跟踪提取成功率、失败情况和网站变化
REST API加爬取SDK,用于调度任务和集成导出
无需手动设置即可处理代理、验证码破解和并发浏览器
生成真实的提取代码,而不是依赖提示猜测,减少错误字段输出。
自愈管道在目标网站结构或布局变化时减少维护时间。
Freemium Hobby 级别包含 API 访问和定时任务,无需月费。
全托管堆栈涵盖代理、验证码破解和并发浏览器基础设施。
产品将于2025年2月6日停止服务,因此新的长期采用受到限制。
企业定价和基础设施限制需要进行销售沟通。
超出计划内包含额度的部分,将收取基于使用的代理、计算和反机器人费用。
Reworkd 有免费计划吗?
有的。Reworkd 提供一个 Hobby 计划,月费为 $0,包含 10 个并发浏览器、30 天数据保留、API 访问、验证码破解、定时任务,以及 $10 的基础设施使用额度。
Reworkd Pro 多少钱?
Reworkd Pro 每月费用为 $99。它包含 50 个并发浏览器、90 天数据保留、API 访问、验证码破解、定时任务,以及每月 $49 的基础设施使用额度。
抓取的网站内容发生变化时会怎样?
Reworkd 会监控提取页面的内容变化和流水线失败。它的自愈型抓取器能够检测问题并自动修复提取脚本,确保数据持续流动,无需手动重写代码。
Reworkd 需要编写抓取代码吗?
Reworkd 设计为无代码、完全托管的提取平台。其代理自动生成并运行提取代码,但开发者也可以使用 Reworkd API 和抓取 SDK 进行更深度的集成。
Reworkd 还可以使用吗?
Reworkd 宣布将于 2025 年 2 月 6 日结束该产品。官网引导有迁移问题的客户联系 [email protected]。
如何联系 Reworkd 支持?
Reworkd 提供 [email protected] 处理隐私和账户咨询。对于停止服务后的迁移问题,可联系 [email protected]。

