Reworkd

Reworkd

Reworkd 是一个完全托管的网页数据提取平台,能够端到端地运行你的抓取流程。你只需指向网站,它就会扫描页面、生成提取代码、运行爬虫、验证输出,并交付结构化数据,而无需你维护脚本或基础设施。

该平台使用代理读取页面结构,编写有针对性的提取器,而不是从提示中猜测字段。当网站布局或内容发生变化时,自我修复的爬虫能够检测故障并实时修复流程。这种以代码为核心的方法,避免了常见于仅通过提示进行抓取工具中的虚假字段问题。

Reworkd 针对需要大规模可靠网页数据但不愿意看护代理、无头浏览器、分页逻辑或脆弱的维护脚本的数据团队、分析师和工程师。公司宣布将于2025年2月6日停止此产品的服务。

主要功能:
  1. 代理读取页面并为您需要的准确字段生成提取代码

  2. 自愈爬虫自动检测网站变化并修复失败的流水线

  3. 通过一个管理的流水线从网站提取文本、图片和文档

  4. 交互式分析仪表板跟踪提取成功率、失败情况和网站变化

  5. REST API加爬取SDK,用于调度任务和集成导出

  6. 无需手动设置即可处理代理、验证码破解和并发浏览器

Pros:
  1. 生成真实的提取代码,而不是依赖提示猜测,减少错误字段输出。

  2. 自愈管道在目标网站结构或布局变化时减少维护时间。

  3. Freemium Hobby 级别包含 API 访问和定时任务,无需月费。

  4. 全托管堆栈涵盖代理、验证码破解和并发浏览器基础设施。

Cons:
  1. 产品将于2025年2月6日停止服务,因此新的长期采用受到限制。

  2. 企业定价和基础设施限制需要进行销售沟通。

  3. 超出计划内包含额度的部分,将收取基于使用的代理、计算和反机器人费用。

常见问题:

Reworkd 有免费计划吗?

有的。Reworkd 提供一个 Hobby 计划,月费为 $0,包含 10 个并发浏览器、30 天数据保留、API 访问、验证码破解、定时任务,以及 $10 的基础设施使用额度。

Reworkd Pro 多少钱?

Reworkd Pro 每月费用为 $99。它包含 50 个并发浏览器、90 天数据保留、API 访问、验证码破解、定时任务,以及每月 $49 的基础设施使用额度。

抓取的网站内容发生变化时会怎样?

Reworkd 会监控提取页面的内容变化和流水线失败。它的自愈型抓取器能够检测问题并自动修复提取脚本,确保数据持续流动,无需手动重写代码。

Reworkd 需要编写抓取代码吗?

Reworkd 设计为无代码、完全托管的提取平台。其代理自动生成并运行提取代码,但开发者也可以使用 Reworkd API 和抓取 SDK 进行更深度的集成。

Reworkd 还可以使用吗?

Reworkd 宣布将于 2025 年 2 月 6 日结束该产品。官网引导有迁移问题的客户联系 [email protected]

如何联系 Reworkd 支持?

Reworkd 提供 [email protected] 处理隐私和账户咨询。对于停止服务后的迁移问题,可联系 [email protected]

定价:

免费试用和收费混合

标签:

Web Scraping
Data Extraction
Web Data Pipeline
YC Startup

使用的技术:

Next.js
Vercel
Amazon Web Services
Vercel Analytics
Ruby
Typeform
GitHub
Webpack
Tailwind CSS

评论:

Give your opinion on Reworkd :-

Overall rating

Join thousands of AI enthusiasts in the World of AI!

最佳免费 Reworkd 替代方案(和付费)

By Rishit