在 AI 领域,Reworkd 由 AgentGPT 的作者们创立,专注于数据抓取技术,目标是简化和自动化从网络中提取结构化数据的过程。最近,Reworkd 完成了 275 万美元的种子轮融资,投资者包括 Paul Graham、AI Grant(由 Nat Friedman 和 Daniel Gross 创办的创业加速器)、SV Angel、General Catalyst 和 Panache Ventures。去年,他们已经从 Panache Ventures 和 Y Combinator 获得了 125 万美元的 pre-seed 投资,这样一来,Reworkd 的总融资额达到了 400 万美元。
Reworkd 的客户只需提供数百甚至数千个网站的列表,并指定他们感兴趣的数据类型。接下来,Reworkd 的 AI 代理会使用多模态代码生成技术,将这些数据转化为结构化数据。代理会为每个网站生成独特的代码,提取客户所需的数据。这种方式提高了数据抓取的效率,免去了大量的手动编码工作。
Reworkd 的 “自愈” 技术确保网页抓取器不会因为网页更新而崩溃,传统的抓取器通常需要人工干预来适应网页的变化,而 Reworkd 的 AI 代理能够自动生成代码,适应这些变化,保持抓取器的稳定性和连续性。
另外,Reworkd 团队还推出了 Banana-lyzer,这是一个开源评估框架,用于定期评估数据抓取的准确性。通过 Banana-lyzer,Reworkd 能定期检查和评估抓取结果的准确性,确保数据的质量和可靠性。