Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 
Cosine 公司 AI 助手 Genie 获 250 万美元融资,刷新 SWE-Bench 记录

Cosine 公司 AI 助手 Genie 获 250 万美元融资,刷新 SWE-Bench 记录

2024-08-14

2024 年 8 月 12 日,Cosine 公司宣布完成了一轮 250 万美元的种子轮融资。这轮融资由美国的风险投资公司 Uphonest 和 SOMA Capital 领投,Lakestar 和 Focal 等公司也参与了投资。Cosine 公司计划利用这笔资金进一步开发其 AI 编程助手 Genie。

Genie 在 SWE-Bench 测试中取得了 30.08% 的高分,超过其他 AI 开发者模型如 Cognition AI Inc. 的 Devin 和 Amazon Web Services Inc. 的 Amazon Q Developer。Genie 的这一成绩刷新了 SWE-Bench 的记录,展示了其在模拟人类推理方面的能力。

Genie 是 Cosine 公司推出的 AI 编程助手,其核心技术在于模拟人类推理。Cosine 公司通过微调 OpenAI 的模型,结合专有数据,训练出了这个能够在复杂编程任务中表现良好的 AI 助手。Genie 能够解决软件中的 bug,构建新功能、重构代码,并且可以与人类开发者协作完成任务。

Cosine 公司的联合创始人兼首席执行官 Alistair Pullen 表示,他们在 2022 年初首次意识到大型语言模型在模拟人类软件开发者方面的潜力。通过将人类推理过程编码并用于训练 Genie 的底层大语言模型,Cosine 公司开发出了这个 AI 软件开发者。

SWE-Bench 是一个评估 AI 编程模型的软件工程基准测试框架,包含 2294 个从 GitHub 问题和相应的 pull requests 中提取的软件工程问题。SWE-Bench 的目的是测试 AI 系统编写真实代码的能力。每个 SWE-Bench 实例都包含一个 GitHub 问题和解决该问题的拉取请求,拉取请求必须包含一个单元测试,该测试在代码更改之前失效并在代码更改之后通过。

AI 日报

查看全部日报

  • AI 技术在医疗领域的突破性应用:从诊断到治疗的全新变革
  • AI 代理战场新核武!OpenAI 发布 o3 模型:比肩人类决策,媲美专业审核
  • 软银 5000 亿美元 AI「星门」陷融资困境,孙正义:短期波动不足为惧
  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!

©2025 毫河风报 沪ICP备18012441号-5