2024 年 8 月 12 日,Cosine 公司宣布完成了一轮 250 万美元的种子轮融资。这轮融资由美国的风险投资公司 Uphonest 和 SOMA Capital 领投,Lakestar 和 Focal 等公司也参与了投资。Cosine 公司计划利用这笔资金进一步开发其 AI 编程助手 Genie。
Genie 在 SWE-Bench 测试中取得了 30.08% 的高分,超过其他 AI 开发者模型如 Cognition AI Inc. 的 Devin 和 Amazon Web Services Inc. 的 Amazon Q Developer。Genie 的这一成绩刷新了 SWE-Bench 的记录,展示了其在模拟人类推理方面的能力。
Genie 是 Cosine 公司推出的 AI 编程助手,其核心技术在于模拟人类推理。Cosine 公司通过微调 OpenAI 的模型,结合专有数据,训练出了这个能够在复杂编程任务中表现良好的 AI 助手。Genie 能够解决软件中的 bug,构建新功能、重构代码,并且可以与人类开发者协作完成任务。
Cosine 公司的联合创始人兼首席执行官 Alistair Pullen 表示,他们在 2022 年初首次意识到大型语言模型在模拟人类软件开发者方面的潜力。通过将人类推理过程编码并用于训练 Genie 的底层大语言模型,Cosine 公司开发出了这个 AI 软件开发者。
SWE-Bench 是一个评估 AI 编程模型的软件工程基准测试框架,包含 2294 个从 GitHub 问题和相应的 pull requests 中提取的软件工程问题。SWE-Bench 的目的是测试 AI 系统编写真实代码的能力。每个 SWE-Bench 实例都包含一个 GitHub 问题和解决该问题的拉取请求,拉取请求必须包含一个单元测试,该测试在代码更改之前失效并在代码更改之后通过。

