在 2024 年 8 月 12 日,博主 Santiago 通过 GitHub Actions 构建了一个完整的模型训练工作流,涵盖了测试代码、训练模型和发布新版本的全过程。Santiago 在他的博客和社交媒体上详细介绍了这一过程,并特别提到 GitHub Workspace Copilot 在其中发挥了作用。量子位的微博视频也展示了他的构建细节,包括如何逐步检查代码细节、进行测试和发布等内容。
GitHub Actions 是一种 CI/CD(持续集成和持续交付)平台,允许开发者自动化、定制和执行软件开发工作流。通过 GitHub Actions,开发者可以在代码库中定义一系列任务,这些任务将在特定事件发生时自动执行,如代码提交或拉取请求。Santiago 利用这一平台,创建了一个完整的模型训练工作流。
具体来说,Santiago 的工作流包括以下几个步骤:
-
** 代码编译 **:在这一阶段,GitHub Actions 会自动拉取最新的代码,并在指定的环境中进行编译。Santiago 选择了一个基于 Ubuntu 的环境,以确保代码在不同操作系统上的兼容性。
-
** 测试 **:编译完成后,工作流会自动运行一系列单元测试和集成测试,以确保代码的正确性和稳定性。Santiago 使用了 GitHub 提供的测试工具,这些工具可以自动生成测试报告,并在测试失败时发送通知。
-
** 模型训练 **:在测试通过后,工作流会自动启动模型训练过程。Santiago 使用了一个预先配置好的 Docker 容器,其中包含了所有必要的依赖项和工具。训练过程中的日志和中间结果会被实时记录,并上传到 GitHub 的存储库中。
-
** 发布 **:最后,工作流会自动将训练好的模型发布到指定的服务器或云存储中。Santiago 选择了 GitHub Packages 作为他的发布平台,这样可以确保模型的版本控制和安全性。
GitHub Workspace Copilot 是 GitHub 推出的一款 AI 编程助手,旨在帮助开发者提高编程效率。Copilot 基于 OpenAI 的 GPT 模型,能够自动生成代码、提供代码建议,并帮助开发者解决编程问题。Santiago 在他的博客中介绍了他使用 Copilot 的体验。
GitHub Models 是 GitHub 最近推出的一项新功能,旨在为开发者提供一个互动的沙盒环境,让他们可以测试和比较各种生成式 AI 模型。通过 GitHub Models,开发者可以在一个集成环境中尝试不同的 AI 模型,从而加速开发进程。Santiago 在他的博客中提到,GitHub Models 为他的模型训练工作流提供了便利,使他能够更轻松地实验和优化模型。

