构建可靠的生成式AI应用:实践测试与持续集成工作坊

2024-12-05

本文回顾了生成式AI应用的测试与持续集成工作坊,并提供了一个演练视频。工作坊重点讲解了如何使用Helix.ml的测试框架,通过另一个AI模型作为自动评估器,以明确的标准判断AI响应的质量,并将此测试过程集成到CI/CD管道中。工作坊中构建了三个不同的AI应用案例:喜剧聊天机器人、文档问答系统和汇率API集成,分别展示了不同的测试挑战。参与者将学习如何编写可测试的规范、创建自动评估以及将测试集成到GitHub Actions或GitLab CI中。

阅读更多
未分类

从点击式操作到GitOps:AI应用开发的演变

2024-11-21

本文探讨了如何弥合无代码AI原型和生产就绪型AI应用之间的差距。作者认为ChatGPT插件的出现,特别是GPTs,使得非AI工程师也能利用AI解决实际问题。然而,像GPTs这样的工具被困在Web界面中,缺乏生产系统的可声明性、版本控制和可重复性。作者提出了一个三层AI应用开发模型:原型设计层(使用Web界面配置)、桥接层(将配置导出为YAML)、生产工程层(添加自动化测试和CI/CD)。文章以JIRA集成和货币汇率API的例子说明了该模型的实际应用,并强调了开源模型的优势。最后,作者鼓励采用快速原型设计、版本控制规范、传统DevOps实践和自动化测试迭代的AI工程模式。

阅读更多
未分类 AI应用开发

我们都能成为AI工程师——开源模型让其成为可能

2024-11-14

本文作者认为,随着AI工具的简化和工作流程的标准化,AI工程的门槛正在迅速降低。即使只有IDE操作经验和使用Git进行YAML推送的技能,也足以成为AI工程师。构建AI应用的核心要素包括模型、提示、知识、集成、测试和部署。作者提倡使用开源模型,确保数据安全,并提供了一个名为“AISpec”的YAML文件,用于整合所有组件。文章最后鼓励读者尝试AI工程,并提供了参考架构和教程链接。

阅读更多
未分类 AI工程师 AISpec