你的公司决定研发机器学习(ML)。
你有一个才华横溢的数据科学家团队。
他们正在开发模型去解决几年前遥不可及的重要问题。
所有性能指标都让人惊喜。
什么是MLOps(机器学习模型运营化)?
主流框架及使用打分 (来源:麻省理工公开课)
MLOps的挑战
虽然代码是在受控开发环境中精心开发的,但数据来自被称为‘现实世界’的无尽的熵源。
ML = 代码 + 数据
部署缓慢、脆弱且不一致
缺乏可重复性
性能降低(训练服务差)
MLOps实践
混合团队?
团队的确切组成、组织和头衔可能会有所不同,但关键的部分是意识到仅靠数据科学家无法实现 MLOps 的目标。即使一个组织包含所有必要的技能,如果他们不密切合作,它也不会成功。
业务开发或产品团队——用 KPI 定义业务目标
数据工程——数据采集和准备
数据科学 — 构建 ML 解决方案和开发模型
IT 或 DevOps — 完成部署设置,与科学家一起进行监控
机器学习管道
Kubeflow Pipelines 中 ML 管道的可视化表示
ML 管道连接数据和代码以生成模型和预测
像TensorFlow Transform这样的转换框架可以确保基于训练集统计数据的计算(如规范化的平均值和标准偏差)是一致的
特征平台是存储不属于预测请求的值的数据库,例如使用数据流转换根据用户历史记录计算的特征
模型和数据版本控制
模型验证
这是一门令人兴奋的新学科,其工具和实践可能会迅速发展。
数据验证
监测
MLOps 的未来
随着ML从研究到应用业务解决方案的成熟,我们也需要提高其部署流程的成熟度。幸运的是,我们可以ML之前的学科能给到我们许多实践经验。
点击文末阅读原文:
MLOps: Machine Learning as an Engineering Discipline
来源:酷芯微电子
作者:Cristiano Breuel
翻译:酷芯PR团队
校对:酷芯软件工程部 & NPU设计部
END