Machine Learning Operations (MLOps) là tập hợp các quy trình, công cụ và phương pháp giúp đưa mô hình Machine Learning từ giai đoạn nghiên cứu sang triển khai và vận hành ổn định trong thực tế.
Nó kết hợp:
Machine Learning (ML) → xây dựng mô hình.
DevOps → tự động hóa, triển khai, giám sát.
👉 Nói đơn giản: MLOps giúp mô hình ML không chỉ chạy trong notebook, mà còn sống lâu bền trong sản phẩm thực tế.
ML model nếu chỉ huấn luyện xong và lưu file .pkl hay .h5 thì chưa thể dùng ngay cho người dùng cuối.
MLOps giải quyết:
Tự động hóa pipeline: thu thập dữ liệu → huấn luyện → triển khai.
Quản lý version: dữ liệu, mô hình, code.
Giám sát: mô hình có bị “drift” (lệch dữ liệu) hay không.
Tái huấn luyện: cập nhật khi dữ liệu thay đổi.
Data Engineering
Thu thập, làm sạch, lưu trữ dữ liệu.
Công cụ: Airflow, Spark, DBT.
Model Development
Huấn luyện và đánh giá mô hình.
Công cụ: Scikit-learn, TensorFlow, PyTorch.
Model Versioning & Experiment Tracking
Quản lý nhiều phiên bản mô hình.
Công cụ: MLflow, Weights & Biases.
CI/CD cho ML (Continuous Integration/Deployment)
Tự động kiểm thử và triển khai mô hình.
Công cụ: GitHub Actions, Jenkins, GitLab CI.
Model Serving
Đưa mô hình lên API hoặc batch processing.
Công cụ: FastAPI, Flask, TorchServe, TensorFlow Serving.
Monitoring & Logging
Giám sát hiệu suất mô hình, drift, lỗi hệ thống.
Công cụ: Prometheus, Grafana, Evidently AI.
Retraining & Feedback Loop
Thu thập dữ liệu mới, huấn luyện lại mô hình.
Thu thập dữ liệu (Data Collection).
Tiền xử lý dữ liệu (Data Processing).
Huấn luyện mô hình (Model Training).
Lưu trữ & quản lý phiên bản (Model Registry).
Triển khai mô hình (Model Deployment).
Giám sát mô hình (Monitoring).
Cập nhật & huấn luyện lại (Continuous Training).
👉 Chu trình này lặp đi lặp lại (iterative loop).
Data & Workflow: Airflow, Prefect, Luigi.
Experiment Tracking: MLflow, Weights & Biases.
Deployment: Docker, Kubernetes, FastAPI.
Monitoring: Prometheus, Grafana, Evidently AI.
Cloud Platforms: AWS SageMaker, GCP Vertex AI, Azure ML.
Regression, Classification, Training/Evaluation.
Công cụ: scikit-learn, pandas, matplotlib.
Git/GitHub.
Docker (container hóa).
CI/CD (GitHub Actions).
MLflow để quản lý thí nghiệm.
FastAPI để triển khai mô hình.
Docker + Kubernetes để scale.
Prometheus + Grafana.
Data drift với Evidently AI.
Ví dụ:
Thu thập dữ liệu review phim 🎬.
Huấn luyện mô hình phân loại sentiment.
Deploy bằng FastAPI + Docker.
Track bằng MLflow.
Monitor bằng Evidently AI.
Made With ML – roadmap học MLOps.
Full Stack Deep Learning – khóa học chi tiết.
Sách: Practical MLOps (Noah Gift).
YouTube: Channel “MLOps Community”.