주요 개념
Pipeline
- Kubeflow의 파이프라인은 ML Workflow를 정의하고 자동화를 시켜주며, 각 단계별로 독립 컴포넌트로 구성할 수 있다
- 데이터 전처리, 모델 학습, 평가, 배포 등의 프로세스를 자동화 시켜준다, 이건 MLOps의 파이프라인 기본 개념과 유사하다
Notebook
- Kubeflow의 Notebook은 Jupyter Notebook 환경을 제공하는데, 이는 데이터 분석과 모델 개발을 도와주는 역할이다
- Jupyter Notebook은 데이터 분석, ML 모델 개발에 활용하는 환경이며, Python으로 코드 실행, 결과를 시각화 할 수 있다고 한다
Katib
- Kubeflow의 하이퍼 파라미터 튜닝 도구, ML 모델의 성능 최적화에 사용된다고 함
- 다양한 실험을 자동 생성, 튜닝하여 최적의 하이퍼 파라미터 조합을 찾을수 있다고 한다
- 하이퍼 파라미터란, 사용자가 모델 학습을 위해 설정하는 모든 값들
KFServing
- 모델을 Serving, 훈련된 모델을 배포하고 추론 제공에 사용된다고 한다
- 다양한 ML 프레임워크에서 모델을 쉽게 배포할 수 있게 도와주며, 확장성과 안정성까지 보장한다고 한다
Tensorboard
- TensorFlow로 훈련된 모델의 성능을 시각화하는 도구
- 모델 학습 중 손실, 정확도 등의 지표를 실시간으로 시각화, 모니터링을 할 수 있다 한다
ML Metadata (MLMD)
- ML의 메타데이터를 관리, 실험 결과와 파이프라인 실행 기록을 관리할 수 있다