MLOps

[MLOps] 3. 실험 관리

mlslly 2024. 4. 17. 17:38

## 머신러닝의 실험관리

- 머신러닝에서 '실험 관리'란, 데이터 - 모델 학습 - 모델 평가로 이어지는 일련의 실험 과정을 체계적으로 기록 및 관리하는 것.

- 실험을 거듭할 수록 수기나 엑셀로 정리 불가, 관리의 '자동화'의 필요성이 대두됨.

 

## 실험 관리의 대상

1. 실험중 발생하는 정보들 : train loss history, metric score ...

2. 실험 재현을 위한 정보들 : data, package version, code, parameters...

 

## 실험 관리 도구들 

대표적인 실험 관리 도구들 아래와 같으며, 순서대로 local -> cloud 환경에 가깝다.

1. Tensorboard : local에 쉽게 설치 가능, tensorflow에 친화적 

2. MLflow : 자체 서버 구축 쉽고, 실험 평가 지표 시각화 가능  

3. WandB : SaaS 형식으로 실험 기록, 다양한 시각화 기능

 

이외에도 다양한 관리 도구들이 있음. 강의에서는 MLflow 중심으로 설명 예정

 

실험관리 관련 참고 링크 

- https://brunch.co.kr/@chris-song/101

 

MLOps 1. 실험 관리

AI 혁신 속도는 모델 학습에서 배포까지 걸리는 속도에 비례한다 | AI 혁신 속도는 모델 학습에서 배포까지 걸리는 속도에 비례한다 단순하지만 정말 중요하고 중요한 말이다. 만약 여러분의 회

brunch.co.kr

- https://zzsza.github.io/mlops/2020/03/22/ml-experiment-management-using-neptune-ai/

 

머신러닝 Experiment Management 쉽게 하기(feat. neptune ai)

neptune ai를 활용해 머신러닝 실험 관리를 더 편하게 하는 방법에 대해 작성한 글입니다 키워드 : Machine learning experiment management

zzsza.github.io

 

* 프로그래머스의 마키나락스 MLOPS 강의를 참고하여 작성함