MachineLearning 2

[MLstudy] 1. 피처 엔지니어링 - 1) 피처 정규화

피쳐 정규화 (Feature Normalization) 의 목적 피쳐 정규화는 피쳐에 대한 정규화 처리로 서로 다른 지표들을 비교할 수 있도록 한다. 예를 들어 몸무게와 키가 건강에 미치는 영향에 대해서 분석한다고 할 때, 몸무게는 50~100kg 사이의 범주에, 키는 160~180cm 사이의 범주에 일반적으로 있게 될텐데, 이때 분석 결과는 수치 범위가 넓은 체중 피쳐에 편향될 가능성이 높다. 또한 두 값의 평균, 분산, min, max가 제각각이라면 두 피쳐에 대한 비교가 어렵고 모델의 학습 성능이 떨어질 확률이 높은 것. 수치형 데이터에 피쳐 정규화를 하면, 모든 피쳐를 대략 비슷한 수치 구간으로 이동시킬 수 있고, 피쳐끼리의 비교가 가능해진다. 피쳐 정규화의 종류 1) 선형함..

ML study 2024.04.24

[MLOps] 7. MLflow 로깅 실습

모델 파일 실행시 mlflow로 로깅해보기 모델이 있는 py파일에 로깅 코드를 함께 추가해서 실행해보자. 원래 train.py에 있는 내용은 아래 링크 참고하면 된다. 아래 파일 내용에서 mlflow관련 부분 제외된 것. https://ysryuu.tistory.com/4?category=1165111 [MLOps] 2. 도커 사용 실습 - 이미지 build 및 .py파일 재현 1. 설치된 패키지 확인하기 $pip3 freeze 설치된 패키지들 및 버전을 확인할 수 있다. 2. 도커 설치하기 나는 맥북을 사용중이라 아래 사이트에서 맥용 데스크탑 버전을 다운 받았다. https://docs.docker.c ysryuu.tistory.com import mlflow from sklearn.datasets ..

MLOps 2024.04.18