728x90
머신러닝 빠르게 정리하기
- 데이터 분석 프로세스
- 모델, 모델링
- ML, DL, RL
- 머신러닝 코딩 연습
전체 Process
위 방법론에서 시작질문, 끝질문이 가장 중요함 (무엇이 문제인가? / 문제가 해결 되었는가?)
회사에서 딥러닝은 비지니스 문제가 있고, 이 문제를 해결하는데 딥러닝 모델링을 가지고 해결하겠다 했을 때 사용되기 때문
모델, 모델링
- Model
- 모델 : 데이터로부터 패턴을 찾아, 수학식으로 정리해 놓은 것
- 모델링 : 가능한한 오차가 적은 모델을 만드는 과정
- 모델의 목적 -> 표본을 가지고 모집단 전체를 예측하는 것 (우리가 가진것 = 표본, 알고싶은 것 = 예측)
- 샘플을 가지고 전체를 잘 추정
- 샘플 : 표본, 부분집합, 일부, 과거의 데이터 (우리가 들고 있는 데이터!)
- 전체 : 모집단, 전체집단, 현재와 미래의 데이터
- 추정 : 예측, 추론
- 샘플을 가지고 전체를 잘 추정
머신러닝은 크게 3가지로 분류됨
- supervised : 지도 학습 -> 정답이 있는 채로 학습 (정답이 있으므로 맞았는지 틀렸는지 알 수 있음)
- unsupervised : 비지도 학습 -> 정답이 없는 채로 학습 (비슷한 데이터 끼리 묶어줘?? 에 개념)
- reinforcement : 강화 학습 -> 바라는 액션이 있는데 그 액션을 취하면 상을 주고 아님 벌을줘서 오브젝트(에이전트)가 올바로 행동하도록 훈련하는 것
머신러닝 코드 구조
머신러닝 코드 구조는 크게 데이터 전처리 와 모델링으로 나타낼 수 있음
NaN은 데이터 결측치
모델의 성능 평가
- 모델의 성능은 오차(error)를 통해 계산된다.
- 모델링 : train error를 최소화 하는 모델을 생성하는 과정
- 모델 튜닝 : validation error 를 최소화 하는 모델 선정하는 과정
- 평가지표
실습)
https://drive.google.com/file/d/1VVvVvHal-_yp50oA5so67d18uOmhhhtD/view?usp=sharing
1-1 머신러닝 빠르게 정리하기.ipynb
Colab notebook
drive.google.com
728x90
'AI' 카테고리의 다른 글
pytorch 데이터다루기 (0) | 2025.02.21 |
---|---|
딥러닝 개요 (0) | 2025.02.21 |
LLM 정리 (0) | 2025.02.20 |
# 24.10.16_ 아키텍처 설계 사례 분석 : Netfilx (7) | 2024.10.16 |
# 24.10.15_ ollama 로컬에서 사용 (0) | 2024.10.15 |