본문 바로가기

AI

머신러닝 기초

728x90

머신러닝 빠르게 정리하기

  • 데이터 분석 프로세스
  • 모델, 모델링
  • ML, DL, RL
  • 머신러닝 코딩 연습

전체 Process

 

위 방법론에서 시작질문, 끝질문이 가장 중요함 (무엇이 문제인가? / 문제가 해결 되었는가?)

 

회사에서 딥러닝은 비지니스 문제가 있고, 이 문제를 해결하는데 딥러닝 모델링을 가지고 해결하겠다 했을 때 사용되기 때문

 

모델, 모델링

 

  • Model
    • 모델 : 데이터로부터 패턴을 찾아, 수학식으로 정리해 놓은 것
    • 모델링 : 가능한한 오차가 적은 모델을 만드는 과정
  • 모델의 목적 -> 표본을 가지고 모집단 전체를 예측하는 것 (우리가 가진것 = 표본, 알고싶은 것 = 예측)
    • 샘플을 가지고 전체를 잘 추정
      • 샘플 :  표본, 부분집합, 일부, 과거의 데이터 (우리가 들고 있는 데이터!)
      • 전체 : 모집단, 전체집단, 현재와 미래의 데이터
      • 추정 : 예측, 추론

 

머신러닝은 크게 3가지로 분류됨

 

  • supervised : 지도 학습 -> 정답이 있는 채로 학습 (정답이 있으므로 맞았는지 틀렸는지 알 수 있음)
  • unsupervised : 비지도 학습 -> 정답이 없는 채로 학습 (비슷한 데이터 끼리 묶어줘?? 에 개념)
  • reinforcement : 강화 학습 -> 바라는 액션이 있는데 그 액션을 취하면 상을 주고 아님 벌을줘서 오브젝트(에이전트)가 올바로 행동하도록 훈련하는 것

 

머신러닝 코드 구조

 

머신러닝 코드 구조는 크게 데이터 전처리 와 모델링으로 나타낼 수 있음

NaN은 데이터 결측치

 

모델의 성능 평가

 

  • 모델의 성능은 오차(error)를 통해 계산된다.
    • 모델링 : train error를 최소화 하는 모델을 생성하는 과정
    • 모델 튜닝 : validation error 를 최소화 하는 모델 선정하는 과정
  • 평가지표

 

 

실습)

 

 

https://drive.google.com/file/d/1VVvVvHal-_yp50oA5so67d18uOmhhhtD/view?usp=sharing

 

1-1 머신러닝 빠르게 정리하기.ipynb

Colab notebook

drive.google.com

 

728x90

'AI' 카테고리의 다른 글

pytorch 데이터다루기  (0) 2025.02.21
딥러닝 개요  (0) 2025.02.21
LLM 정리  (0) 2025.02.20
# 24.10.16_ 아키텍처 설계 사례 분석 : Netfilx  (7) 2024.10.16
# 24.10.15_ ollama 로컬에서 사용  (0) 2024.10.15