출처
edwith, https://www.edwith.org/, 머신러닝을 위한 Python
Machine Learning Process
- 기존에 있는 데이터를 알고리즘을 사용해서 모델을 만들고 새로운 데이터에 모델을 적용하여 예측하는 방법
- 핵심은 머신러닝 알고리즘과 모델
Key Concepts
Model
- 예측을 위한 수학 공식, 함수 1차 방정식, 확률분포, condition rule
Algorithms
- 어떠한 문제를 플기 위한 과정, Model을 생성하기 위한 (훈련) 과정
모델을 학습할 때 영향을 주는 값들
- y값에 영향을 주는 것은 x값 하나가 아님
Feature
- 머신러닝에서 데이터의 특징을 나타내는 변수
- feature, 독립변수, input 변수 등은 동일의미로 사용
- 일반적으로 Table 상에 Data를 표현할 때 Column을 의미
- 하나의 Data instance(실제 데이터)는 feature vector로 표현
Feature Vector
기본 용어
Pandas
- 엑셀처럼 데이터 사용
Comments