[Python/ML] Category Feature의 Encoding 방법
·
파이썬 Python
0. Category Feature란?Category Feature라고 하면 익숙하지 않을 수 있겠지만, 범주형 변수라고 하면 익숙하다. 범주형 변수란 고유한 값이나 범주의 수가 제한된 변수로써, 명목형 변수와 순서형 변수등이 이에 속한다.범주형 변수 예시Category = ['사과', '바나나', '귤'] num = [3, 5, 6] df = pd.DataFrame({'Category' : Category, 'num' : num}) df범주형 변수는 숫자의 의미가 아니라 고유한 값을 뜻하기 때문에 컴퓨터는 그 고유한 특성을 이해하지 못한다. 따라서, 컴퓨터가 이해할 수 있도록 인코딩 해주어야 하는데 인코딩 방법에는 다음과 같은 것들이 있다.One-Hot EncodingLabel EncodingTarge..