onehotencoding1 [머신러닝]Label Encoder vs One Hot Encoder(레이블인코더, 원핫인코더) 머신러닝에 사용되는 대표적인 인코딩 방법에는 Label Encoder, One Hot Encoder 방식이 있다. 인코딩이 중요한 이유는 머신러닝에 들어가는 데이터가 어떤 데이터인지에 따라 성능이 좌우 되기 때문이다. 우선 기본적으로는 결측치(NULL)값은 허용되지 않는다. 데이터분석과는 다르게 머신러닝 모델을 돌리기 위해서는 결측치가 대부분이라면 해당 데이터 Feature 들은 제거 하는것이 좋다. 단순 아이디나, 관리번호 등 단순한 행의 식별역할로써 쓰이는 요소들은 예측에 중요한 요소가 절대 될 수 없고 오히려 알고리즘을 복잡하고 무겁게 만들어 예측 성능을 떨어뜨린다. Label Encoder 레이블 인코딩은 Feature 들을 코드형 숫자값으로 변환 하는것이다. 레이블 인코딩은 문자열 데이터를 숫자.. 2022. 11. 29. 이전 1 다음