Dummy1 [머신러닝] 범주형 데이터 (Categorical Data) 범주형 데이터란, 명확한 종류를 표현하는 데이터를 말한다. 영어로는 카테고리컬 데이터라고도 하는데, 이는 카테고리화를 명확하게 시킬 수 있어서 그렇다. 대표적인 파워풀한 범주형 데이터로서의 예시는 '성별' 을 예로 들 수 있겠다. 머신러닝에 들어가는 대부분의 데이터 모형 모델에는 숫자로만 입력 받을 수 있기 때문에 범주형 데이터는 숫자화 시켜야한다. 이렇게 숫자로 변환 하는 방법엔 더미변수화와 임베딩 방법이 있겠다. 예를들자면, 남자는 M 여자는 F 로 표기된 데이터가 있다고 가정한다면 남자는 '0' 여성은 '1' 이렇게 변환 할 수 있다. 더미변수란 , 범주형 변수를 연속형 변수로 변환한 변수라 말한다. 연속형 변수로만 사용가능한 분석기법을 활용 할 수 있게 도와준다. 여기서 말하는 연속형 변수란 키 .. 2022. 11. 17. 이전 1 다음