본문 바로가기
PYTHON/python 함수

python get_dummies 함수

by 자유데이터 2020. 1. 30.
반응형

데이터 분석가의 길, 자유데이터입니다.

*복사 붙여넣기는 실력향상에 도움이 안됩니다*

 

 

 

  • 함수

pd.get_dummies(df)

 

판다스에 있는 함수

데이터프레임 컬럼 중 범주형 변수에 사용할 수 있다.

변수를 컬럼으로 만들고 값은 binary(0 또는 1)로 나타난다.

여기서 df는 데이터프레임이다.

예시를 통해 알아보자.

 

 

  • 예시

데이터프레임을 만든다.

 

import pandas as pd

df = pd.DataFrame(['서울','경기','경기','서울','부산'], columns=['지역'])
df

 

 

지역이라는 범주형 변수가 생성되었다.

이제 함수를 사용해보자.

 

 

pd.get_dummies(df)

 

위와 같이 해당 변수 값에는 1을 주고

나머지 값에는 0을 준다.

 

pd.get_dummies()는 회귀분석 등 머신러닝에 사용하기 위해

범주형을 수치로 만들어줄때 주로 사용하는 함수이다.

반응형

'PYTHON > python 함수' 카테고리의 다른 글

[python] dataframe.where 함수  (0) 2021.02.10
[python] 날짜 변환에 유용한 isoformat 함수  (0) 2021.02.09
[python] tolist() 함수  (0) 2020.11.01
[python] 파이썬 crosstab  (1) 2020.03.19

댓글