반응형
*복사 붙여넣기는 실력향상에 도움이 안됩니다*
- 함수
pd.get_dummies(df)
판다스에 있는 함수로
데이터프레임 컬럼 중 범주형 변수에 사용할 수 있다.
변수를 컬럼으로 만들고 값은 binary(0 또는 1)로 나타난다.
여기서 df는 데이터프레임이다.
예시를 통해 알아보자.
- 예시
데이터프레임을 만든다.
import pandas as pd
df = pd.DataFrame(['서울','경기','경기','서울','부산'], columns=['지역'])
df
지역이라는 범주형 변수가 생성되었다.
이제 함수를 사용해보자.
pd.get_dummies(df)
위와 같이 해당 변수 값에는 1을 주고
나머지 값에는 0을 준다.
pd.get_dummies()는 회귀분석 등 머신러닝에 사용하기 위해
범주형을 수치로 만들어줄때 주로 사용하는 함수이다.
반응형
'PYTHON > python 함수' 카테고리의 다른 글
[python] dataframe.where 함수 (0) | 2021.02.10 |
---|---|
[python] 날짜 변환에 유용한 isoformat 함수 (0) | 2021.02.09 |
[python] tolist() 함수 (0) | 2020.11.01 |
[python] 파이썬 crosstab (1) | 2020.03.19 |
댓글