본문 바로가기

PYTHON/python 함수5

[python] dataframe.where 함수 데이터 전처리에 유용한 where함수 조건이 거짓일때, 값을 대체해주는 함수. dataframe 형태의 데이터를 정제할때, 한 번에 바꿀 수 있는 유용한 함수. where 파라미터 예제 1. where 파라미터 DataFrame.where(cond, other=nan, inplace=False, axis=None,level=None,errors='raise',try_cast=False) 영문이 정확하지만, 간단히 설명하자면 cond: 데이터 조건식 형태를 넣어주는 곳 other: 대체값을 넣어주는 곳cond만 있어도 작동한다. other을 입력하지 않으면 대체값은 None으로 나옴. 2. 예제 결측치가 있는 행을 제외하는 방법은 두 가지가 있다. import pandas as pd s = pd.Serie.. 2021. 2. 10.
[python] 날짜 변환에 유용한 isoformat 함수 isoformat() 함수 파이썬 날짜 형태가 뒤죽박죽일때, isoformat()으로 해결해보자. isoformat 파라미터 예제 1. isoformat 파라미터 isoformat(sep='T', timespec='auto') sep: 날짜와 시간 사이에 넣을 문자를 정한다. timespec: 시간, 분, 초, 밀리초, 마이크로 단위로 설정할 수 있다. 2. 예제 import datetime t1 = datetime.datetime.today() t2 = datetime.date.today() datetime.datetime(2023, 4, 23, 14, 32, 12, 331843) datetime.date(2023, 4, 23) t1은 시분초까지 나온 값 t2는 일까지만 나온 값 t1.isoformat.. 2021. 2. 9.
[python] tolist() 함수 tolist() 함수를 사용하여 같은 레벨(위치)에 있는 데이터 끼리 묶어준다 아래의 예제를 보는게 더 이해가 빠를 것이다. tolist 파라미터 기본 1. tolist 파라미터 기본 파라미터를 살펴보자. 파라미터 없음(하나씩 확인해보는 습관을 기르자) 하나씩 예제로 접근해보자. 2. 기본 예제 데이터 프레임을 만들어 추출해본다 import pandas as pd df = pd.DataFrame({'value':[1,2,3],'test':['a','b','c']}) df.values.tolist() [[1, 'a'], [2, 'b'], [3, 'c']] 2020. 11. 1.
[python] 파이썬 crosstab pandas crosstab을 이용하여 데이터 계산하기 crosstab은 범주형 변수를 기준으로 개수 파악이나 수치형 데이터를 넣어 계산할 때 사용한다. 아래의 예제를 보는게 더 이해가 빠를 것이다. crosstab 파라미터 기본 수치 계산하기 이름 바꾸기 정규화 1. crosstab 파라미터 기본 파라미터를 살펴보자. 하나씩 예제로 접근해보자. 2. 기본 먼저 데이터를 부른다. import pandas as pd import numpy as np a = ['2/18', '2/18', '2/18', '2/18', '2/20', '2/20', '2/20', '2/20', '2/25', '2/25', '2/25'] b = ['철수', '철수', '철수', '영희', '영희', '영희', '영희', '철수',.. 2020. 3. 19.
python get_dummies 함수 *복사 붙여넣기는 실력향상에 도움이 안됩니다* 함수 pd.get_dummies(df) 판다스에 있는 함수로 데이터프레임 컬럼 중 범주형 변수에 사용할 수 있다. 변수를 컬럼으로 만들고 값은 binary(0 또는 1)로 나타난다. 여기서 df는 데이터프레임이다. 예시를 통해 알아보자. 예시 데이터프레임을 만든다. import pandas as pd df = pd.DataFrame(['서울','경기','경기','서울','부산'], columns=['지역']) df 지역이라는 범주형 변수가 생성되었다. 이제 함수를 사용해보자. pd.get_dummies(df) 위와 같이 해당 변수 값에는 1을 주고 나머지 값에는 0을 준다. pd.get_dummies()는 회귀분석 등 머신러닝에 사용하기 위해 범주형을 수치로.. 2020. 1. 30.