정구리의 우주정복
Python 공공데이터 다뤄보기 2. Pandas 를 이용해 문자형을 정수형으로 바꿔주기 , NaN 다루기 본문
반응형
정보를 가져와 봤을때 각각이 어떤 타입을 가지고 있는제 볼 수 있다 object = 문자열 int64 = 숫자 라고 생각하면 될듯
의외로 분양가격이 object 로 되어있다
안에 값이 없는걸 결측치 라고 하는데 결측치는 True 의 값을 갖는다
True == 1 , False == 0 이기 때문에 .sum() 을 해서 더해주면 결측치의 개수가 나오게 된다
isnull() 말고 isna() 를 쓸 수 도 있다
숫자를 계산하기 위해서는 object 타입인 분양가격을 숫자형으로 바꿔줄 필요가 있다 !
pandas 의 to_numeric (문자형 칼럼을 숫자형으로 바꿔준다) 을 사용해서 바꿔준다
에러가 발생하면 errors = 'coerce' 를 써주면 된다 (오류가 발생했을 때 무시해줘벌휨)
바꿨을때 int 가 아니라 float64 로 반환이 되는 이유는 중간중간 NaN 이 있기 때문이다 !
df_last['분양가격'] 이라는 새로운거로 저장을 해주자
pandas에 재밌는 기능들도 많은 것 같고 아직까지는 다루기가 좀 쉬워보인다 ( 아직까지는)
반응형
'PYTHON > STUDY' 카테고리의 다른 글
Comments