정구리의 우주정복

Python 공공데이터 다뤄보기 2. Pandas 를 이용해 문자형을 정수형으로 바꿔주기 , NaN 다루기 본문

PYTHON/STUDY

Python 공공데이터 다뤄보기 2. Pandas 를 이용해 문자형을 정수형으로 바꿔주기 , NaN 다루기

Jungry_ 2020. 4. 13. 22:54
반응형

정보를 가져와 봤을때 각각이 어떤 타입을 가지고 있는제 볼 수 있다 object = 문자열 int64 = 숫자 라고 생각하면 될듯

의외로 분양가격이 object 로 되어있다 

 

안에 값이 없는걸 결측치 라고 하는데 결측치는 True 의 값을 갖는다 

True == 1 , False == 0 이기 때문에 .sum() 을 해서 더해주면 결측치의 개수가 나오게 된다 

isnull() 말고 isna() 를 쓸 수 도 있다 

 

분양 가격 데이터 타입 변경

숫자를 계산하기 위해서는 object 타입인 분양가격을 숫자형으로 바꿔줄 필요가 있다 !

pandas 의 to_numeric (문자형 칼럼을 숫자형으로 바꿔준다) 을 사용해서 바꿔준다 
에러가 발생하면 errors = 'coerce' 를 써주면 된다 (오류가 발생했을 때 무시해줘벌휨)

 

바꿨을때 int 가 아니라 float64 로 반환이 되는 이유는 중간중간 NaN 이 있기 때문이다 ! 

 

df_last['분양가격'] 이라는 새로운거로 저장을 해주자 

 

pandas에 재밌는 기능들도 많은 것 같고 아직까지는 다루기가 좀 쉬워보인다 ( 아직까지는)

 

 

반응형
Comments