목록PYTHON/STUDY (25)
정구리의 우주정복
딕셔너리 사용법 1. 딕셔너리 선언 d = {} 2. 딕셔너리 쌍 추가 d = {1:'a'} d[3] = 'abc' >> d = {1:'a',3:'abc'} 기존의 d 에서 key 가 3 이고 value 가 abc 인 쌍이 추가된거다 3. 딕셔너리 쌍 삭제 del d[1] >>d = {3:'abc'} !!착각하면 안되는게 1번 index 가 아니라 key 값이 1인 애를 지워준거다 !!! 4. 딕셔너리 값 확인 d = {1:'a',3:'abc'} d[1] >> 'a' 딕셔너리의 key 값을 이용해 value 를 확인할 수 있다 d={'a':123,'b':456} d['a'] >>123 이렇게도 쓸수있고 자료형은 여러가지 다 쓸 수 있따 딕셔너리 함수들 1. keys() 키 만 확인할 수 있는 함수 dic..
https://docs.python.org/3/library/collections.html#collections.deque collections — Container datatypes — Python 3.8.5 documentation collections — Container datatypes Source code: Lib/collections/__init__.py This module implements specialized container datatypes providing alternatives to Python’s general purpose built-in containers, dict, list, set, and tuple. namedtuple() factory f docs.python.o..
최종 업데이트 : 20.06.20 엑셀 관련 프로그래밍을 할 일이 있어서 이것저것 기록을 해 놓으려고 한다 설치는 pip3 install openpyxl https://openpyxl.readthedocs.io/en/stable/ openpyxl - A Python library to read/write Excel 2010 xlsx/xlsm files — openpyxl 3.0.3 documentation Install openpyxl using pip. It is advisable to do this in a Python virtualenv without system packages: Warning To be able to include images (jpeg, png, bmp,…) into an op..
*1,2번 게시글에서 쓴 변수를 그대로 사용하는 중입니당 (df_last) **정보전달용이 아닌 기록용 게시글이기 때문에 두서없을 수 있습니다 (댓글달면 아는한에서 알랴드림) boxplot 은 처음 사용해보는데 되게 신기하게 생긴 그래프다 딱 봤을땐 뭔가 싶은데 5가지 요약수치를 나타낸다 #맨 아래 : 최소값 #상자 밑바닥 : 1사분위 #연두색 박스 중앙값 : 2사분위 #상자 윗부분 : 3사분위 #맨 꼭대기 : 최대값 #점이나 별로 으로 표시되는건 이상치 columns = 가로 values = 세로 index = 계산하고 싶은 값 ? 이라고 해야하나 쨋든 그렇게 넣으면 된다
* 정보전달보단 공부 기록이 목표라 친절하지 않을 수 있음 (댓글 달면 아는한 알랴드림) ** 이전 게시글과 동일한 변수를 사용중임 (df_last) 선 그래프로 시각화 하기 df_last.groupby([''])[''].mean().plot() mean() 으로 만든 평균값을 선 그래프로 출력 하려고 했는데 오류가 났다 missinf from current font 오류인데 한글 폰트때문에 생기는 오류인듯 해결방법은 import matplotlib.pyplot as plt plt.rc("font",family="AppleGothic") 이소스 추가해주면 된다 ( 나는 mac 이여서 기본 서체가 애플고딕인거임 윈도우는 달ㄹㅏ용 Malgun Gothic 써줘야합니당) 그러면 쿠쿠루삥뽕 다른 종류의 그래프를..
*1,2번 게시글에서 쓴 변수를 그대로 사용하는 중입니당 (df_last) **정보전달용이 아닌 기록용 게시글이기 때문에 두서없을 수 있습니다 (댓글달면 아는한에서 알랴드림) 1. 칼럼의 이름과 내용 바꾸기 df_last 안의 규모구분 칼럼에 있는 내용을 조금씩 수정해서 전용면석이라는 새로운 칼럼을 만들어줄거임 pandas 의 str.replace('문자열','바꿀 문자열') 이걸 써줄거임 규모구분 안에있는 전용면적 이라는 문자열을 공백으로 바꾸고 , 초과 -> - , 이하 -> 공백 , 띄어쓰기과 앞뒤의 띄어쓰기 -> 공백 으로 바꿔준걸 전용면적이라는 새로운 칼럼을 만들어서 저장을 해준거다 ! 2. 칼럼 삭제하기 규모구분의 내용을 전처리한걸 전용면적에 저장했기 때문에 이제 필요없는 규모구분을 삭제해줄거..
정보를 가져와 봤을때 각각이 어떤 타입을 가지고 있는제 볼 수 있다 object = 문자열 int64 = 숫자 라고 생각하면 될듯 의외로 분양가격이 object 로 되어있다 안에 값이 없는걸 결측치 라고 하는데 결측치는 True 의 값을 갖는다 True == 1 , False == 0 이기 때문에 .sum() 을 해서 더해주면 결측치의 개수가 나오게 된다 isnull() 말고 isna() 를 쓸 수 도 있다 숫자를 계산하기 위해서는 object 타입인 분양가격을 숫자형으로 바꿔줄 필요가 있다 ! pandas 의 to_numeric (문자형 칼럼을 숫자형으로 바꿔준다) 을 사용해서 바꿔준다 에러가 발생하면 errors = 'coerce' 를 써주면 된다 (오류가 발생했을 때 무시해줘벌휨) 바꿨을때 int ..
데이터 분석쪽이 궁금해서 공공데이터 다뤄보기를 시작으로 데이터 분석 공부를 해보려고 한당 https://www.data.go.kr/dataset/3035522/fileData.do 공공데이터포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Dataset)와 Open API로 제공하는 사이트입니다. www.data.go.kr 판다스를 import 해서 read_csv 를 해줬는데 UnicodeDecodeError 에러가 나왔다 한글을 불러오지 못해서 이런 에러가 나온듯 pandas 는 read_ . . 해서 불러오는 애들은 기본적으로 utf-8 로 불러오게 된다 쨋든 해..