목록PYTHON (59)
정구리의 우주정복
* 정보전달보단 공부 기록이 목표라 친절하지 않을 수 있음 (댓글 달면 아는한 알랴드림) ** 이전 게시글과 동일한 변수를 사용중임 (df_last) 선 그래프로 시각화 하기 df_last.groupby([''])[''].mean().plot() mean() 으로 만든 평균값을 선 그래프로 출력 하려고 했는데 오류가 났다 missinf from current font 오류인데 한글 폰트때문에 생기는 오류인듯 해결방법은 import matplotlib.pyplot as plt plt.rc("font",family="AppleGothic") 이소스 추가해주면 된다 ( 나는 mac 이여서 기본 서체가 애플고딕인거임 윈도우는 달ㄹㅏ용 Malgun Gothic 써줘야합니당) 그러면 쿠쿠루삥뽕 다른 종류의 그래프를..
*1,2번 게시글에서 쓴 변수를 그대로 사용하는 중입니당 (df_last) **정보전달용이 아닌 기록용 게시글이기 때문에 두서없을 수 있습니다 (댓글달면 아는한에서 알랴드림) 1. 칼럼의 이름과 내용 바꾸기 df_last 안의 규모구분 칼럼에 있는 내용을 조금씩 수정해서 전용면석이라는 새로운 칼럼을 만들어줄거임 pandas 의 str.replace('문자열','바꿀 문자열') 이걸 써줄거임 규모구분 안에있는 전용면적 이라는 문자열을 공백으로 바꾸고 , 초과 -> - , 이하 -> 공백 , 띄어쓰기과 앞뒤의 띄어쓰기 -> 공백 으로 바꿔준걸 전용면적이라는 새로운 칼럼을 만들어서 저장을 해준거다 ! 2. 칼럼 삭제하기 규모구분의 내용을 전처리한걸 전용면적에 저장했기 때문에 이제 필요없는 규모구분을 삭제해줄거..
정보를 가져와 봤을때 각각이 어떤 타입을 가지고 있는제 볼 수 있다 object = 문자열 int64 = 숫자 라고 생각하면 될듯 의외로 분양가격이 object 로 되어있다 안에 값이 없는걸 결측치 라고 하는데 결측치는 True 의 값을 갖는다 True == 1 , False == 0 이기 때문에 .sum() 을 해서 더해주면 결측치의 개수가 나오게 된다 isnull() 말고 isna() 를 쓸 수 도 있다 숫자를 계산하기 위해서는 object 타입인 분양가격을 숫자형으로 바꿔줄 필요가 있다 ! pandas 의 to_numeric (문자형 칼럼을 숫자형으로 바꿔준다) 을 사용해서 바꿔준다 에러가 발생하면 errors = 'coerce' 를 써주면 된다 (오류가 발생했을 때 무시해줘벌휨) 바꿨을때 int ..
데이터 분석쪽이 궁금해서 공공데이터 다뤄보기를 시작으로 데이터 분석 공부를 해보려고 한당 https://www.data.go.kr/dataset/3035522/fileData.do 공공데이터포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Dataset)와 Open API로 제공하는 사이트입니다. www.data.go.kr 판다스를 import 해서 read_csv 를 해줬는데 UnicodeDecodeError 에러가 나왔다 한글을 불러오지 못해서 이런 에러가 나온듯 pandas 는 read_ . . 해서 불러오는 애들은 기본적으로 utf-8 로 불러오게 된다 쨋든 해..
오늘은 주피터 노트북 사용방법을 알아보자 Jupyter Notebook 이란 ? 파이썬 코드를 작성할 수 있고 그 결과 (output) 을 바로 볼 수 있는 '웹' 기반의 컴파일러 ! 웹에 설명을 자세하게 적을 수 있어 문서화에도 좋고 교육용으로도 많이 이용되고 있다 1. 주피터 노트북 다운로드 및 파일 생성 우선 다운로드를 받아야 하는데 나는 아나콘다 다운받으니까 옆에 딸려왔다 아나콘다 다운로드 링크 https://www.anaconda.com/distribution/#download-section Anaconda Python/R Distribution - Free Download Anaconda Distribution is the world's most popular Python data scienc..
2020.4.3 - 2020.4.6 프로젝트01 단어장 만들기 완료 전체 소스는 getWord.py (단어장 엑셀파일 만드는 부분) , openWord.py (실질적 기능을 수행하는 부분) , wordTest.py (단어시험) 이렇게 파일 3개다 openWord.py 에 나머지 두 파일을 import 해서 사용해 줬다 . getWord.py # 단어장 불러와서 엑셀에 자동저장하기 import ssl import re from urllib.request import urlopen from bs4 import BeautifulSoup from openpyxl import Workbook def getWord(): context = ssl._create_unverified_context() #url 선택부분 ..
오늘 단어시험 구현완료 했다 !! 단어시험은 리스트 안의 단어뜻 부분을 출력 -> 단어를 입력받음 -> 맞는지 틀리는지 확인 -> 맞으면 점수 +1 , 틀리면 틀린 단어 리스트에 넣음 -> 시험 완료시 점수와 틀린단어 출력 ! 이렇게 만들어 줬다 ! 단어시험 부분 #단어를 불러오는 부분 import random #딕셔너리 값 삽입은 그냥 이름[키] = 값 def getWord(wordResult,meanResult): wordList = [] #단어들이 들어갈 목록 # print(len(wordResult[int(page)])) n=0 for i in wordResult: word=[] word.append(wordResult[n]) word.append(meanResult[n]) wordList.app..
#단어 읽어들여서 20개씩 끊어서 출력해주기 # 이전 , 다음 기능 도 생각해보기 from openpyxl import load_workbook import wordTest #data_only = True 를 해야지 값으로 가져옴 (안그러면 수식) load_wb = load_workbook('./wordList.xlsx',data_only=True) load_ws = load_wb['wordList'] #시트이름 words = [] #단어가 들어갈 리스트 mean = [] # 뜻이 들어갈 리스트 eng = load_ws['A'] #A,B.. : 열을 가져옴 kor = load_ws['B'] #1,2,... : 행을 가져옴 #word와 mean 에 넣은 상태 for cell in eng: words.app..