목록PYTHON (58)
정구리의 우주정복
단어장 불러오는 소스 # 단어장 불러와서 엑셀에 자동저장하기 import ssl import re from urllib.request import urlopen from bs4 import BeautifulSoup from openpyxl import Workbook context = ssl._create_unverified_context() #url 선택부분 print('''원하는 단어장을 선택하세요\n 1. 중등\n 2. 고등\n 3. 토익''') selectLevel = int(input("번호 입력 : ")) if selectLevel == 1: url = 'https://learn.dict.naver.com/m/endic/wordbook/mhs/100001/200001/words.nhn?filt..
# 단어장 불러와서 엑셀에 자동저장하기 import ssl import re from urllib.request import urlopen from bs4 import BeautifulSoup from openpyxl import Workbook context = ssl._create_unverified_context() #단어 불러오기 url = 'https://learn.dict.naver.com/m/endic/wordbook/exam/10001/20001/words.nhn?filterType=0&orderType=2&pageNo=' page = 1 #openpyxl 부분 wb = Workbook() ws1 = wb.active #활성 시트를 만들어준다 ws1.title='wordList' n=1 #..
첫 프로젝트는 단어장을 만들어보려고 한다 왜 단어장이냐면 그냥 단어공부도 할 겸 .. 내가 만든거로 하면 좀 더 열심히 하지 않을까 ? 들어갈 기능 1. 단어장에 단어 저장하기 (엑셀 , 네이버 단어장 사용) 2. 단어 10개 단위로 출력 (단어장 끝까지 보면 처음부터 다시 출력) 3. 단어시험 기능 ( 단어 랜덤하게 출력 단어버전 ,뜻 버전) 가능 하면 윈도우 창으로 만들어 보고 싶지만 되려나 ..? 위에 기능 다 만들고 구현해보는걸로 1. 단어장에 단어 저장하기 (웹 크롤링 사용) 네이버 단어장의 https://learn.dict.naver.com/m/endic/wordbook/exam/10001/20001/words.nhn 네이버 영단어장 (NAVER English wordbook) 중/고교 교과서..
공부용이라 소스코드 들쭉날쭉할 수 있음 (참고할 사람들은 소스코드 유의깊게보기) 참고는 프로그래머 김플 스튜디오 유튜브 오늘은 맨날 네이버만 크롤링 하다가 구글을 크롤링 해볼거당 야호 웹 크롤링 3번 게시글을 참고하면 이번께 더 쉬울듯 1. 웹 사이트 분석하기 구글에 들어가 파이썬 이라고 검색을 해보면 세상에서 제일 복잡한 url 이 나온다 , 이렇게 복잡하면 분석하기가 힘듬 이때 search?q = '. . . ' 여기 부분이 실질적으로 검색을 하는 부분인데 이 뒷부분을 모두 지우고 검색을 해보쟈 놀랍게도 url 이 바뀌었지만 검색 결과는 똑같다 ! 이렇게 우리는 기본 url 을 얻어버림 html 코드를 분석해보자 div class = r 안에 내가 원하는 href 와 title 을 가지고 있다 따라서..
공부용이라 과정이 틀릴수도 있고 위에서 쓴 구문을 아래에선 안 쓸 수도있음 코드 잘 확인하기 참고는 프로그래머 김플 스튜디오 유튜브 오늘은 CSV 파일을 만들어 볼거당 일단 CSV 파일이란 ? 몇가지 필드를 쉼표(,) 로 구분한 텍스트 데이터 및 텍스트 파일 이라고 한다 사실 나도 오늘 첨 들어봄 데이터 수집 -> csv 파일로 저장 하는 방식 이전까지는 그냥 터미널에서 다루었다면 이제는 파일단위로 다루는걸 해볼거다 csv 는 처음이라 강의를 보면서 따라해보도록 할것임 ! 오늘의 준비물 : 모바일 네이버 모바일 네이버를 사용하는 이유 : 소스코드가 조금 더 어렵고 pc 에는 없는 view 탭이 있다 그리고 페이지단위가 아니라 자바스크립트로 작성되어 페이지가 따로 없음 오늘은 제목과 링크를 가져올 예정임 ..
공부용이라 과정이 틀릴수도 있고 위에서 쓴 구문을 아래에선 안 쓸 수도있음 코드 잘 확인하기 저번에 했던 네이버 검색 블로그 결과 출력의 업그레이드 버전이다 저번엔 블로그 결과의 한페이지를 가져왔다면 이번엔 많은 페이지를 가져와보자 아직 초보라 html 태그를 뭘 가져와야 잘 가져왔다 소문이 날 지 헷갈린다 구상(내 생각) 1. url 분석 2. html 분석 (필요한거 가져오기) 3. 출력해보기 페이지가 넘어갈때 마다 url 이 바뀌니까 반복문으로 url 을 바꿔주고 내용 출력 -> url 바꾸고 -> 내용 출력 이런식으로 반복을 해보자 1. url 분석 내가 원하는건 1페이지만 출력이 되는게 아니라 그 다음페이지도 쭉쭉 나오는거기 때문에 각각의 url 부터 확인해 보겠다 1번 페이지에서 2번으로 넘어..
공부용이라 과정이 틀릴수도 있고 위에서 쓴 구문을 아래에선 안 쓸 수도있음 참고는 프로그래머 김플 스튜디오 오늘은 인스타그램의 해시태그를 입력하면 사진을 크롤링 할 수 있는 프로그램을 만들거다 ! 과정 (내 생각임) 1. html 불러오기 2. html 분석 3. 다운로드 ! 네이버 크롤링이랑 비슷할것같다 ! 우선 먼저 준비해야할 것이 있다 (BeautifulSoup4 를 설치했다는 가정하에) 구글에 chromedriver 을 검색후 맨 위에있는거에 들어가서 자신의 크롬 버전과 맞는 걸 다운받으면 된다 https://chromedriver.chromium.org/downloads 크롬 버전 확인하는 법 : chrome://version/ 이걸 검색창에 넣으면 버전이 나옵니다 그리고 다운로드 받은걸 파이썬..
참고는 프로그래머 김플 스튜디오 유튜브 오늘은 네이버에다 검색어를 검색하면 이미지 검색결과를 자동으로 다운받는걸 만들어볼거다 ! 과정 (내 생각임) 1. 검색부분 구현 및 html 불러오기 2. html 분석을 통해 이미지 찾기 3. 다운로드하기 (여기서부턴 모르니까 영상참조) 1. 검색부분 구현 및 html 불러오기 import urllib.request from urllib import parse from bs4 import BeautifulSoup import ssl context = ssl._create_unverified_context() search = input("저장하고 싶은 사진의 검색어 입력 : ") url = 'https://search.naver.com/search.naver?whe..