코딩
-
파이썬,셀레니움으로 에브리타임 핫 게시판 크롤링 하기코딩 2020. 4. 7. 22:37
https://brunch.co.kr/@carpediem7760/12 과정에 대해서는 위의 링크에 있으니 읽으시면 이해가 더 쉽게 될 것입니다. 파이썬의 셀레니움을 이용해서 에브리타임의 핫 게시판의 글들을 가져오고 엑셀(공감수, 제목, 내용, url) or 형태소 분석 하는 코드로 나누었습니다. 저는 주피터 노트북으로 작업했습니다. 사용한 라이브러리: BeautifulSoup, Selenium, requests,konlpy,openpyx 아래는 크롤링한 정보를 토대로 엑셀로 공감수, 제목, 내용, url로 저장하는 방법입니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3..