2019-05-25Python1분 읽기 (대략 214 단어) 0명이 읽음

파이썬 셀레니움으로 네이버 기사 댓글 크롤링하기

파이썬 셀레니움으로 네이버 기사 댓글 크롤링을 해보자

파이썬 셀레니움으로 네이버 기사 댓글 크롤링하기

코드

import os
from selenium import webdriver

driver = webdriver.Chrome(os.getcwd() + '/chromedriver')
driver.implicitly_wait(50)

driver.get('https://news.naver.com/main/read.nhn?m_view=1&includeAllCount=true&mode=LSD&mid=sec&sid1=102&oid=003&aid=0009172141')

cBox = driver.find_elements_by_css_selector('div[class=u_cbox_comment_box]')
cList = []

for i in range(cBox.__len__()):
    cList.append(cBox[i].find_element_by_css_selector('span[class=u_cbox_contents]').text)

print(cList)

보다시피 기사의 댓글들을 담아둔 div를 cssSelector를 통해서 div[class=u_cbox_comment_box] 를 가져오고
반복문을 돌며 각각의 텍스트를 가져와 cList에 담는 간단한 코드입니다.

현 시점으로 작동하지만 네이버 사이트 구조가 바뀌면 작동하지 않을 수도 있습니다 :)

파이썬 셀레니움으로 네이버 기사 댓글 크롤링하기

코드

댓글

카탈로그

카테고리