파이썬 셀레니움으로 네이버 기사 댓글 크롤링하기

파이썬 셀레니움으로 네이버 기사 댓글 크롤링하기

파이썬 셀레니움으로 네이버 기사 댓글 크롤링을 해보자

파이썬 셀레니움으로 네이버 기사 댓글 크롤링하기


코드

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import os
from selenium import webdriver

driver = webdriver.Chrome(os.getcwd() + '/chromedriver')
driver.implicitly_wait(50)

driver.get('https://news.naver.com/main/read.nhn?m_view=1&includeAllCount=true&mode=LSD&mid=sec&sid1=102&oid=003&aid=0009172141')

cBox = driver.find_elements_by_css_selector('div[class=u_cbox_comment_box]')
cList = []

for i in range(cBox.__len__()):
cList.append(cBox[i].find_element_by_css_selector('span[class=u_cbox_contents]').text)

print(cList)

보다시피 기사의 댓글들을 담아둔 div를 cssSelector를 통해서 div[class=u_cbox_comment_box] 를 가져오고
반복문을 돌며 각각의 텍스트를 가져와 cList에 담는 간단한 코드입니다.

현 시점으로 작동하지만 네이버 사이트 구조가 바뀌면 작동하지 않을 수도 있습니다 :)

댓글