파이썬 셀레니움으로 네이버 기사 댓글 크롤링을 해보자
파이썬 셀레니움으로 네이버 기사 댓글 크롤링하기
코드
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| import os from selenium import webdriver
driver = webdriver.Chrome(os.getcwd() + '/chromedriver') driver.implicitly_wait(50)
driver.get('https://news.naver.com/main/read.nhn?m_view=1&includeAllCount=true&mode=LSD&mid=sec&sid1=102&oid=003&aid=0009172141')
cBox = driver.find_elements_by_css_selector('div[class=u_cbox_comment_box]') cList = []
for i in range(cBox.__len__()): cList.append(cBox[i].find_element_by_css_selector('span[class=u_cbox_contents]').text)
print(cList)
|
보다시피 기사의 댓글들을 담아둔 div를 cssSelector를 통해서 div[class=u_cbox_comment_box]
를 가져오고
반복문을 돌며 각각의 텍스트를 가져와 cList에 담는 간단한 코드입니다.
현 시점으로 작동하지만 네이버 사이트 구조가 바뀌면 작동하지 않을 수도 있습니다 :)