웹크롤링을 할 때, 특정 버튼을 클릭하거나 특정 element에 접근할 때 사용할 수 있는 방법이 크게 6가지가 있는데요, 하나씩 살펴보도록 하겠습니다.
- find_element_by_ : 특정 element에 접근하기
특정 element에 접근하기 위한 방법으로 'html name', 'id name', 'xpath', 'css', 'class name', 'tag name'을 사용하는 방법이 있는데요, 특정 element에 접근하는 코드인 find_element_by_ 와 결합해 사용하면 됩니다.
결합한 코드는 다음과 같습니다.
1. html name 사용
find_element_by_name('html name')
2. id name 사용
find_element_by_id("html id name")
3. xpath 경로 사용
find_element_by_xpath('xpath경로')
4. css 사용
find_element_by_css_selector('#css > div.selector')
5. class name 사용
find_element_by_class_name('class name')
6. tag name 사용
find_element_by_tag_name("tag name")
한편, 크롤링을 할 때 클릭을 하려면 위 6가지 코드 바로 뒤에 .click() 만 입력하면 되는데요,
driver를 사용한다면 아래와 같이 코드를 작성해주면 됩니다.
find_element_by_name('html name').click()
find_element_by_id("html id name").click()
find_element_by_xpath('xpath경로').click()
find_element_by_css_selector('#css > div.selector').click()
find_element_by_class_name('class name').click()
find_element_by_tag_name("tag name").click()
'BLOG > 웹크롤링' 카테고리의 다른 글
[웹크롤링] 자주 사용되는 select 함수 5가지 - 코드 입력 형식 (0) | 2021.03.18 |
---|---|
[웹크롤링] 원하는 태그 찾기 + 텍스트 추출 - find (0) | 2021.03.18 |
[웹크롤링] 버튼 클릭하는 방법 - xpath (selenium, 크롬 드라이버) (0) | 2021.03.18 |
[웹크롤링] selenium 설치 & 사용 방법 (웹 크롤링 실행 코드) (0) | 2021.03.18 |
[웹크롤링] 두번씩 크롤링 되는 텍스트, 중복 제거하는 방법 - set() (0) | 2021.03.18 |