본문 바로가기

코드

[웹크롤링] 자동으로 스크롤 내려가게 하는 방법 예를 들어, 네이버 홈페이지에 키워드를 입력하고 관련 블로그 글들을 크롤링할 때, 딱 30개의 블로그만 처음에 보이는데요, 그 이후에 따로 스크롤을 내리지 않으면 30개까지만 크롤링을 하고 멈추게 됩니다. 따라서 만약 30개 이상의 글들을 크롤링하려면 스크롤을 중간 중간에 내리게 하는 코드를 입력해야 하는데요, 이를 도와주는 함수가 바로 execute_script() 합수입니다. 밑에 코드를 보면서 설명하도록 하겠습니다. - execute_script("window.scrollTo( );") : 스크롤하기 execute_Script("window.scrollTo( );") 함수는 해당 픽셀만큼 아래로 화면을 이동시키는 함수인데요, 만약 500픽셀만큼 아래로 이동하고 싶다면 execute_Script("w.. 더보기
[웹크롤링] 자주 사용되는 select 함수 5가지 - 코드 입력 형식 select함수는 find() 함수와 find_all 함수와는 다르게 여러 기능들을 사용할 수 있는데요, 주로 사용되는 코드 입력 방식에 대해 설명드리도록 하겠습니다. 1. 태그 이름 먼저 첫 번째로, select 함수는 원하는 태그를 찾을 때 많이 사용됩니다. 태그 이름으로 요소를 찾을 때 아래와 같이 입력하면 됩니다. soup.select('태그 이름') 위 코드에서 soup 는 soup = BeautifulSoup(html, 'html.parser') 로 설정된 변수입니다. 한편, 태그를 찾기 위해서 select() 함수 안에 '태그 이름' 을 입력하면 해당 요소가 선택됩니다. 2. 클래스 이름 두 번째로, select() 함수를 이용하여 클래스 이름을 찾는 코드는 다음과 같습니다. soup.sel.. 더보기
[웹크롤링] selenium 설치 & 사용 방법 (웹 크롤링 실행 코드) 1. selenium 설치하기 selenium은 웹 크롤러를 만드는데 도와주는 라이브러리로, 사람을 대신해서 주어진 작업을 하는데요, 예를 들어, 크롤링할 명령을 입력하면 사람 대신 직접 페이지를 열고, 지정한 태그 등을 찾아서 데이터를 수집해줍니다. 이러한 selenium 라이브러리는 cmd 창에서 pip install selenium 을 통해 패키지를 설치할 수 있습니다. 2. 웹 브라우저 프로그램 설치하기 selenium을 설치했다면 selenium 패키지가 사용할 웹 브라우저 프로그램을 설치해야 한답니다. 주로 크롬이 만힝 사용되는데요, 크롬은 selenium이 사용하는 프로그램과 다르기 때문에 크롬 드라이버를 설치해야 합니다. 이때 설치한 폴더의 위치와 이름을 기억해야 하는데요, 왜냐하면 웹크롤.. 더보기
[파이썬] append와 insert의 차이는? / 리스트에 항목 추가하기 append()와 insert() 함수는 리스트에 항목을 추가할 때 사용됩니다. append()는 list 또는 array 가장 마지막에 원소를 하나 추가해주는 반면, insert()는 원하는 위치에 원소를 추가해주는데요, 각 함수의 사용 방법을 살펴보면서 차이를 알아보도록 하겠습니다. 1. append() append() 함수는 리스트 가장 마지막에 항목을 하나 추가해주는 함수로 list.append('항목') 처럼 작성하면 됩니다. 예를들어 설명해보겠습니다. list1 = ['바나나', '오렌지', '사과' ] list1.append('수박') print(list1) ['바나나', '오렌지', '사과', '수박'] 위 코드처럼 list1.append('수박')을 하면 리스트 list1의 마지막 항목으.. 더보기