8. [프로젝트1] 시카고 샌드위치 맛집 분석 > 8-4. 다수의 웹페이지 정보 추출
다수의 웹페이지 정보 추출
시카고 샌드위치 맛집 웹사이트에는 각 순위별 가게에 대한 정보가 담겨 있는 다른 웹사이트로 링킹되어 있습니다.
각 순위에 해당하는 개별 사이트에 접속해서 가격과 주소를 추출해 볼 겁니다.
순위가 50위까지 나와 있으니 페이지도 50개의 페이지에 접속해 정보를 추출해야겠죠? 시간이 꽤 걸리는 작업을 어떻게 무작정 기다리지만 않고 tqdm을 이용해 진행상황을 시각화할 수 있는지도 알아봅시다. 아래 교안을 보며 따라와주세요.
💡 시카고 샌드위치 맛집 분석 프로젝트를 마치며
자! 그러면 이번주차의 두 프로젝트 중 첫번째 프로젝트인 시카고 샌드위치 맛집 분석을 마쳤습니다!!
BeautifulSoup과 urllib을 합쳐서 웹페이지의 다양한 정보를 추출하고 저장하기까지 꽤 험난한 과정이었을 거 같아요.
그래도 이렇게 프로젝트를 해나가며 점차 웹크롤링에 익숙해질 수 있답니다.❤️🔥