카테고리 없음
웹 크롤링 공부
gggg21
2025. 2. 21. 17:50
1️⃣ 웹 크롤링이란?
웹 크롤링(Web Crawling)은 웹사이트에서 데이터를 자동으로 수집하는 기술이에요.
보통 requests와 BeautifulSoup을 활용해 HTML에서 원하는 정보를 추출하죠.
✔ 간단한 웹 크롤링 예제
python
import requests
from bs4 import BeautifulSoup
url = 'https://n.news.naver.com/mnews/article/009/0005447571'
res = requests.get(url)
soup = BeautifulSoup(res.content, 'html.parser')
# 제목 가져오기
title = soup.find('title').get_text()
print(title)
✅ 출력 결과: 네이버 뉴스 제목이 출력됨
👉 활용 예시: 뉴스, 쇼핑몰, 블로그 데이터를 자동으로 수집 가능!
2️⃣ 크롤링한 데이터를 머신러닝에 활용하기
크롤링한 데이터를 가공해서 Scikit-learn을 활용한 분석을 할 수도 있어요.
예를 들어, 쇼핑몰에서 제품 리뷰를 수집한 뒤, 긍정/부정을 예측하는 머신러닝 모델을 만들 수 있어요.