프로젝트/코드프레소 체험단

파이썬으로 시작하는 업무 자동화 - 웹 크롤링2

KimCookieYa 2022. 4. 4. 00:39
import pandas as pd
from urllib import parse

# 검색어
code = '환율조회'
# url에 넣기위해 encoding한다.
encoded = parse.quote(code)
url = "https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=1&ie=utf8&query=" + encoded
# pandas 라이브러리를 사용해, url에서 table만을 가져온다.
dfs = pd.read_html(url)

type(dfs) # list
type(dfs[1]) # DataFrame

# DataFrame을 엑셀 파일로 저장한다.
dfs[1].to_excel('my_excel.xlsx')

# 엑셀을 DataFrame으로 가져온다.
table = pd.read_excel('my_excel.xlsx')
# DataFrame의 상위 3개의 값만을 가져온다.
table.head(3)