import pandas as pd
from urllib import parse
# 검색어
code = '환율조회'
# url에 넣기위해 encoding한다.
encoded = parse.quote(code)
url = "https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=1&ie=utf8&query=" + encoded
# pandas 라이브러리를 사용해, url에서 table만을 가져온다.
dfs = pd.read_html(url)
type(dfs) # list
type(dfs[1]) # DataFrame
# DataFrame을 엑셀 파일로 저장한다.
dfs[1].to_excel('my_excel.xlsx')
# 엑셀을 DataFrame으로 가져온다.
table = pd.read_excel('my_excel.xlsx')
# DataFrame의 상위 3개의 값만을 가져온다.
table.head(3)
'프로젝트 > 코드프레소 체험단' 카테고리의 다른 글
시계열 데이터 처리를 위한 RNN 완벽 가이드 - 완강 후기 (0) | 2022.04.04 |
---|---|
파이썬으로 시작하는 업무 자동화 - 브라우저 자동화 (0) | 2022.04.04 |
파이썬으로 시작하는 업무 자동화 - 웹 크롤링1 (0) | 2022.04.04 |
파이썬으로 배우는 데이터 분석: Pandas - DataFrame (0) | 2022.04.02 |
파이썬으로 배우는 데이터 분석: Pandas - Series (0) | 2022.04.02 |