파이썬으로 시작하는 업무 자동화 - 웹 크롤링2

2022. 4. 4. 00:39·프로젝트/코드프레소 체험단
import pandas as pd
from urllib import parse

# 검색어
code = '환율조회'
# url에 넣기위해 encoding한다.
encoded = parse.quote(code)
url = "https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=1&ie=utf8&query=" + encoded
# pandas 라이브러리를 사용해, url에서 table만을 가져온다.
dfs = pd.read_html(url)

type(dfs) # list
type(dfs[1]) # DataFrame

# DataFrame을 엑셀 파일로 저장한다.
dfs[1].to_excel('my_excel.xlsx')

# 엑셀을 DataFrame으로 가져온다.
table = pd.read_excel('my_excel.xlsx')
# DataFrame의 상위 3개의 값만을 가져온다.
table.head(3)

 

 

 

'프로젝트 > 코드프레소 체험단' 카테고리의 다른 글

시계열 데이터 처리를 위한 RNN 완벽 가이드 - 완강 후기  (0) 2022.04.04
파이썬으로 시작하는 업무 자동화 - 브라우저 자동화  (0) 2022.04.04
파이썬으로 시작하는 업무 자동화 - 웹 크롤링1  (0) 2022.04.04
파이썬으로 배우는 데이터 분석: Pandas - DataFrame  (0) 2022.04.02
파이썬으로 배우는 데이터 분석: Pandas - Series  (0) 2022.04.02
'프로젝트/코드프레소 체험단' 카테고리의 다른 글
  • 시계열 데이터 처리를 위한 RNN 완벽 가이드 - 완강 후기
  • 파이썬으로 시작하는 업무 자동화 - 브라우저 자동화
  • 파이썬으로 시작하는 업무 자동화 - 웹 크롤링1
  • 파이썬으로 배우는 데이터 분석: Pandas - DataFrame
KimCookieYa
KimCookieYa
무엇이 나를 살아있게 만드는가
  • KimCookieYa
    쿠키의 주저리
    KimCookieYa
  • 전체
    오늘
    어제
    • 분류 전체보기 (573) N
      • 혼잣말 (87)
      • TIL (2)
      • 커리어 (24)
        • Sendy (21)
        • 외부활동 기록 (2)
      • 프로젝트 (186)
        • 티스토리 API (5)
        • 코드프레소 체험단 (89)
        • Web3 (3)
        • Pint OS (16)
        • 나만무 (14)
        • 대회 (6)
        • 정글 FE 스터디 (16)
        • MailBadara (12)
        • github.io (1)
        • 인공지능 동아리, AID (5)
        • 졸업과제 (18)
        • OSSCA 2024 (1)
      • 크래프톤 정글 2기 (80)
      • IT (168) N
        • 코딩 (4)
        • CS (18)
        • 에러 (5)
        • 블록체인 (23)
        • Front-End (39) N
        • 알고리즘&자료구조 정리 (3)
        • 코딩테스트 (3)
        • BOJ 문제정리 (41)
        • WILT (12)
        • ML-Agents (4)
        • 강화학습 (1)
        • Android (0)
        • LLM (2)
      • 전공 (1)
        • 머신러닝 (1)
      • 자기계발 (20)
        • 빡공단X베어유 (2)
        • 독서 (15)
  • 블로그 메뉴

    • 홈
    • 방명록
    • Github
    • Velog
    • 관리
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    OS
    MailBadara
    프로그래머스
    RNN
    리액트
    Flutter
    부산대
    자바스크립트
    블록체인
    딥러닝
    JavaScript
    알고리즘
    docker
    NEAR Protocol
    니어프로토콜
    react
    사이드프로젝트
    해커톤
    numpy
    파이썬
    졸업과제
    크래프톤정글
    위상정렬
    핀토스
    나만무
    코드프레소
    머신러닝
    pintos
    Pint OS
    글리치해커톤
  • hELLO· Designed By정상우.v4.10.3
KimCookieYa
파이썬으로 시작하는 업무 자동화 - 웹 크롤링2
상단으로

티스토리툴바