파이썬으로 시작하는 업무 자동화 - 웹 크롤링1

2022. 4. 4. 00:21·프로젝트/코드프레소 체험단

request & response

클라이언트와 서버

 - 클라이언트는 서버에게 request를 요청한다.

 - 서버는 클라이언트에게 response를 보낸다.

 

 

HTTP 요청 메소드

 - CONNECT

 - DELETE

 - GET: 특정 페이지를 가져온다.

 - HEAD

 - OPTIONS
 - PATCH

 - POST: 서버로 데이터를 함께 실어서 보낸다. 서버 내의 값이나 상태가 변경될 수 있다.

 - PUT

 - TRACE

 

* 둘은 혼용되거나 잘못된 방식의 서버 구현이 가능하다.

1) GET

 - URL에 변수를 포함한다.

 - 서버의 값을 바꿀 수 없다.

 - 데이터가 제한된다.

 - 데이터를 헤더에 포함한다.

 

2) POST

 - URL에 변수를 포함하지 않는다.

 - 서버 내의 특정 값을 바꿀 수 있다.

 - 전송 길이가 유연하다.

 - 데이터를 바디에 포함한다.

 

 

HTML

HTML

 - 브라우저(IE, 크롬 등)가 해석해서 보여주는 문서

 - 태그로 데이터를 구분한다.

 

 

BeautifulSoup

from bs4 import BeautifulSoup

 - 웹페이지에서 가져온 HTML 문자열을 태그를 기준으로 줄세워주는 API이다.

 

 

 

'프로젝트 > 코드프레소 체험단' 카테고리의 다른 글

파이썬으로 시작하는 업무 자동화 - 브라우저 자동화  (0) 2022.04.04
파이썬으로 시작하는 업무 자동화 - 웹 크롤링2  (0) 2022.04.04
파이썬으로 배우는 데이터 분석: Pandas - DataFrame  (0) 2022.04.02
파이썬으로 배우는 데이터 분석: Pandas - Series  (0) 2022.04.02
파이썬으로 배우는 데이터 분석: Pandas - Pandas 라이브러리 소개  (0) 2022.04.01
'프로젝트/코드프레소 체험단' 카테고리의 다른 글
  • 파이썬으로 시작하는 업무 자동화 - 브라우저 자동화
  • 파이썬으로 시작하는 업무 자동화 - 웹 크롤링2
  • 파이썬으로 배우는 데이터 분석: Pandas - DataFrame
  • 파이썬으로 배우는 데이터 분석: Pandas - Series
KimCookieYa
KimCookieYa
무엇이 나를 살아있게 만드는가
  • KimCookieYa
    쿠키의 주저리
    KimCookieYa
  • 전체
    오늘
    어제
    • 분류 전체보기 (576)
      • 혼잣말 (88)
      • TIL (3)
      • 커리어 (24)
        • Sendy (21)
        • 외부활동 기록 (2)
      • 프로젝트 (186)
        • 티스토리 API (5)
        • 코드프레소 체험단 (89)
        • Web3 (3)
        • Pint OS (16)
        • 나만무 (14)
        • 대회 (6)
        • 정글 FE 스터디 (16)
        • MailBadara (12)
        • github.io (1)
        • 인공지능 동아리, AID (5)
        • 졸업과제 (18)
        • OSSCA 2024 (1)
      • 크래프톤 정글 2기 (80)
      • IT (169)
        • 코딩 (4)
        • CS (18)
        • 에러 (5)
        • 블록체인 (23)
        • Front-End (40)
        • 알고리즘&자료구조 정리 (3)
        • 코딩테스트 (3)
        • BOJ 문제정리 (41)
        • WILT (12)
        • ML-Agents (4)
        • 강화학습 (1)
        • Android (0)
        • LLM (2)
      • 전공 (1)
        • 머신러닝 (1)
      • 자기계발 (20)
        • 빡공단X베어유 (2)
        • 독서 (15)
  • 블로그 메뉴

    • 홈
    • 방명록
    • Github
    • Velog
    • 관리
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    글리치해커톤
    크래프톤정글
    파이썬
    센디
    react
    해커톤
    알고리즘
    블록체인
    부산대
    numpy
    JavaScript
    pintos
    RNN
    NEAR Protocol
    니어프로토콜
    프로그래머스
    졸업과제
    코드프레소
    나만무
    MailBadara
    머신러닝
    핀토스
    Pint OS
    리액트
    OS
    docker
    Flutter
    사이드프로젝트
    딥러닝
    자바스크립트
  • hELLO· Designed By정상우.v4.10.3
KimCookieYa
파이썬으로 시작하는 업무 자동화 - 웹 크롤링1
상단으로

티스토리툴바