티스토리 뷰

HTTP

[HTTP] Hyper Text Transfer Protocol

hyuuny 2022. 2. 4. 12:32

HTTP

월드 와이드 웹을 지탱하는 가장 중요한 기술 두 가지는 HTML과 HTTP이다.

이 두 기술은 팀 버너스 리가 웹을 발명할 때 함께 만들어졌다. 전 세계의 웹 브라우저, 서버, 웹 애플리케이션은 모두 HTTP(Hyper Text Tranfer Protocol)를 통해 서로 대화한다.


인터넷의 멀티미디어 배달부


수십억 개의 JPEG 이미지, HTML 페이지, 텍스트 파일, MPEG 동영상, WAV 음성 파일, 자바 애플릿 등이 인터넷을 항해한다. HTTP는 전 세계의 웹 서버로부터 이 대량의 정보를 빠르고, 간편하고, 정확하게 웹 브라우저로 옮겨준다.


HTTP는 신뢰성 있는 데이터를 전송 프로토콜을 사용하게 때문에, 데이터가 지구 반대편에서 오더라도 전송 중 손상되거나 꼬이지 않음을 보장한다.

그 덕분에 개발자는 인터넷의 결합이나 약점에 대한 걱정 없이 애플리케이션 고유의 기능을 구현하는데 집중할 수 있다.


웹 클라이언트와 서버


웹 컨텐츠는 웹 서버에 존재한다.

웹 서버는 HTTP 프로토콜로 의사소통하기 때문에 보통 HTTP 서버라고 불리며, 인터넷의 데이터를 저장하고, HTTP 클라이언트가 요청한 데이터를 제공한다.


리소스


웹 서버는 웹 리소스를 관리하고 제공한다.

웹 리소스는 웹 컨텐츠의 원천으로 가장 단순한 웹 리소스는 웹 서버 파일 시스템의 정적 파일이다. 정적 파일은 텍스트 파일, HTML 파일, 마이크로소프트 워드 파일, 어도비 아크로뱃파일, JPEG 이미지 파일 외 모든 종류의 파일을 포함한다.

그러나 리소스는 반드시 정적 파일이어야 할 필요는 없다. 리소스는 카메라에서 라이브 영상을 가져와 보여주거나, 주식 거래, 부동산 데이터베이스 등 요청에 따라 컨텐츠를 생산하는 프로그램이 될수도 있다.
결국 어떤 종류의 컨텐츠 소스도 리소스가 될 수 있다.


미디어 타입

HTTP는 웹에서 전송되는 객체 각각에 MIME타입이라는 데이터 포맷 라벨을 붙인다.

MIME(Multipurpose Internet Mail Extensions)은 원래 각기 다른 전자메일 시스템 사이에서 메시지가 오갈 때 겪는 문제점을 해결하기 위해 설계되었는데, 이메일에서 워낙 잘 동작했기 때문에 HTTP에서도 멀티미디어 컨첸츠를 기술하고 라벨을 붙이기 위해 채택되었다.


웹 서버는 모든 HTTP 객체 데이터에 MIME 타입을 붙인다.


MIME 타입은 사선(/)으로 구분된 주 타입(primary object type)과 부 타입(specific subtype)으로 이루어진 문자열 라벨로 예를 들면 아래와 같다.

  • HTML로 작성된 텍스트 문서는 text/html 라벨이 붙는다.
  • plain ASCII 텍스트 문서는 text/plain 라벨이 붙는다.
  • JPEG 이미지는 image/jpeg가 붙는다.
  • GIF 이미지는 image/gif가 된다.

URI

서버 리소스 이름은 통합 자원 식별자(uniform resource identifier), 혹은 URL로 불린다.

URL는 인터넷의 우편물 주소 같은 것으로, 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.


URL

통합 자원 지시자(uniform resource locator, URL)는 리소스 식별자의 가장 흔한 형태다.

URL은 특정 서버의 한 리소스에 대한 구체적인 위치를 서술한다.

URL은 리소스가 정확히 어디에 있고 어떻게 접근할 수 있는지 분명히 알려준다.


대부분의 URL은 세 부분으로 이루어진 표준 포멧을 따른다.

  • URL의 첫 번째 부분은 스킴(scheme)이라고 불리는데, 리소스에 접근하기 위해 사용되는 프로토콜을 서술한다. 보통 HTTP 프로토콜(http://)이다.
  • 두 번째 부분은 서버의 인터넷 주소를 제공한다.(예:www.joes-hardware.com)
  • 마지막 세 번째 부분은 웹 서버의 리소스를 가리킨다.(예:/specials/save-blade.gif)

트랜잭션


HTTP 트랜잭션은 요청 명령(클라이언트에서 서버로 보내는)과 응답 결과(서버가 클라이언트에게 돌려주는)로 구성되어 있다.

이 상호작용은 HTTP 메시지라고 불리는 정형화된 데이터 덩어리를 이용해 이루어진다.


메서드

HTTP는 HTTP 메서드라고 불리는 여러가지 종류의 요청 명령을 지원하는데, 모든 HTTP 요청 메시지는 한 개의 메서드를 갖는다.


흔히 사용되는 HTTP 메서드는 아래와 같다.

  • GET : 서버에서 클라이언트로 지정한 리소스를 보내라.
  • PUT : 클라이언트에서 서버로 보낸 데이터를 지정한 이름의 리소스로 저장하라.
  • DELETE : 지정한 리소스를 서버에서 삭제하라.
  • POST : 클라이언트 데이터를 서버 게이트웨이 애플리케이션으로 보내라.
  • HEAD : 지정한 리소스에 대한 응답에서, HTTP 헤더 부분만 보내라.

상태 코드

모든 HTTP 응답 메시지는 상태 코드와 함께 반환된다.

상태코드는 클라이언트에게 요청이 성공했는지 아니면 추가 조치가 필요한지 알려주는 세자리 숫자다.


흔히 사용되는 상태코드는 아래와 같다.

  • 200 : 좋다. 문서가 바르게 반환되었다.
  • 302 : 다시 보내라. 다른 곳에 가서 리소스를 가져가라.
  • 404 : 없음. 리소스를 찾을 수 없다.

HTTP는 각 숫자 상태 코드에 텍스트로 된 "사유 구절(reason phrase)"도 함께 보낸다.

이 구문은 단지 설명만을 위해서 포함된 것일 뿐 실제 응답 처리에는 숫자로 된 코드가 사용된다.

HTTP 소프트웨어는 다음에 열거된 상태 코드와 사유 구절을 모두 같은 것으로 취급한다.

200 OK
200 Document attached
200 Success
200 All's cool, dude

웹 페이지는 여러 객체로 이루어질 수 있다.

애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다.

예를 들어 웹브라우저는 시각적으로 풍부한 웹페이지를 가져올 때 대량의 HTTP 트랜잭션을 수행한다. 페이지 레이아웃을 서술하는 HTML "뼈대"를 한 번의 트랜잭션으로 가져온 뒤, 거기에 첨부된 이미지, 그래픽 조각, 자바 애플릿 등을 가져오기 위해 추가로 HTTP 트랜잭션을 수행한다. 이 리소스들은 서로 다른 서버에 각각 위치할 수도 있다. 이와 같이 웹페이지는 보통 하나의 리소스가 아닌 리소스의 모음이다.


메시지


HTTP 메시지는 단순한 줄 단위의 문자열이다.

이진 형식이 아닌 일반 텍스트이기 때문에 사람이 읽고 쓰기 쉽다. 웹 클라이언트에서 웹 서버로 보낸 HTTP 메시지를 요청 메시지라고 부르고, 서버에서 클라이언트로 가는 메시지는 응답 메시지라고 부른다. 그 외에 다른 종류의 HTTP 메시지는 없다.

HTTP 메시지는 다음의 세부분으로 이루어진다.


시작줄

메시지의 첫 줄은 시작줄로, 요청이라면 무엇을 해야 하는지 응답이라면 무슨일이 일어났는지 나타낸다.


헤더

시작줄 다음에는 0개 이상의 헤더 필드가 이어진다. 각 헤더 필드는 구문분석을 위해 쌍점(:)으로 구성되어 있는 하나의 이름과 하나의 값으로 구성되며, 헤더는 빈 줄로 끝난다.


본문

빈 줄 다음에는 어떤 종류의 데이터든 들어갈 수 있는 메시지 본문이 필요에 따라 올 수 있다.

요청이 본문의 웹 서버로 데이터를 실어 보내며, 응답의 본문은 클라이언트로 데이터를 반환한다.

시작줄이나 헤더와는 달리, 본문은 임의의 이진 데이터(이미지, 비디오, 오디오 트랙, 응용 소프트웨어)를 포함할 수 있다.


TCP/IP


HTTP는 애플리케이션 계층 프로토콜이다.

HTTP는 네트워크 통신의 핵심적인 세부사항에 대해서는 신경쓰지 않는다. 대신 대중적이고 신뢰성 있는 인터넷 전송 프로토콜인 TCP/IP에게 맡긴다.

TCP/IP는 TCP와 IP가 층을 이루는, 패킷 교환 네트워크 프로토콜의 집합이다. TCP/IP는 각 네트워크와 하드웨어의 특성을 숨기고, 어떤 종류의 컴퓨터나 네트워크든 서로 신뢰성 있는 의사소통을 하게 해준다.

일단 TCP 커넥션이 맺어지면, 클라이언트와 서버 컴퓨터 간에 교환되는 메시지가 없어지거나, 손상되거나, 순서가 뒤바뀌는 일은 결코 없다.


TCP는 다음을 제공한다.

  • 오류 없는 데이터 전송
  • 순서에 맞는 전달(데이터는 언제나 보낸 순서대로 도착한다.)
  • 조각나지 않는 데이터 스트림(언제든 어떤 크기로든 보낼 수 있다)

IP 주소 그리고 포트번호

HTTP 클라이언트가 서버와 메시지를 전송할 수 있게 되기 전에 인터넷 프로토콜(Internet Protocol, IP) 주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야 한다.

TCP는 서버 컴퓨터에 대한 IP 주소와 그 서버에서 실행 중인 프로그램이 사용하는 포트번호가 필요하다.


웹브라우저가 HTTP를 이용해서 멀리 떨어진 서버의 HTML 리소스를 사용자에게 보여주는 순서는 아래와 같다.

  1. 웹브라우저는 서버의 URL에서 호스트 명을 추출한다.
  2. 웹브라우저는 서버의 호스트 명을 IP로 변환한다.
  3. 웹브라우저는 URL에서 포트번호(있다면)를 추출한다.
  4. 웹브라우저는 웹 서버와 TCP 커넥션을 맺는다.
  5. 웹브라우저는 서버의 HTTP 요청을 보낸다.
  6. 웹브라우저는 웹브라우저에 있는 HTTP 응답을 돌려준다.
  7. 커넥션이 닫히면, 웹브라우저는 문서를 보여준다.

프락시

프락시는 클라이언트와 서버 사이에 위치하여, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다.

프락시는 주로 보안을 위해 사용되는데, 모든 웹 트래픽 흐름 속에서 신뢰할 만한 중개자 역할을 한다. 또한 프락시는 요청과 응답을 필터링한다.

예를 들면 회사에서 무엇인가를 다운 받을 때 애플리케이션 바이러스를 검출하거나, 학교에서 학생들이 성인 컨텐츠에 접근하는 것을 차단하는 것 등이 있다.


캐시

웹캐시와 캐시 프락시는 자신을 거쳐 가는 문서들 중 자주 찾는 것의 사본을 저장해두는 특별한 종류의 HTTP 프락시 서버다.

다음번에 클라이언트가 같은 문서를 요청하면 캐시가 갖고 있는 사본을 받을 수 있다. 클라이언트는 멀리 떨어진 웹 서버보다 근처의 캐시에서 훨씬 더 빨리 문서를 다운 받을 수 있다.

HTTP는 캐시를 효율적으로 동작하게 하고 캐시된 컨텐츠를 최신 버전으로 유지하면서 동시에 프라이버시도 보호하기 위한 많은 기능을 정의한다.


게이트웨이

게이트웨이는 다른 서버들의 중개자로 동작하는 특별한 서버다.

게이트웨이는 주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용되는데, 게이트웨이는 언제나 스스로가 리소스를 갖고 잇는 진짜 서버인 것처럼 요청을 다룬다.


예를 들면 HTTP/FTP 게이트웨이는

  1. FTP URI에 대한 HTTP 요청을 받아들인 뒤, FTP 프로토콜을 이용해 문서를 가져온다.
  2. 받아온 문서는 HTTP 메시지에 담겨 클라이언트에게 보낸다.

터널


터널은 두 커넥션 사이에서 날(raw) 데이터를 열어보지 않고 그대로 전달해주는 HTTP 애플리케이션이다.

HTTP 터널은 주로 비 HTTP 데이터를 하나 이상의 HTTP 연결을 통해 그대로 전송해주기 위해 사용된다.

HTTP 터널을 활용하는 대표적인 예로, 암호화된 SSL 트래픽을 HTTP 커넥션으로 전송함으로써 웹 트래픽만 허용하는 사내 방화벽을 통과시키는 것이 있다.


HTTP/SSL 터널은

  1. HTTP 요청을 받아들여 목적지의 주소와 포트번호로 커넥션을 맺는다.
  2. 암호화된 SSL 트래픽을 HTTP 채널을 통해 목적지 서버로 전송할 수 있게 된다.

에이전트


사용자 에이전트는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램이다.

웹 요청을 만드는 애플리케이션은 모두 HTTP 에이전트다. 이러한 사용자 에이전트에는 여러 가지 종류가 있는데, 사람의 통제 없이 스스로 웹을 돌아다니며 HTTP 트랜잭션을 일으키고 컨텐츠를 받아오는 스파이더(웹 크롤러)도 사용자 에이전트에 속한다.

'HTTP' 카테고리의 다른 글

[HTTP] 멱등성  (0) 2022.01.27
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
글 보관함