[C/C++] HTTP Server 요청 처리 [1] (Linux LineParser [readline])






HTTP는 기본적인 웹을 위한 프로토콜입니다.
[*프로토콜 = 일종의 통신 규약]
[ EX) 내가 A-A1-A2 라고 보낼 테니 처리해줘 라는 개념 ]

Client -> HTTP 규약의 요청(Request) -> Server
Client <- HTTP 규약의 응답(Response) <- Server

을 주고 받는 것이 기본 구조입니다.




엄청 자세한 것은 따로 책이나 문서를 찾아 보시는 것이 좋습니다.




그럼 요청을 어떤 구조로 보내야 기본적인 웹사이트에서 응답을 받을 수 있을까? 가 문제가 됩니다.


기본적인 포맷은 다음과 같습니다.

EX] Naver 예
GET / HTTP/1.1\r\n
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8\r\n
Accept-Encoding:gzip, deflate, sdch\r\n
Accept-Language:ko-KR,ko;q=0.8,en-US;q=0.6,en;q=0.4\r\n
Cache-Control:max-age=0\r\n
Connection:keep-alive\r\n
Cookie:npic=qkG66SYW2jtZBlXtH/Wije5Ykpf3CQP+5H+oH3ktJhsKKMuY5MFRbu1UaznPikHHCA==; NNB=22YFY2PRRCLFQ; ASID=7c3565980000015a18ebb3aa00000059; nx_ssl=2; PM_CK_rcode=04190121\r\n
Host:www.naver.com\r\n
Upgrade-Insecure-Requests:1\r\n
User-Agent:Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36\r\n


다음과 같은 포맷을 전달 할 때 다음의 응답을 받을 수 있습니다.
200 OK HTTP/1.1



하나씩 쪼개 보면,
CommandLine\r\n
HeaderLine\r\n
\r\n
(Post의 경우)ParamLine\r\n

으로 분리 될 수 있습니다.


CommandLine은
Method URL Version 으로 분리되어 있습니다.

Method(GET/PUT/POST)의 경우
이 메소드에 대한 처리를 해줘 라고 보내는 것이고
[C/C++ 서버의 경우 해당 메소드에 대한 처리를 따로 해주어야 합니다, 따로 프레임워크를 쓰지 않는 이상]

URL은
"이 파일을 원해 or 여기에 해당하는 정보를 줘"라는 요청을 하는 것입니다.

Version의 경우 HTTP의 버전을 얘기하는 것이죠







HeaderLine의 경우
요청에 필요한 추가 정보를 보낸다. 라고 이해하시면 될 것 같습니다.
(인증[Cookie] or 타입 or 타입의 크기 or 어떤 방식으로 파라미터를 인코딩 했는지 etc...)

만약 파일을 보낸다면

"이 파일을 이 타입으로 이 크기만큼 보낼께 처리해줘" 정도 되겠네요







ParamLine의 경우
ParamLine의 경우 추가적인 개인정보에 해당합니다.
파일을 보낼 때, 어떤 유저가 어떤 위치에 저장할지를 결정하는 정도 됩니다.

"이 파일을 이 타입으로 이 크기만큼 보낼께 처리해줘"
+
"근데 난 유전데, 이 경로에 이 파일을 저장해줘"

보통 ParamLine의 경우, encoding 방식이 적용되어 후킹에 대비합니다.
서버측에서 decoding으로 풀어 해결합니다.




그럼 server가 요청을 어떻게 처리할지 어느정도 감이 잡히실 거라 생각합니다.


기본적으로 처리를 위해서는
라인 별로 개행(CRLF)가 존재하기에 이 기준에 맞춰서 순차 분리를 진행합니다.

1. Client 요청 전송
2. Server 요청 수신
3. 요청에 대해 Line 별 분리
4. 메소드 및 URL에 따른 처리
5. Response 획득 처리


이 과정이 진행됩니다.


구현 기반은 Linux인데, Java의 경우 따로 HTTP Class가 잘 되어있어 제외하겠습니다.

우선적으로 lineparser를 구현할 필요가 있습니다.

FILE 포맷이 리눅스에 없기 때문입니다.(fgets 같은 라인 함수 사용 불가)


기본적으로 strtok_r의 동작구조와 비슷하게 구현하였습니다.

char* readline(const char* src, char** save_ptr)
{
 if (!src)
 {
  return NULL;
 }
 
 char* search_ptr = (char*)src;
 while (search_ptr)
 {
  if (*search_ptr == '\r' || *search_ptr == '\n')
  {
   *search_ptr++ = NULL;
   if (*search_ptr == '\r' || *search_ptr == '\n')
   {
    *search_ptr++ = NULL;
   }
   *save_ptr = search_ptr;
   break;
  }
  search_ptr++;
 }

 return (char*)src;
}


하나의 버퍼로 검색 포인터를 따로두어

개행이 발견되면 NULL로 넣고, 뒤에 값이 있는지를 확인 후, save_ptr로 전달합니다.

COMMANDLINE
HEADERLINE

일 경우 COMMANDLINE까지만 읽고
HEADERLINE의 'H'는 save_ptr이 가지고 있는 구조입니다.

이후 작업에서 save_ptr로 추가적인 작업이 가능합니다.



이 함수만 가지고


작업을 진행하겠습니다.











추가로 읽으면 좋을 것

댓글

이 블로그의 인기 게시물

윤석열 계엄령 선포! 방산주 대폭발? 관련주 투자 전략 완벽 분석

대통령 퇴진운동 관련주: 방송·통신·촛불수혜주 완벽 분석

키움 OPEN API MFC 개발 (1)