Week 05 ~ 07 : 전산학 프로젝트/SW정글 Week 07 : Web Server

[Web Server] 3. web proxy 구현 part I (sequential)

정글러 2021. 12. 22. 23:47
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
#include <stdio.h>
#include "csapp.h"
 
/* Recommended max cache and object sizes */
#define MAX_CACHE_SIZE 1049000
#define MAX_OBJECT_SIZE 102400
 
void doit(int fd);
int parse_uri(char *uri, char *hostname, char *path, int *port);
void makeHTTPheader(char *http_header, char *hostname, char *path, int port, rio_t *client_rio);
 
// 프록시 서버도 main의 알고리즘, doit의 상단부는 tiny와 같다
int main(int argc, char **argv)
{
    int listenfd, connfd;
    char hostname[MAXLINE], port[MAXLINE];
    socklen_t clientlen;
    struct sockaddr_storage clientaddr;
    if (argc != 2)
    {
        fprintf(stderr, "usage: %s <port>\n", argv[0]);
        exit(1);
    }
 
    listenfd = Open_listenfd(argv[1]);
    while (1)
    {
        clientlen = sizeof(clientaddr);
        connfd = Accept(listenfd, (SA *)&clientaddr, &clientlen);
        Getnameinfo((SA *)&clientaddr, clientlen, hostname, MAXLINE, port, MAXLINE, 0);
        printf("Accepted connection from (%s, %s)\n", hostname, port);
        doit(connfd);
        Close(connfd);
    }
    return 0;
}
 
void doit(int fd)
{
    char buf[MAXLINE], method[MAXLINE], uri[MAXLINE], version[MAXLINE];
    char HTTPheader[MAXLINE], hostname[MAXLINE], path[MAXLINE];
    rio_t rio;
    int backfd;
    rio_t backrio;
 
    Rio_readinitb(&rio, fd);
    Rio_readlineb(&rio, buf, MAXLINE);
    printf("Request headers:\n");
    printf("%s", buf);
    sscanf(buf, "%s %s %s", method, uri, version);
 
    if (strcasecmp(method, "GET"))
    {
        printf("Proxy does not implement this method\n");
        return;
    }
    int port;
    // uri를 파싱하는 목적은 서버마다 다른데, 프록시 서버에서의 목적은 hostname과 path를 추출하고 포트를 결정하는 것이다
    // 아래에서 이 목적에 따르는 코드로 parse_uri를 구현
    parse_uri(uri, hostname, path, &port);
    // 결정된 hostname, path, port에 따라 HTTP header를 만든다
    makeHTTPheader(HTTPheader, hostname, path, port, &rio);
 
    char portch[10];
    sprintf(portch, "%d", port);
    // back과 연결 후 만든 HTTP header를 보낸다
    backfd = Open_clientfd(hostname, portch);
    if(backfd < 0)
    {
        printf("connection failed\n");
        return;
    }
    Rio_readinitb(&backrio, backfd);
    Rio_writen(backfd, HTTPheader, strlen(HTTPheader));
    // 이어서 클라이언트가 보냈던 원문도 보낸 뒤 close
    size_t n;
    while((n = Rio_readlineb(&backrio, buf, MAXLINE)) != 0)
    {
        printf("proxy received %d bytes, then send\n", n);
        Rio_writen(fd, buf, n);
    }
    Close(backfd);
}
 
int parse_uri(char *uri, char *hostname, char *path, int *port)
{
    // port는 uri에 지정이 있어 갱신하는 것이 아니라면 80을 쓸 것
    *port = 80;
    char *hostnameP = strstr(uri, "//");
    // uri에 '//'가 있다면 hostnameP는 // 다음 indext부터
    if (hostnameP != NULL)
    {
        hostnameP = hostnameP + 2;
    }
    // 없다면 uri의 처음부터
    else
    {
        hostnameP = uri;
    }
    // path는 hostnameP의 ':'부터
    char *pathP = strstr(hostnameP, ":");
     
    if(pathP != NULL)
    {
        // ':'가 있다면 이를 \0으로 변환해 hostnameP를 둘로 cut하고
        *pathP = '\0';
        // hostname은 cut의 앞부분
        sscanf(hostnameP, "%s", hostname);
        // port는 ':'의 바로 다음 숫자부분, path는 그 다음부터의 스트링
        sscanf(pathP + 1"%d%s", port, path);
    }
    else
    {
        // ':'가 없다면 '/'를 찾는다 (포트가 지정되지 않았으니 포트 이전의 /를 기준으로 자름)
        pathP = strstr(hostnameP, "/");
        if(pathP != NULL)
        {
            // 마찬가지로 cut해서 앞 뒤로 hostname, path 결정, port는 지정하지 않았으니 80을 그대로 쓴다
            *pathP = '\0';
            sscanf(hostnameP, "%s", hostname);
            *pathP = '/';
            sscanf(pathP, "%s", path);
        }
        else
        {
            // ':'도 '/'도 없다면 hostname만 카피한다
            sscanf(hostnameP, "%s", hostname);
        }
    }
    return 0;
}
 
static const char *user_agent_header = "User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:10.0.3) Gecko/20120305 Firefox/10.0.3\r\n";
static const char *conn_header = "Connection: close\r\n";
static const char *prox_header = "Proxy-Connection: close\r\n";
static const char *host_header_format = "Host: %s\r\n";
static const char *requestlint_header_format = "GET %s HTTP/1.0\r\n";
static const char *endof_header = "\r\n";
static const char *connection_key = "Connection";
static const char *user_agent_key = "User-Agent";
static const char *proxy_connection_key = "Proxy-Connection";
static const char *host_key = "Host";
// 조건대로 헤더를 만듦
void makeHTTPheader(char *http_header, char *hostname, char *path, int port, rio_t *client_rio)
{
    char buf[MAXLINE], request_header[MAXLINE], other_header[MAXLINE], host_header[MAXLINE];
    sprintf(request_header, requestlint_header_format, path);
    while(Rio_readlineb(client_rio, buf, MAXLINE) > 0)
    {
        if(strcmp(buf, endof_header) == 0)
        {
            break;
        }
        if(!strncasecmp(buf, host_key, strlen(host_key)))
        {
            strcpy(host_header, buf);
            continue;
        }
        if(!strncasecmp(buf, connection_key, strlen(connection_key)) && !strncasecmp(buf, proxy_connection_key, strlen(proxy_connection_key)) && !strncasecmp(buf, user_agent_key, strlen(user_agent_key)))
        {
            strcat(other_header, buf);
        }
    }
    if(strlen(host_header) == 0)
    {
        sprintf(host_header, host_header_format, hostname);
    }
    sprintf(http_header, "%s%s%s%s%s%s%s", request_header, host_header, conn_header, prox_header, user_agent_header, other_header, endof_header);
    return ;
}
cs

프록시 서버도 서버를 운용하는 목적만 다를 뿐 구조는 거의 비슷하다.

'클라이언트로부터 스트링을 받아 잘 가공해서 목적에 맞게 잘 쓴다'

 

여기서 '목적에 맞게 잘 쓴다'의 의미가 tiny에서는 '클라이언트가 요구하는 페이지를 돌려주는 것'이었다면,

proxy에서는 '클라이언트가 보낸 스트링을 잘 가공해서 back에 건네주는 것'을 의미한다.

 

back에 건네줘야 하기 때문에 클라이언트와의 연결 뿐 아니라 back과의 연결도 필요하지만, 이 부분은 완전히 똑같은걸 하나 더 하는 것이기 때문에 큰 어려움 없이 복붙으로 끝나 다행이다.