在HTTP通信链上,客户端和目标服务器之间通常存在某些中转代理服务器,它们提供对目标资源的中转访问。一个HTTP请求可能被多个代理服务器转发,后面的服务器称为前面服务器的上游服务器。代理服务器按照其使用方式和作用,分为正向代理服务器,反向代理服务器和透明代理服务器。
正向代理要求客户端自己设置代理服务器的地址。客户的每次请求都将直接发送到该代理服务器,并由代理服务器来请求目标资源。比如裤笑处于防火墙内的局域网机器要访问Internet,或者要访问一些被屏蔽掉的国外网站,就需要使用正向代理服务器。
反向代理则被设置在服务器端,因而客户端无需进行任何设置。反向代理是指用代理服务器来接收Internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从内部服务器上得到的结果返回给客户端。这种情况下,代理服务器对外就表现为一个真实的服务器。各大网站通常分区域设置了多个代理服务器,所以在不同的地方同一个域名可能得到不同的IP地址,因为这些IP地址实际上是代理服务器的IP地址。
HTTP代理服务器的胡册含工作原理
如图所示,正向代理服务器和客户端主机处于同一个逻辑网络中。该逻辑网络可以是一个本地LAN,也可以是一个更大的网络。反向代理服务器和真正的Web服务器也位于同一个逻辑网络中,这通常由提供网站的公司来配置和管理。
透明代理只能设置在姿绝网关上。用户访问Internet的数据报必然都经过网关,如果在网关上设置代理,则该代理对用户来说显然是透明的。透明代理可以看作正向代理的一种特殊情况。
代理服务器通常还提供缓存目标资源的功能,这样用户下次访问同一资源时速度将很快。优秀的开源软件squid,varnish都是提供了缓存能力的代理服务器软件,其中squid支持所有代理方式,而varnish仅能用作反向代理。
器)构成,两者之间采用超文本传送协议(HTTP)进行通信, HTTP协议的作用原理包括四
个步骤:连接,请求,应答。根据上述HTTP协议的作用原理,本文实现了GET请求的Web服
务器程序的方法,通过创建 TcpListener类对象,监听端口8080; 等待、接受客户机连
接到端口8080; 创建与socket字相关联的输入流和输出流;然后,读取客户机的请求信
息,若请求类型是GET,则从请求信息中获取所访问的HTML文件名,如果HTML文件存在,
则打开HTML文件,把HTTP头信息和 HTML文件内容通过socket传回给Web浏览器,然后关闭
文件。否则发送错误信息给Web浏览器。最后,关闭与相应Web浏览器连接的socket 字。
一、HTTP协议的作用原理
WWW是以Internet作为传输媒介的一个应用系统,WWW网上最基本的传输单位是 Web网
页。WWW的工作基于客户机/服务器计算模型,由Web 浏览器(客户机)和Web服务器(服务
器)构成,两者之间采用超文本传送协议(HTTP)进行通信。HTTP协议是基于TCP/IP协议
之上的协议,是Web浏览器和Web服务器之间的应用层协议,是通用的、无状态的、面向对
象的协议。HTTP协议的作用原理包括四个步骤:
连接:Web浏览器与Web服务器建立连接,打开一个称为socket(套接字)的虚拟文
件,此文件的建立标志着连接建立成功。
请求:Web浏览器通过socket向Web服务器提交请求。HTTP的请求一般是GET或POST命
令(POST用于FORM参数的传递)。GET命令的格式为:
GET 路径/文件名 HTTP/或手1.0
文件名指出所访问的文件,HTTP/1.0指出Web浏览器使用的HTTP版本。
应答:Web浏览器提交请求后,通过HTTP协议传送给Web服务器。Web服务器接到后,
进行事务处理,处理结果又通过HTTP传回给Web浏览器,从而在Web浏览器上显示出所请求
的页面。
例:假设客户机与www.mycomputer.com:8080/mydir/index.html建立了连接,就会发
送GET命令: GET /mydir/index.html HTTP/1.0。主机名为www.mycomputer.com的Web服
务器从它的文档空间中搜索子目录mydir的文件index.html。如果找到该文件,Web服务器
把该文件内容传送给相应的Web浏览器。
为了告知 Web浏览器传送内容的类型,Web服务器首先传送一些HTTP头信息,然后传
送具体内容(即HTTP体信息),HTTP头信衫猜嫌息和HTTP体信息之间用一个空行分开。
常用的HTTP头信息有:
① HTTP 1.0 200 OK
这是Web服务器应答的第一行,列出服务器正在运行的HTTP版本号和应答代码。代码
“200 OK”表示请求完成。
② MIME_Version:1.0
它指示MIME类型的版本。
③ content_type:类型
这个头信息非常重要,它指示HTTP体信息的MIME类型。如:content_type:text/html
指示传送的数据是HTML文档。
④ content_length:长度值
它指示HTTP体信息的长度(字节)。
关闭连接:当应答结束后,兆差Web浏览器与Web服务器必须断开,以保证其它Web浏览器
能够与Web服务器建立连接。
HTTP 协议定义服务器端和客户端之间文件传输的沟通方式。目敏陪前HTTP协议的版本是Http1.1。RFC 2616描述了HTTP协议的具体信息。
这个协议已经成为浏览器和Web站点之间的标准。
当我上网的时候底层是如何进行交互的?
当访问者点击一个超链接的时候,将会给浏览器提交一个URL地址。通过这个URL地址,浏览器便知道去链仿睁接那个网站并去取得具体的页面文件(也可能是一张图片,一个pdf文件)。
HTTP工作的基础就是,连接一个服务器并开始传输文件到浏览器。
HTTP传输的基本过程
在http传输的过程中,被称为客户端的请求者向服务器请求一个文件。
最基本的过程是:
1 客户端连接一个主机;
2 服务器接收连接,
3 客户端请求一个文件,
4 服务器发送一个应答.
实例
我们看几个典型的过程
首先,我们想访问本页面。在浏览器上敲入“http://www.maketop.net/resource/rs_041112_02.php”.浏览器将连接www.maketop.net然后发送:
>> GET /resource/rs_041112_02.php Http1.1
>> Host: www.maketop.net
>> Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg,
>> Accept-Language: en
>> Accept-Encoding: gzip, deflate
>> User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; rv:1.7.3) Gecko/20040913 Firefox/0.10
>> Connection: Keep-Alive
>>
解释:浏览器请求页面“/resource/rs_041112_02.php”。并使用HTTP1.1协议。并告诉服务器你的浏览器是Firefox0.10。操作系统是Windows XP。 浏览器希望保持与www.maketop.net之间的连接,并请求获得多的文件,包括网页中的图片。翻译成语言上面是:
>> 用HTTP1.1协议获得 /resource/rs_041112_02.php
>> 访问的主机是: www.maketop.net
>> 接收的文件包括了: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg,
>> 使用的语言是: en
>> 接收的编码方式(浏览器能够解释的)是: gzip, deflate
>> 用户的浏览器信息:Windows XP的操作系统 Firefox/0.10的浏览器
>> 保持连接: 还要去图片
>>
www.maketop.net的服务器发出响应:
<< HTTP/1.1 200 OK
<< Date: Mon, 12 Mar 2004 19:12:16 GMT
<< Server: Apache/1.3.31 (Unix) mod_throttle/3.1.2
<< Last-Modified: Fri, 22 Sep 2004 14:16:18
<< ETag: "dd7b6e-d29-39cb69b2"
<< Accept-Ranges: bytes
<< Content-Length: 3369
<< Connection: close
<桥大蠢< Content-Type: text/html
<<
<< File content goes here
浏览器并从服务器的响应中获得服务器的信息:比如运行在Apache。
上面翻译成翻译成语言上面就是
<< HTTP1.1协议方式有效
<< 当前时间是: Mon, 12 Mar 2004 19:12:16 GMT
<< 服务器是: Apache/1.3.31 (Unix) mod_throttle/3.1.2
<< 最后一次修改: Fri, 22 Sep 2004 14:16:18
<< ETag: "dd7b6e-d29-39cb69b2"
<< Accept-Ranges: bytes
<< Content-Length: 3369
<< Connection: close
<< Content-Type: text/html
<<
<< File content goes here
为了安全我尺御还是先问一下,你的意思希望你说陵困袜明白一点。
你的意思是在IE里输入http://XXXXXXX.com 是个什么样的原理吗?如果是这样的话,我就可以回答。不然回答得是别的方面滴