代理IP即代理服务器(Proxy Server)也称网络代理,是一种特殊的网络服务,允许一个网络终端(一般为客户端)通过这个服务与另一个网络终端(一般为服务器)进行非直接的连接。一些网关、路由器等网络设备具备网络代理功能。一般认为代理服务有利于保障网络终端的隐私或安全,防止攻击。
功能
熊猫代理主要应用于数据爬虫,很多网站设置了反爬虫程序,这样的情况下爬虫需要通过IP代理来实现使用不同的IP地址进行数据爬取,从而突破网站对爬虫程序的限制,又比如某些电商网站、微博、YY挂机等应用,原理相同,都是为了突破程序或软件对同一IP多次访问的限制。
根据协议区分
代理IP软件支持以下协议
HTTP代理和HTTPS代理服务器
主要用于访问网页,一般有内容过滤和缓存功能。端口一般为80、8080、3128等。
SOCKS代理
只是单纯传递数据包,不关心具体协议和用法,所以速度快很多。一般有缓存功能。端口一般为1080。(SOCKS代理协议又分为SOCKS4和SOCKS5,SOCKS4协议只支持TCP,而SOCKS5协议支持TCP和UDP,还支持各种身份验证机制、服务器端域名解析等。简单来说:SOCKS4能做到的SOCKS5都可以做到,但SOCKS5能做到的SOCKS4不一定能做到)
根据匿名程度区分
一.透明代理(Transparent Proxies)目标服务器能够检测到真实的源IP。
使用透明代理,对方服务器可以知道你使用了代理,并且也知道你的真实IP。透明代理访问对方服务器所带的HTTP头信息如下:
REMOTE_ADDR=代理服务器IP
HTTP_VIA=代理服务器IP
HTTP_X_FORWARDED_FOR=你的真实IP
透明代理还是将你的真实IP发送给了对方服务器,因此无法达到隐藏身份的目的。
二.(普通)匿名代理(Anonymous Proxies)
目标服务器无法检测到真实的源IP,但能够检测到使用了代理。匿名代理访问对方服务器所带的HTTP头信息如下:
REMOTE_ADDR=代理服务器IP
HTTP_VIA=代理服务器IP
HTTP_X_FORWARDED_FOR=代理服务器IP
匿名代理隐藏了你的真实IP,但是向访问对象透露了你是使用代理服务器访问他们的。
三.高匿名代理(High Anonymity Proxies-Elite proxies)目标服务器无法检测到你在是使用代理。
高匿名代理访问对方服务器所带的HTTP头信息如下:
REMOTE_ADDR=代理服务器IP
HTTP_VIA不显示
HTTP_X_FORWARDED_FOR不显示