Java HttpClient深入分析
上一篇 / 下一篇 2012-09-06 22:40:13 / 个人分类:java
文章来源
- 文章来源:【转载】
1. 读取网页(HTTP/HTTPS)内容51Testing软件测试网U9iB-M+Hi m
下面是我们给出的一个简单的例子用来访问某个页面
S&fN nUK,Y0/* 51Testing软件测试网6Vwx
NF6f
* Created on 2003-12-14 by Liudong 51Testing软件测试网2C
F
p^[Y@3H
*/
package http.demo; 51Testing软件测试网m
YCm \/O[;Gq-@*Z
import java.io.IOException; 51Testing软件测试网0iR7E1a-X%l+l
import org.apache.commons.httpclient.*; 51Testing软件测试网cr
VEdN0}
import org.apache.commons.httpclient.methods.*;51Testing软件测试网L(c%K0P?#P
/** 51Testing软件测试网+BR"H9A*Uc
i|&M
*最简单的HTTP客户端,用来演示通过GET或者POST方式访问某个页面
z&E],DP0*@authorLiudong51Testing软件测试网o_^ RLO:N
*/
wh;L/j+T#iwf0public class SimpleClient {
7cS6i(PY,wz!I.u0public static void main(String[] args) throws IOException 51Testing软件测试网o+W(A"O3z^:~.fv
{
~6Xk-k2I0VK0HttpClient client = new HttpClient();
7`&mE?S @ ^0 // 设置代理服务器地址和端口 51Testing软件测试网Isk$Xg1_/w-SbSU
//client.getHostConfiguration().setProxy("proxy_host_addr",proxy_port);
2F1{+{rw|qI0 // 使用 GET 方法 ,如果服务器需要通过 HTTPS 连接,那只需要将下面 URL 中的 http 换成 https 51Testing软件测试网kVHP^
HttpMethodmethod=newGetMethod("http://java.sun.com");51Testing软件测试网&~f!hx8_t8|ncN)S
//使用POST方法51Testing软件测试网,KGjc2Hu0j4[ Qr3^
//HttpMethod method = new PostMethod("http://java.sun.com");51Testing软件测试网(w
Q!K:o0U
GUu
client.executeMethod(method);51Testing软件测试网 X_~p.[L
//打印服务器返回的状态51Testing软件测试网%Cj.n aAg%W
System.out.println(method.getStatusLine());
Lnq5u[Al p0 //打印返回的信息51Testing软件测试网%tL%Id%Ty:R/Te~3F:|m-M
System.out.println(method.getResponseBodyAsString());
U:PN4b$`0i
S V0s0T0 //释放连接
*A
IG J,l/W
tZ{0 method.releaseConnection();51Testing软件测试网X&hH,}_
}51Testing软件测试网O`.Mj/Ww"z
}51Testing软件测试网/^U1Be*{,N[A
在这个例子中首先创建一个HTTP客户端(HttpClient)的实例,然后选择提交的方法是GET或者POST,最后在HttpClient实例上执行提交的方法,最后从所选择的提交方法中读取服务器反馈回来的结果。这就是使用HttpClient的基本流程。其实用一行代码也就可以搞定整个请求的过程,非常的简单!
NO6[|:B uCS)U02. 以GET或者POST方式向网页提交参数
fih%Mk0其实前面一个最简单的示例中我们已经介绍了如何使用GET或者POST方式来请求一个页面,本小节与之不同的是多了提交时设定页面所需的参数,我们知道如果是GET的请求方式,那么所有参数都直接放到页面的URL后面用问号与页面地址隔开,每个参数用&隔开,例如:http://java.sun.com/?name=liudong&mobile=123456,但是当使用POST方法时就会稍微有一点点麻烦。本小节的例子演示向如何查询手机号码所在的城市,代码如下:
8A5k+qJd4?%J1L k0
Jz*L#U W0/* 51Testing软件测试网3cc2romj[4A0d
* Created on 2003-12-7 by Liudong
C rd8l&W%I9U0*/
JN6jrFHl1M0package http.demo; 51Testing软件测试网ZSWY2E!U4?G
import java.io.IOException;
eE&kY$K]
S0import org.apache.commons.httpclient.*; 51Testing软件测试网.{OT
\a(y
import org.apache.commons.httpclient.methods.*;51Testing软件测试网lI4XO+i:Z!k5zP
/**
&@0z+oSL
Y0*提交参数演示
? L%o4Tr!@5uZ_0*该程序连接到一个用于查询手机号码所属地的页面
wi!yV
pS?0*以便查询号码段1330227所在的省份以及城市51Testing软件测试网U5S \E^3hO-^6lR
*@authorLiudong51Testing软件测试网\:Z[8q2j
w
*/ 51Testing软件测试网c7y-Mhd.F9AP B
public class SimpleHttpClient { 51Testing软件测试网d?Z/XB2a$H
public static void main(String[] args) throws IOException {
#{+u%N[Bi_0 HttpClient client = new HttpClient();
2a
x`[jD&C0 client.getHostConfiguration().setHost( "www.imobile.com.cn" , 80, "http" );51Testing软件测试网ak/})WfZ4w$nqs
method = getPostMethod(); // 使用 POST 方式提交数据
8O
O8pw5Gae0 client.executeMethod(method); //打印服务器返回的状态
:k7jHyu3rxp-U0 System.out.println(method.getStatusLine()); //打印结果页面51Testing软件测试网q7^,F,m%o
Stringresponse=newString(method.getResponseBodyAsString().getBytes("8859_1"));
//打印返回的信息51Testing软件测试网6w8XZ| NCS
System.out.println(response);51Testing软件测试网f6IK7zY
method.releaseConnection();51Testing软件测试网V
rs`
jz`b,L8H[x
}
/**
2MEHod4iB0 * 使用 GET 方式提交数据 51Testing软件测试网~7o#Jh,@_&`3R?9b
*@return 51Testing软件测试网s:soJ/y/UDpD X
*/51Testing软件测试网
DSr4f6eA t
privatestaticHttpMethodgetGetMethod(){51Testing软件测试网^gY&^x0@
returnnewGetMethod("/simcard.php?simcard=1330227");51Testing软件测试网9i[Y!T3x
}51Testing软件测试网 Bx,|dR
/** 51Testing软件测试网%v4P}[N)coE6x
* 使用 POST 方式提交数据
us%[G"[g*P]0 *@return 51Testing软件测试网8u2o`7ym}GaC
*/
M#F
Lu5_m0 private static HttpMethod getPostMethod(){51Testing软件测试网.c#gf?%s+{
PostMethod post = new PostMethod( "/simcard.php" );
[LW i/v G/w6peY0 NameValuePair simcard = new NameValuePair( "simcard" , "1330227" );
H5mE{6Q{\_0 post.setRequestBody( new NameValuePair[] { simcard});51Testing软件测试网0P9a$F3V_
return post; 51Testing软件测试网f5{J@xNPe
}
$] b.p[mu0}
在上面的例子中页面http://www.imobile.com.cn/simcard.php需要一个参数是simcard,这个参数值为手机号码段,即手机号码的前七位,服务器会返回提交的手机号码对应的省份、城市以及其他详细信息。GET的提交方法只需要在URL后加入参数信息,而POST则需要通过NameValuePair类来设置参数名称和它所对应的值。
*HXfTn{ E;y K03. 处理页面重定向51Testing软件测试网5W*R*^,^!Qd
在JSP/Servlet编程中response.sendRedirect方法就是使用HTTP协议中的重定向机制。它与JSP中的<jsp:forward …>的区别在于后者是在服务器中实现页面的跳转,也就是说应用容器加载了所要跳转的页面的内容并返回给客户端;而前者是返回一个状态码,这些状态码的可能值见下表,然后客户端读取需要跳转到的页面的URL并重新加载新的页面。就是这样一个过程,所以我们编程的时候就要通过HttpMethod.getStatusCode()方法判断返回值是否为下表中的某个值来判断是否需要跳转。如果已经确认需要进行页面跳转了,那么可以通过读取HTTP头中的location属性来获取新的地址。51Testing软件测试网,IBByG S;m-J
状态码
GCuu5|+@U#ek7h!I0对应 HttpServletResponse 的常量
GVNKl*aCz;\0详细描述 51Testing软件测试网{5~0Qm.[ Y0Om
301
zgH LEB8r9LS:y#UN#D0SC_MOVED_PERMANENTLY
*Z6y&K*T].j0页面已经永久移到另外一个新地址 51Testing软件测试网VK
{N4bdn#ps
r
9Qh:D#k"En0302
C$Tu9@-k;U2FoRJ0SC_MOVED_TEMPORARILY 51Testing软件测试网,ZZ+JhP$] T[
页面暂时移动到另外一个新的地址51Testing软件测试网K5]"?u
k
SY
303
h+|@bu;H-p)?0SC_SEE_OTHER
(f]!|$w{\r0客户端请求的地址必须通过另外的 URL 来访问
w\ TEvc/y'rB051Testing软件测试网R8B:eXW8| J
307
-[g#q^0w+P0SC_TEMPORARY_REDIRECT 51Testing软件测试网 A_8j2i Wr2mw
同 SC_MOVED_TEMPORARILY
下面的代码片段演示如何处理页面的重定向51Testing软件测试网.[+LN+^ cV
client.executeMethod(post);
gYFBy#`w'm0System.out.println(post.getStatusLine().toString());51Testing软件测试网T
T
S
|+@9R6C];Z
post.releaseConnection();
d|)j[4C0// 检查是否重定向
M7N
q q%v+KI&_2LJ0int statuscode = post.getStatusCode();51Testing软件测试网5Q7l3BXf*Am.v
if ((statuscode == HttpStatus.SC_MOVED_TEMPORARILY) || (statuscode == HttpStatus.SC_MOVED_PERMANENTLY) || (statuscode == HttpStatus.SC_SEE_OTHER) || (statuscode == HttpStatus.SC_TEMPORARY_REDIRECT)) {
r)~+oif;a I0// 读取新的 URL 地址 51Testing软件测试网h$Q'd](cXx }*A)J
Headerheader=post.getResponseHeader("location");51Testing软件测试网wS c cN l
if (header!=null){51Testing软件测试网 fcc'`k{
Stringnewuri=header.getValue();51Testing软件测试网~\,A.nFkh
if((newuri==null)||(newuri.equals("")))
3Z*N/~;Fi0 newuri="/";51Testing软件测试网E3RK,niI,H
B\G
GetMethodredirect=newGetMethod(newuri);51Testing软件测试网,z|3dB]'|c%Q
client.executeMethod(redirect);51Testing软件测试网!Ls_&V~3e,r ~
System.out.println("Redirect:"+redirect.getStatusLine().toString());
;ExDHlso1\0 redirect.releaseConnection();51Testing软件测试网_DI#C&r
}else 51Testing软件测试网9f!\9FS+l(P5k*c
System.out.println("Invalid redirect");51Testing软件测试网$M^3o[;vu"e
}
我们可以自行编写两个JSP页面,其中一个页面用response.sendRedirect方法重定向到另外一个页面用来测试上面的例子。
KgCyiDQf y[ay04. 模拟输入用户名和口令进行登录51Testing软件测试网+`,ZQpV?1`
本小节应该说是HTTP客户端编程中最常碰见的问题,很多网站的内容都只是对注册用户可见的,这种情况下就必须要求使用正确的用户名和口令登录成功后,方可浏览到想要的页面。因为HTTP协议是无状态的,也就是连接的有效期只限于当前请求,请求内容结束后连接就关闭了。在这种情况下为了保存用户的登录信息必须使用到Cookie机制。以JSP/Servlet为例,当浏览器请求一个JSP或者是Servlet的页面时,应用服务器会返回一个参数,名为jsessionid(因不同应用服务器而异),值是一个较长的唯一字符串的Cookie,这个字符串值也就是当前访问该站点的会话标识。浏览器在每访问该站点的其他页面时候都要带上jsessionid这样的Cookie信息,应用服务器根据读取这个会话标识来获取对应的会话信息。
E4y7\ Rz%uD'}0对于需要用户登录的网站,一般在用户登录成功后会将用户资料保存在服务器的会话中,这样当访问到其他的页面时候,应用服务器根据浏览器送上的Cookie中读取当前请求对应的会话标识以获得对应的会话信息,然后就可以判断用户资料是否存在于会话信息中,如果存在则允许访问页面,否则跳转到登录页面中要求用户输入帐号和口令进行登录。这就是一般使用JSP开发网站在处理用户登录的比较通用的方法。
T"['Sb%n0这样一来,对于HTTP的客户端来讲,如果要访问一个受保护的页面时就必须模拟浏览器所做的工作,首先就是请求登录页面,然后读取Cookie值;再次请求登录页面并加入登录页所需的每个参数;最后就是请求最终所需的页面。当然在除第一次请求外其他的请求都需要附带上Cookie信息以便服务器能判断当前请求是否已经通过验证。说了这么多,可是如果你使用httpclient的话,你甚至连一行代码都无需增加,你只需要先传递登录信息执行登录过程,然后直接访问想要的页面,跟访问一个普通的页面没有任何区别,因为类HttpClient已经帮你做了所有该做的事情了,太棒了!下面的例子实现了这样一个访问的过程。
O`](p6i?051Testing软件测试网y#?$d'e
}2R
/*
8Y[bW$k0* Created on 2003-12-7 by Liudong 51Testing软件测试网6W6{aW$]\G7x
*/ 51Testing软件测试网.G
W"`%x&~S qNR
package http.demo;
(@+_2ho5O$^9r)?0J)ua#\0import org.apache.commons.httpclient.*;