Java抓取网页内容--生成静态页面

发表于:2009-12-29 10:00

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:未知    来源:51Testing软件测试网采编

#
java

  private static String getStaticPage(String surl) {

  String htmlContent = "";

  try {

  java.io.InputStream inputStream;

  java.net.URL url = new java.net.URL(surl);

  java.net.HttpURLConnection connection = (java.net.HttpURLConnection) url.openConnection();

  connection.connect();

  inputStream = connection.getInputStream();

  byte bytes[] = new byte[1024 * 2000];

  int index = 0;

  int count = inputStream.read(bytes, index, 1024 * 2000);

  while (count != -1) {

  index += count;

  count = inputStream.read(bytes, index, 1);

  }

  htmlContent = new String(bytes, "UTF-8");

  connection.disconnect();

  } catch (Exception ex) {

  ex.printStackTrace();

  }

  return htmlContent.trim();

  }

  String src= getStaticPage(“http://www.google.com”);

  File file = new File(“d:\aa.html”);

  FileWriter resultFile = new FileWriter(file);

  PrintWriter myFile = new PrintWriter(resultFile);

  //写文件

  myFile.println(src);

  resultFile.close();

  myFile.close();

《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号