踏实，努力向上！

从实际的网页得到 HTML

上一篇 / 下一篇 2009-02-15 20:47:37 / 个人分类：python学习

import urllib.request
f = urllib.request.urlopen('http://www.python.org/')
htmlSource = f.read()
#htmlSource = f.read(100)
f.close()
print(htmlSource)

从实际网页中得到html代码。

提取用 urlopen 函数取回的网页的整个文本。打开一个 URL 同打开一个文件相似。urlopen 的返回值是像文件一样的对象，它具有一个文件对象一样的方法。

使用由 urlopen 所返回的类文件对象所能做的最简单的事情就是 read，它可以将网页的整个 HTML 读到一个字符串中。这个对象也支持 readlines 方法，这个方法可以将文本按行放入一个列表中。

当用完这个对象，要确保将它 close，就如同一个普通的文件对象.

收藏举报

TAG:

查看全部评论

从实际的网页得到 HTML

用户菜单

我的栏目

标题搜索

日历

我的存档

数据统计

RSS订阅