踏实,努力向上!

从实际的网页得到 HTML

上一篇 / 下一篇  2009-02-15 20:47:37 / 个人分类:python学习

import urllib.request
f = urllib.request.urlopen('http://www.python.org/')
htmlSource = f.read()
#htmlSource = f.read(100)                          
f.close()                                       
print(htmlSource)

从实际网页中得到html代码。

提取用 urlopen 函数取回的网页的整个文本。打开一个 URL打开一个文件相似。urlopen 的返回值是像文件一样的对象,它具有一个文件对象一样的方法。

使用由 urlopen 所返回的类文件对象所能做的最简单的事情就是 read,它可以将网页的整个 HTML 读到一个字符串中。这个对象也支持 readlines 方法,这个方法可以将文本按行放入一个列表中。

当用完这个对象,要确保将它 close,就如同一个普通的文件对象.


TAG:

 

评分:0

我来说两句

Open Toolbar