我不是理论派,那就从实践中成长吧
微博:http://www.weibo.com/willsfanw
python实例练手001
上一篇 /
下一篇 2010-04-29 19:50:55
学python有一段时间了,该考虑拿
工作中一些解决问题的需求来练练手了
工作需求:对某论坛(未提供rss)的页面的新贴进行关注,定时以邮件的方式发出来
于是开始考虑:
要实现必然会用到python的urllib smtplib
然后希望加入命令行来控制,所以需要用到optparse
首先从抓取网页开始
01 import smtplib
02 global url
03 url = r"http://bbs.xxxxxx.html" 要抓取的网页的url
04
05 def AnalyseHtml(url):
06 sockUrl = urllib.urlopen(url)
07 htmlSoucrc = sockUrl.read()
08 sockUrl.close()
09 f.file('test.html','w')
10 f.write(htmlSource)
11 f.close()
简单看了下python的正则模块,发现不太理解,故选择了把抓取到的页面保存到本地,然后再用自己比较熟悉的autoit脚本来完成对html页面的分析,而python则只负责了抓取网页和发送邮件
收藏
举报
TAG: