我不是理论派,那就从实践中成长吧 微博:http://www.weibo.com/willsfanw

python实例练手001

上一篇 / 下一篇  2010-04-29 19:50:55

学python有一段时间了,该考虑拿工作中一些解决问题的需求来练练手了
工作需求:对某论坛(未提供rss)的页面的新贴进行关注,定时以邮件的方式发出来

于是开始考虑:
要实现必然会用到python的urllib smtplib 
然后希望加入命令行来控制,所以需要用到optparse

首先从抓取网页开始
01 import smtplib
02 global url
03 url = r"http://bbs.xxxxxx.html" 要抓取的网页的url
04 
05 def AnalyseHtml(url):
06     sockUrl = urllib.urlopen(url)
07     htmlSoucrc = sockUrl.read()
08     sockUrl.close()
09     f.file('test.html','w')
10     f.write(htmlSource)
11     f.close()

简单看了下python的正则模块,发现不太理解,故选择了把抓取到的页面保存到本地,然后再用自己比较熟悉的autoit脚本来完成对html页面的分析,而python则只负责了抓取网页和发送邮件



TAG:

引用 删除 350919042   /   2014-06-19 11:49:59
不错
引用 删除 350919042   /   2014-06-19 11:48:15
3
 

评分:0

我来说两句

日历

« 2024-05-07  
   1234
567891011
12131415161718
19202122232425
262728293031 

数据统计

  • 访问量: 18202
  • 日志数: 22
  • 建立时间: 2009-12-07
  • 更新时间: 2011-09-26

RSS订阅

Open Toolbar