爬取zngirls.com网站图片的小爬虫
在Windows环境下使用Eclipse + PyDev插件开发,并使用了BeautifulSoup包。 模块划分借鉴imooc的python教程
抓取网站:http://www.zngirls.com/ 当前版本只能抓取指定人的信息和照片。 抓取过程: 1,抓取指定人的个人主页,获取姓名,个人资料及相册地址; 2,在指定目录以姓名建立文件夹,并将个人信息保存为txt文件; 3,遍历相册集合,获取相册中每一照片页片的地址和相册名称; 4,遍历照片页面集合,获取每张照片的地址; 5,保存所有照片至以相册名命名的文件夹中; 6,抓取完毕后发送汇总信息至指定邮箱;
注:SMTP服务器使用的是网易的,使用者可根据自己的情况修改服务器地址,并使用自己的邮箱发送。