前言
今天我们巩固一下前面学过的知识,通过Selenium+Firefox实现模拟浏览器并自动翻页,爬取图片并写入本地文件中。
以搜索“女装”为例,自动爬取“女装”展示页面的前五页图片信息,先看一下爬取到的图片:
运行后浏览器的显示效果(我只截取了一部分):
本文学习要点:
掌握selenium+Firefox的常见用法
Selenium下拉滚动+翻页
会在浏览器上查看审查元素(浏览器右键–>检查)
例如我们定位搜索框:
xpath语法
图片写入本地文件
实战
直接上源码:
|
|
Android Developer | 一直在路上,为梦想奋斗!
今天我们巩固一下前面学过的知识,通过Selenium+Firefox实现模拟浏览器并自动翻页,爬取图片并写入本地文件中。
以搜索“女装”为例,自动爬取“女装”展示页面的前五页图片信息,先看一下爬取到的图片:
运行后浏览器的显示效果(我只截取了一部分):
本文学习要点:
掌握selenium+Firefox的常见用法
Selenium下拉滚动+翻页
会在浏览器上查看审查元素(浏览器右键–>检查)
例如我们定位搜索框:
xpath语法
图片写入本地文件
直接上源码:
|
|
微信支付