大家好,我是一枚爬虫攻城狮。时常分享我在工作之余捣鼓的一些python小技巧。今天我们来说一说如何实现自动注册账号。
作为一名爬虫,有时候会有这样的烦恼。我要爬取一个网站,该网站需要登录才能拿到更多数据,可恶的是,用同一个账号去频繁的爬取,他就给你封号了!这真的是难受啊。那么,如果我有很多账号,一个被封了换一个不就好啦。嘿嘿~小伎俩。
(此分享面向所有小白,有点python基础就能玩儿哦~)
接下来分享如何实现这个功能。首先,我们要做一些准备,包括:python环境,selenium环境,接码平台账号(我用的易码)
python环境
- 访问http://www.python.org/download/*载下**。注意有python2和python3之分。我的代码是用python2写的,所以小伙伴们可以*载下**python2.7的环境。

python2.7安装包
- 打开此电脑属性,将python环境配置到环境变量。将你python的安装路径配置到path即可

- 验证是否安装成功。由于我这里是Python2和Python3环境并存。所以我输入Python2,如果小伙伴们电脑里只装了Python2的环境,输入Python就可以啦。

如图所示即表示成功安装
selenium环境
- 安装selenium包。打开cmd命令窗口,输入pip install selenium即可。
- 安装webdriver。(我用的是Chormedriver,小伙伴们同样可以用foxdriver。这里以Chormediver的安装为例)

Chromedriver对应的Chrome版本
- 注意*载下**Chromedriver前要对应到自己Chrome浏览器的版本哦。然后,*载下**链接在这里http://npm.taobao.org/mirrors/chromedriver/。找到对应的版本*载下**即可。
- 将*载下**好的chormedriver配置到环境变量。这里,我已经将python2的路径配置到环境变量了,于是直接将*载下**好的chromedriver复制到这里即可。

易码平台API
http://www.51ym.me/User/apidocs.html这里是易码平台的接口详细文档。我对我们要使用的接口作一些说明。
- 登录接口。获取token用。如图所示,只需要按照接口范例输入你的账号,密码。此接口只用来获取token,因为只要你的账号密码没改,token是不变的。以后登录只需用你获取到的token值登录就行。

- 获取手机号接口。如图所示,有三个必传参数,action:固定值getmobile,token:你的账号密码返回的token值,itemid:你所要爬取的网站的itemid。最后一个作一个特别说明。

获取手机号码接口

短信验证码服务
- 如上图所示。http://www.51ym.me/User/MobileSMSCode.aspx访问这个链接即进入这个界面。点击“选择项目”。编号下方对应的数字即为对应项目的itemid

如图编号下方即是对应的itemid
- 获取验证码接口。参照易码API接口文档可见,有4个必传参数,分别是action:固定值getsms,token:你的账号密码获取到的token值,itemid:上面所说的对应项目名的id,mobile:通过获取手机号接口获取到的手机号。然后按照接口范例的示范操作即可。

那么,至此。实现自动注册账号的准备工作已经就绪!接下来就是代码实现啦。我们先放一个效果视频给大家看一下,明天继续更。
视频加载中...