一键采集及搜索任意微信公众号所有历史文章,带阅读量评论数批量导出markdown、pdf、word、txt、Excel、Html保存到本地电脑,并一次*载下**微信文章中全部图片、视频、音乐音频和留言评论等,非常强大!
软件不仅可以*载下**html、pdf格式,文章中图片,最重要的一点是可以直接*载下**markdown格式文件,md格式文件可以直接进行编辑修改。
获取微信公号文章列表,需要 3 个特殊参数:
- _biz:公众号的 id
- uin:微信用户的 ID
- key:不知道是啥
这 3 个参数通过 http 代理获取,剩下的就是普通爬虫的做法了
作者仓库地址: https://github.com/xiaoguyu/wechatdownload
使用方法

- 单篇文章*载下**
- 直接输入链接,点击*载下**按钮即可
- 此方式无需登录微信,也因此无法获取评论和文章中QQ音乐音频,如需要这两样数据,请使用批量*载下**或监控*载下**
- 批量*载下**
- 初次使用请安装证书,设置中心 → 打开证书路径 → 打开rootCA.crt文件
- 需要安装电脑版微信
- 点击批量*载下**按钮,开始监听微信公号数据
- 在电脑版微信打开一篇需要*载下**的公号的文章
- 回到WechatDownload,会弹框提示
- 监控*载下**
- 需要安装电脑版微信
- 在WechatDownload点击监控*载下**按钮(按钮会变颜色)
- 在电脑版微信打开需要*载下**的文章(可以打开多篇文章)
- 回到WechatDownload,再次点击监控*载下**按钮即可开始*载下**
- 保存至 MySql
- 需要执行 /doc/mysql.sql 文件中的 SQL 语句创建表
- 线程配置
- 时间间隔:单位是毫秒,假设时间间隔500,单线程是*载下**完一篇文章,等待500毫秒再继续*载下**。多线程就是每500毫秒异步*载下**文章,无需等待上一篇文章*载下**完成。
- 单批数量:假设单批数量10,每次会同时异步*载下**10篇文章,等待这10篇*载下**完成,再继续*载下**10篇。
功能
设置中心有啥就支持啥
- 支持选择*载下**范围
- 将网页抓换成HTML、Markdown、PDF
- 将网页源码保存至Mysql(*载下**来源是网络才有效)
- *载下**图片、音频到本地
- 添加原文链接、元数据(作者、时间、公号名)
- 跳过现有文章
- *载下**评论
- *载下**来源(此选项只影响批量*载下**):
- 网络:就是从微信接口获取文章
- 数据库:如果选择了保存至Mysql选项,数据库中会保存文章的网页源码,此时如果需要将源码转换成HTML、Markdown ,选择*载下**来源是数据库即可。(微信接口用得多会被限制)
