本文由 资源共享网 – ziyuan 发布,转载请注明出处,如有问题请联系我们!微信公众号文章批量下载工具python源码(附成品)
开发语言: python
数据库 : 其它
资源语言: 中文
背景知识:
爬取微信公众号有三种方法:
第一种:用搜狗微信公众号搜过,这个只能收到前10条;
第二种:用fiddler或手机抓包,从访问链接去获得appmsg_token,发现虽然这个值就在html页面里,但只有抓包的数据里含有效值,直接访问的是空的,而且还有时效性。这样,每次都要抓包获取,就很麻烦。
第三种:就是这种用公众号搜公众号的,虽然速度慢点,但便捷了不少。
程序原理:
通过selenium登录获取token和cookie,再自动爬取和下载
使用前提:
申请一个免费的微信公众号,个人订阅号即可(https://mp.weixin.qq.com)
下载文章文字内容到txt
下载文章图片
保存HTML文件,并将图片链接指向本地
添加按时间范围下载
添加cookie登陆,不成功才selenium浏览器登陆
增加记住密码功能
修复一些问题,如requests卡死
添加按关键词下载
多线程优化下载速度
增加断点续传功能(可能存在bug,欢迎提issue)
拟增加备用公众号功能(暂未完成)
下载PDF格式
其他说明:
爬取间隔太快,容易遇到“访问频繁”或“freq_control”,这时候可以删除cookie.json,再重新运行软件,换个号继续运行;
实用工具资源(微信公众号文章批量下载工具python源码(附成品))网址:https://www.08i8.com/ttkfzy/detail83737.html;转载请注明!
与《微信公众号文章批量下载工具python源码(附成品)》相关的《完整源码》
vb6操作谷歌浏览器源码(WebDriver类附驱动下载地址)
代码演示的功能有:操作浏览器自动打开百度、搜索mp3,获得网页源码,获得网页标题,网页截图,获得cookie。需要找到与自己系统安装的谷歌浏览器版本匹配的驱动资源包括:1、《WebDriver原理及实验》2、《WebDriver命令编程手册(英文版、中文机翻版)》3、打包好的绿色谷歌浏览器4、浏览器的WebDriver驱动地址(chrome、Firefox、edge)提示:firefox57(fi...
5 33584 0
html下载模板克隆工具java源码(一键下载所有隐藏资源css、js、图片、字体)
java开发,附成品可以同时下载多个网页递归下载所有隐藏资源css、js、图片、字体
5 36886 0
直播录制下载软件直播地址获取软件python源码
获取直播源链接的软件,支持获取【斗鱼】【抖音】【B站】的直播源链接,并且支持录制、下载等功能!用法:1、打开【斗鱼】、【抖音】、【B站】复制直播网址或房间ID号2、把网址或房间ID号粘贴到输入框3、点获取
5 76543 0
支付宝微信多域名回调系统源码
主要功能:微信公众号多域名回调功能:微信公众号后台默认只能授权2个网页域名,用本系统突破这个限制,用同一个公众号对接无限多个网站。网站后台支持回调域名白名单的管理,以及登录记录的查看。 微信access_token获取功能:可让本系统作为中控服务器统一获取和刷新access_token,其他业务逻辑站点所使用的access_token均调用当前站点获取,这样可避免各自刷新造成冲突,导致access...
30 6512 0
nodjs实现定时推送功能源码(mssql+企业微信)
nodjs实现链接读取mssql数据通过企业微信群里的机器人定时推送数据
5 32036 0
微信抢红包外挂源码(Android安卓机手APP源码)
只要是将整个核心抢红包的流程编写出来。是一个比较早的抢红包源码,Android原生开发
5 40476 0
微信公众号无限回调系统源码(可运营)
目前支持对接易支付,支持用户自助充值,自助购买授权,支持自助更换授权,支持自助续费授权测试环境:Nginx 1.20.2 MySQL 5.6.50 PHP-7.2 1.创建站点2.到根目录上传源码3.创建数据库并导入4.修改数据库信息 根目录/config.php 第5,6,7行5.后台地址域名/admin 账号admin 密码1234566.修改域名 根目录下 api.php 第二行域名改为...
5 56867 0