本文由 资源共享网 – ziyuan 发布,转载请注明出处,如有问题请联系我们!可视化采集工具源码(python)附成品和论文
开发语言: python
数据库 : mysql
资源语言: 中文
主要特色:
跨平台:软件可以在Windows,MacOS和Linux上运行。
简单快速:图形化的设置和执行爬虫任务,通常一个爬虫任务只需要2-5分钟即可设计完成。
安全:不需要注册,所有任务和数据均保存在本地,不经过任何第三方服务器。
灵活:可任意添加浏览器插件,执行JavaScript指令,使用Selenium语句直接操纵浏览器。
并行多开:可开启任意数量的执行程序,实现大规模数据的并行采集。
验证码识别:支持多种验证码识别方案,如图形验证码,reCAPTCHA验证码等。
元素截图和OCR识别:支持元素截图和OCR识别,以及图片下载。
代理IP:支持切换隧道IP,私有IP等。
局域网使用:支持在没有互联网的局域网内使用。
外部程序调用:可以任意调用系统外部程序,从而问完成任意复杂的需求。
API调用:可以通过API调用执行任务,实现高级的自动化采集。
定时执行:支持定时执行任务,成为贴心生活小助手。
暂停运行:随时暂停任务执行以便手工调试页面和输入验证码。
Python环境自定义:可任意修改执行时的Python环境,如可自定义变量,并将变量值写入任意代码语句。
移动端模拟:支持模拟手机端设备,实现手机网页采集。
灵活导入:支持读取Excel文件以导入大批量输入参数。
自由导出:可导出为Excel/CSV/TXT文件,支持写入MySQL数据库。
任务迁移:任务可任意复制和迁移到其他机器,无视操作系统环境。
页面滚动:可以设置页面滚动来获取需要滚动加载的内容。
IFRAME支持:支持采集在iframe标签内的数据。
Cookies修改:可获取和修改页面Cookies值。
命令行执行:直接以命令行的方式执行任务,无缝嵌入到其他程序中。
无头模式:支持无头模式,可在后台运行,不会弹出浏览器窗口。
正则表达式:支持正则表达式,可在任意位置使用正则表达式。
修改网页内容:可修改网页内容,实现更加精密的采集需求定制。
代码调试:软件包自带执行源码,可用Python直接运行和调试代码。
JSON支持:支持JSON格式的数据采集。
实用工具资源(可视化采集工具源码(python)附成品和论文)网址:https://www.08i8.com/ttkfzy/detail84103.html;转载请注明!
与《可视化采集工具源码(python)附成品和论文》相关的《完整源码》
抖音辅助工具源码(批量下载+获取直播推流地址+采集评论+采集账号详细数据)附成品
批量下载抖音账号发布、喜欢、收藏作品; 批量下载 TikTok 账号主页作品;下载抖音链接或 TikTok 链接作品;获取抖音直播推流地址;下载抖音 直播视频;采集抖音作品评论数据;批量下载抖音合集作品;采集抖音账号详细数据;采集抖音用户 / 作 品 / 直播搜索结果;采集抖音热榜数据。
10 3761 0
SEO静态页面采集生成系统源码
手动导入数据库文件:sql.sql修改:config.php数据库信息后台目录:域名/admin后台账号:admin后台密码:123456运行环境:PHP7.0以上伪静态后台有给出规则,自行设置一下伪静态即可。后台带多套模板,有能力的可以自己添加
5 100420 0
全网热搜热门榜内容采集系统聚合源码(python)
目前程序包含以下(排行榜、热帖、精选)【注:部分己失效】知乎热榜、微博热点排行榜、贴吧热度榜单、V2EX热帖、豆瓣讨论精选、天涯热帖、抽屉新热榜、虎嗅网资讯、煎蛋网、知乎日报、黑客派-好玩、猫扑热帖、果壳-科学人、IT之家、央视要闻、cnBeta、联合早报-中港台、微信公众号热门文章、澎湃新闻、纽约时报中文网-国际简报、新京报-排行、奇客的资讯、新浪科技、全球主机交流论坛、什么值得买-今日热门文章...
5 35968 0
本地化批量图像识别系统源码(Python+VGG+DBN+深度学习+Tensorflow框架)
资源包含:Python源码、演示视频、演示图片1. 项目以VGGNet和深度置信网络(DBN)为基础,对本地化的图像识别,对识别结果进行标签,实现了应用场景的多样化2.项目运行环境:Python 3.6环境、Tensorflow 环境、wxPython 环境和 PIL 环境4.项目包括 4 个模块:数据预处理、模型简化处理、用户界面设计、翻译模块调用。项目选择 ImageNet 数据集中的一部分作...
20 18801 0
微信朋友圈信息导出工具源码(python)附成品
可以导出微信朋友圈信息为HTML(可全导出也可以选单个联系人导出)核心功能导出微信朋友圈数据为HTML可以下载图片/视频离线查看,永久保存可以根据联系人,朋友圈时间进行过滤导出强依赖微信Windows客户端,只提供windows版本只测试过Win10/Win11软件只能导出在电脑微信浏览过的朋友圈记录
50 2868 0
文件快递柜中转站系统源码(python)
主要特色- [x] 轻量简洁:Fastapi+Sqlite3+Vue2+ElementUI- [x] 轻松上传:复制粘贴,拖拽选择- [x] 多种类型:文本,文件- [x] 防止爆破:错误次数限制- [x] 防止滥用:IP限制上传次数- [x] 口令分享:随机口令,存取文件,自定义次数以及有效期- [x] 匿名分享:无需注册,无需登录- [x] 管理面板:查看所有文件,删除文件- [x] 一键部署...
5 60060 0