宇宙主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

欧基零壹微头条IP归属甄别会员请立即修改密码
查看: 1467|回复: 10

[疑问] 通用图片爬虫

[复制链接]
发表于 2021-10-28 16:41:21 | 显示全部楼层 |阅读模式
本帖最后由 qianmianyao 于 2021-10-28 16:55 编辑

虽然可以前面发了几个爬全站的脚本,但是我觉得资源在精不在多,故而打算完成一个通用的套图爬虫,适配多个站点,可以一套一套的下载,而非爬取全站
由于每个站的规则不一样,需要我来写规则,大家可以提供站
站的要求:最好是一个单页面很多图的
目前适配的站点
https://telegra.ph/
https://girlofthehour.com/
https://everia.club/
有想要的站可以评论提交
本地网络有点问题,明天推送到github
站点可以在帖子里提交或者github的issues
python 开发,支持异步下载
github:https://github.com/qianmianyao/SimpleCrawler/issues
发表于 2021-10-28 16:48:49 | 显示全部楼层
先MARK
发表于 2021-10-28 16:46:27 | 显示全部楼层
快进到免费放饭环节
发表于 2021-10-28 16:47:51 | 显示全部楼层
套图的精髓是,无水印原图,成套系列
这种站很赚钱
发表于 2021-10-28 16:47:53 | 显示全部楼层
感谢分享。大概方法是不是检测到图片格式的链接就加入到get
发表于 2021-10-28 16:49:09 | 显示全部楼层
其实写个平台更好,类似蓝天采集器那样
发表于 2021-10-28 17:32:28 | 显示全部楼层
希望大佬搞个小草1024的爬虫,目前市面的都不太好用。
发表于 2021-10-28 17:44:11 | 显示全部楼层
怎么爬目录啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|宇宙主机交流论坛

GMT+8, 2024-10-30 17:28 , Processed in 0.063507 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表