之前有人在评论区留言,想让姐姐加一个网站爬虫。但是呢,随便搂了一眼发现是wp的系统,和之前做的页面完全不兼容啊。就没想做,结果好嘛。这两天有人在后台留言了,说感谢提供的网址,然后ta自己写了一个。最重要的是还不共享,这姐姐能忍?叔能忍,婶不能忍啊!!
再然后,姐姐就用了半小时改造了下代码,一个新的爬虫就粗线啦~~~噜噜噜
已经测试功能: 1.整站爬取 2.搜索功能 未测试功能: 分类爬取
参数说明,跟其他的爬虫是一样的哦,姐姐就是这么百搭(主要是真不想从头写)
C:\Users\obaby>F:\Pycharm_Projects\meitulu-spider\dist\taotu.uk.exe **************************************************************************************************** _ _ ____ ___ | |__ __ _| |__ _ _ / __ \ _ __ ___ __ _ _ __ ___ / _ \| '_ \ / _` | '_ \| | | |/ / _` | '_ ` _ \ / _` | '__/ __| | (_) | |_) | (_| | |_) | |_| | | (_| | | | | | | (_| | | \__ \ \___/|_.__/ \__,_|_.__/ \__, |\ \__,_|_| |_| |_|\__,_|_| |___/ |___/ \____/ 套图网爬虫[预览版] 23.07.02 当前服务器地址:https://taotu.uk Blog: http://oba.by 姐姐的上面的域名怎样啊?说不好的不让用!!哼!! **************************************************************************************************** USAGE: spider -h <help> -a <all> -q <search> Arguments: -a <download all site images> -q <query the image with keywords> -h <display help text, just this> Option Arguments: -p <image download path> -r <random index category list> -c <single category url> -e <early stop, work in site crawl mode only> -s <site url eg: https://www.xrmnw.cc (no last backslash "/")> ****************************************************************************************************
文件哈希:
名称: taotu.uk_win_20230702.7z 大小: 15471940 字节 (14 MiB) CRC32: A492DA4E CRC64: 07A719FBD7E8F3DE SHA256: 2a6456d5eeab6f2a9f6b2134ca293dc804fa2650a3852c9d6b81bacdd15d22fb SHA1: c28978445257c9677eff8e5fe43d8b74567f3057 BLAKE2sp: aca78e762fd6594c09c01aac0ddbeb58b2331645aa9fb92691e0a759dd0e0213s
使用方法:
https://h4ck.org.cn/2023/06/%E5%A6%82%E4%BD%95%E8%BF%90%E8%A1%8C%E5%91%BD%E4%BB%A4%E8%A1%8C%E5%B7%A5%E5%85%B7-%E7%A7%91%E6%99%AE%E5%90%91/
下载链接:
网站主题更新,该版本已经无法下载,需要新版本请留言
17 comments
其实我一直不理解,为啥你孜孜不倦的写爬虫,,,我了解的,一般都是干黑产的人,一天到晚的爬这些,然后做网站,赚钱,,,,
我也想赚钱啊,赚不到,哈哈哈。
黑产确实不好做,现在黑产做的都是吃牢饭买卖,打工人受不了这个惊吓。
一条万能律条《非法入侵计算机系统罪》,想怎么定义怎么定义。
另外,黑产这个东西也没什么思路。不好干,果断还是不干了吧。
用不上,就是进来看图的
嗯嗯,看图也是很好哒
大佬这技术是信手拈来啊。
都来踢馆了,这能忍~~必须不能忍啊
程序员茬架也这么有趣~
:-(关键是别说一半啊,写了个爬虫还不发。这就很讨厌呢
不知道为什么,我对这种风格的美女提不起性趣来
最主要的原因可能是太千篇一律了吧,连整形现在都流水线生产了。标准的蛇精脸,所以也正常。现在偶尔瞄一眼国产电视剧,我都分不清谁是谁。
这个网站也好,图片不用分页
嗯嗯,比较简洁。不过说实话,wp的分页机制确实是不大好用。
非常感谢博主的贡献
确实无法下了,要更新才行