全国统计用区划代码和城乡划分代码 2022年数据[爬虫]【Json+CSV格式】

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<noscript>
<h1><strong>Please enable JavaScript and refresh the page.</strong></h1>
</noscript>
<noscript> <h1><strong>Please enable JavaScript and refresh the page.</strong></h1> </noscript>
<noscript>
<h1><strong>Please enable JavaScript and refresh the page.</strong></h1>
</noscript>

Continue Reading

精品美女吧 爬虫【Windows】【23.04.16】

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
精品美女吧 爬虫
Verson: 23.04.16
Blog: http://www.h4ck.org.cn
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search> -e <early stop>
Arguments:
-a <download all site images>
-h <display help text, just this>
Option Arguments:
-p <image download path>
-r <random index category list>
-c <single category url>
-e <early stop, work in site crawl mode only>
-s <site url eg: https://www.jpxgmn.net (no last backslash "/")>
****************************************************************************************************
精品美女吧 爬虫 Verson: 23.04.16 Blog: http://www.h4ck.org.cn **************************************************************************************************** USAGE: spider -h <help> -a <all> -q <search> -e <early stop> Arguments: -a <download all site images> -h <display help text, just this> Option Arguments: -p <image download path> -r <random index category list> -c <single category url> -e <early stop, work in site crawl mode only> -s <site url eg: https://www.jpxgmn.net (no last backslash "/")> ****************************************************************************************************
精品美女吧 爬虫
Verson: 23.04.16
Blog: http://www.h4ck.org.cn
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search> -e <early stop>
Arguments:
         -a <download all site images>
         -h <display help text, just this>
Option Arguments:
         -p <image download path>
         -r <random index category list>
         -c <single category url>
         -e <early stop, work in site crawl mode only>
         -s <site url eg: https://www.jpxgmn.net (no last backslash "/")>
****************************************************************************************************

Continue Reading

requests SSLCertVerificationError

今天运行精品美女吧爬虫的时候出错了。提示证书错误。
Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
Traceback (most recent call last):
File "requests\adapters.py", line 439, in send
File "urllib3\connectionpool.py", line 785, in urlopen
File "urllib3\util\retry.py", line 592, in increment
urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='www.jpmn8.cc', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1124)')))
Traceback (most recent call last): File "requests\adapters.py", line 439, in send File "urllib3\connectionpool.py", line 785, in urlopen File "urllib3\util\retry.py", line 592, in increment urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='www.jpmn8.cc', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1124)')))
Traceback (most recent call last):
  File "requests\adapters.py", line 439, in send
  File "urllib3\connectionpool.py", line 785, in urlopen
  File "urllib3\util\retry.py", line 592, in increment
urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='www.jpmn8.cc', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1124)')))

Continue Reading

爱看美女网爬虫【群辉Docker】【23.03.02】

在群辉下通过pyinstaller编译py文件会出现各种问题。首先是没有binutils,如果要安装这个工具包,需要安装包管理器ipkg。在确定系统处理器架构之后即可安装对应的包管理下,命令如下:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
wget http://ipkg.nslu2-linux.org/feeds/optware/syno-i686/cross/stable/syno-i686-bootstrap_1.2-7_i686.xsh
chmod +x syno-i686-bootstrap_1.2-7_i686.xsh
sh syno-i686-bootstrap_1.2-7_i686.xsh
wget http://ipkg.nslu2-linux.org/feeds/optware/syno-i686/cross/stable/syno-i686-bootstrap_1.2-7_i686.xsh chmod +x syno-i686-bootstrap_1.2-7_i686.xsh sh syno-i686-bootstrap_1.2-7_i686.xsh
wget http://ipkg.nslu2-linux.org/feeds/optware/syno-i686/cross/stable/syno-i686-bootstrap_1.2-7_i686.xsh
chmod +x syno-i686-bootstrap_1.2-7_i686.xsh
sh syno-i686-bootstrap_1.2-7_i686.xsh

安装完成之后即可通过ipkg进行包管理了,

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
ipkg install binutils
ipkg install binutils
ipkg install binutils

Continue Reading

美女图片整理【异常图片】

由于爬虫比较多,有的爬虫在下载的时候没有处理网络问题或者图片本山链接错误导致的图片异常。有的是处理了的,不要问为什么没加异常检测,问就是懒。

下载的图片会出现下面的问题,其实预览的时候就会发下问题了,另外打开这个图片其实会显示404或者502之类的错误页面。所以写了一段处理代码,主要两个功能:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
1.删除小文件,至于多小自己去调整代码
2.如果目录下所有的文件都有问题,删除文件后同时删除目录
1.删除小文件,至于多小自己去调整代码 2.如果目录下所有的文件都有问题,删除文件后同时删除目录
1.删除小文件,至于多小自己去调整代码
2.如果目录下所有的文件都有问题,删除文件后同时删除目录

Continue Reading

m3u8 downloader [23.03.04][Windows]

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
更新记录:
1.修复txt文件url列表格式下载导致的windows下的文件名命名错误
更新记录: 1.修复txt文件url列表格式下载导致的windows下的文件名命名错误
更新记录:
1.修复txt文件url列表格式下载导致的windows下的文件名命名错误
Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
m3u8_downloader.exe
****************************************************************************************************
Verson: 23.03.04
m3u8_downloader -i <input m3u8 link> -o <output file> -p <out put path> -f <input file> -m <ffmpeg path>
Need Arguments:
-i <input m3u8 link>
Option Arguments:
-o <output file> -p <out put path> -f <input file>
-m <ffmpeg path>
ffmpeg:F:\Pycharm_Projects\m3u8_downloader\dist\m3u8_downloader\bin/ffmpeg.exe
Blog: http://www.h4ck.org.cn
Source Code: http://h4ck.org.cn/2020/01/基于ffmpeg的m3u8下载/
****************************************************************************************************
m3u8_downloader.exe **************************************************************************************************** Verson: 23.03.04 m3u8_downloader -i <input m3u8 link> -o <output file> -p <out put path> -f <input file> -m <ffmpeg path> Need Arguments: -i <input m3u8 link> Option Arguments: -o <output file> -p <out put path> -f <input file> -m <ffmpeg path> ffmpeg:F:\Pycharm_Projects\m3u8_downloader\dist\m3u8_downloader\bin/ffmpeg.exe Blog: http://www.h4ck.org.cn Source Code: http://h4ck.org.cn/2020/01/基于ffmpeg的m3u8下载/ ****************************************************************************************************
m3u8_downloader.exe
****************************************************************************************************
Verson: 23.03.04
m3u8_downloader -i <input m3u8 link> -o <output file> -p <out put path> -f <input file> -m <ffmpeg path>
Need Arguments:
         -i <input m3u8 link>
Option Arguments:
         -o <output file> -p <out put path> -f <input file>
         -m <ffmpeg path>
ffmpeg:F:\Pycharm_Projects\m3u8_downloader\dist\m3u8_downloader\bin/ffmpeg.exe
Blog: http://www.h4ck.org.cn
Source Code: http://h4ck.org.cn/2020/01/基于ffmpeg的m3u8下载/
****************************************************************************************************

Continue Reading

爱看美女网爬虫【Windows】【23.03.02】

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
C:\Users\obaby>F:\Pycharm_Projects\sexy_girl_spider\dist\ikmn\ikmn.exe
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search> -e <early stop>
Arguments:
-a <download all site images>
-q <query the image with keywords>
-h <display help text, just this>
Option Arguments:
-p <image download path>
-r <random index category list>
-c <single category url>
-e <early stop, work in site crawl mode only>
-s <site url eg: https://www.ikmn.vip (no last backslash "/")>
****************************************************************************************************
C:\Users\obaby>F:\Pycharm_Projects\sexy_girl_spider\dist\ikmn\ikmn.exe **************************************************************************************************** USAGE: spider -h <help> -a <all> -q <search> -e <early stop> Arguments: -a <download all site images> -q <query the image with keywords> -h <display help text, just this> Option Arguments: -p <image download path> -r <random index category list> -c <single category url> -e <early stop, work in site crawl mode only> -s <site url eg: https://www.ikmn.vip (no last backslash "/")> ****************************************************************************************************
C:\Users\obaby>F:\Pycharm_Projects\sexy_girl_spider\dist\ikmn\ikmn.exe
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search> -e <early stop>
Arguments:
         -a <download all site images>
         -q <query the image with keywords>
         -h <display help text, just this>
Option Arguments:
         -p <image download path>
         -r <random index category list>
         -c <single category url>
         -e <early stop, work in site crawl mode only>
         -s <site url eg: https://www.ikmn.vip (no last backslash "/")>
****************************************************************************************************

Continue Reading

诱惑

生活对于某些人来说从来都不是一成不变,而诱惑也不是无中生有。星星之火可能就形成与那漫不经心的惊恐一撇,这一撇看到了一些让人血脉喷张的事情,也在内心中下了一颗萌动的种子,随时等着破土而出。尼采说过,当你在凝视深渊的时候,深渊也在凝视着你。之前对于这句话并没有太多的感觉,进而对于屠龙少年终成恶龙的论调也不屑一顾。
事情并不是总是那么的波澜不惊,之前对于各种色情内容的认知不过是日本,欧美的av。国产片基本都看不到,也许是因为语言,也许是因为肤色,也许是因为种族的问题。对于发生在欧美国家,日本等的各种小电影并没有什么过多的共情,觉得不过是一部色情影片而已,追求的也仅是感官和生理上的刺激。多年以前去泰国,去按摩的时候还想着能不能遇到人妖小姐姐,事实上并没有,给按摩的是一个大妈,手法很专业。按完了感觉也不错,说不上有什么失望,也说不上有什么惊喜。
前年开始,偶然的机会在一个论坛看到一篇分析福利app的帖子。在这之后,陆陆续续分析了数款福利app。然而并不是只是分析了算法,更深入的还爬取了各个网站的视频,把所有的数据收集到了一起(目前多数app加密算法都变了,数据不再增加)。
为了存这些数据,直接在亚马孙上开了一台服务器。基于这些数据也做了不少数据分析的文章。如果事情到此为止,可能也不会有任何的欲望。在分析完这些数据之后,还观看了无数的视频,也就是在这时候发现,现在国产色情影片的数量和拍摄速度异常惊人。也就是因为这,有无数的男性(从qq性别看)来加我,要麻豆区的视频下载地址。这也是为什么博客右侧用红字标注了不提供麻豆区视频下载,有了这条声明之后基本没有人加我qq来要视频了,整个世界清净了不少。

Continue Reading