轻松爬取清纯小姐姐私房照!小孩子别学

图片[1]-轻松爬取清纯小姐姐私房照!小孩子别学-零度博客

先上效果图

图片[2]-轻松爬取清纯小姐姐私房照!小孩子别学-零度博客

import re
import requests
import os

 

头文件:

因为爬虫需要用到请求网络部分,所以需要这两个包,没有的话自行下载即可。这个可以直接用pip安装。如果连pip都不懂,那就只能学习一下python基础了。

请求头:

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, l

 

完整的请求:

url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=='+name+'+&pn='+str(i*30)
result = requests.get(url,headers=headers)
dowmloadPic(result.content.decode(), name)

 

正则表达式:

 

pic_url = re.findall('"objURL":"(.*?)",',html,re.S)

 

 

下载图片:

fp = open(dir, 'wb')
fp.write(pic.content)
fp.close()

 

完整代码:

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re
import requests
import os


def dowmloadPic(html, keyword,i):
    pic_url = re.findall('"objURL":"(.*?)",',html,re.S)
   
    abc=i*60
    print('找到关键词:' + keyword + '的图片,现在开始下载图片...')
    for each in pic_url:
        print('正在下载第' + str(abc) + '张图片,图片地址:' + str(each))
        try:
            pic = requests.get(each, timeout=10)
        except requests.exceptions.ConnectionError:
            print('【错误】当前图片无法下载')
            continue

        dir = r'D:\image\i' + keyword + '_' + str(abc) + '.jpg'
        if not os.path.exists('D:\image'):
            os.makedirs('D:\image')
        
        fp = open(dir, 'wb')
        fp.write(pic.content)
        fp.close()
        abc += 1


if __name__ == '__main__':
    #word = input("Input key word: ")
    headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36'}
    name = "清纯妹子私房照"
    num = 0
    x =1

    for i in range(int(x)):
        url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word='+name+'+&pn='+str(i*30)
        print(url)
        result = requests.get(url,headers=headers)
        dowmloadPic(result.content, name,1)
print("下载完成")

 

 

 

我从没有这么渴望过知识,第一次感受到知识的力量!!!

 

图片[3]-轻松爬取清纯小姐姐私房照!小孩子别学-零度博客

THE END
喜欢就支持一下吧
点赞2177 分享
相关推荐
纯净安装!Windows 11 Build 22533 预览版 ISO 官方镜像下载-零度博客

纯净安装!Windows 11 Build 22533 预览版 ISO 官方镜像下载

  1 月 15 日消息,微软近期发布了最新的 Windows 11 Dev 预览版 22533 更新,带来了全新音量 / 亮度弹出式 UI,时钟和闹钟 App 可卸载,另外还有多项 Bug 修复。 微软还发布了 Windows 1...
admin的头像-零度博客admin
1.5W+2251
6个非常值得推荐的免费网站!AI换脸、图片去背、人声分离等多种超实用的功能!-零度博客

6个非常值得推荐的免费网站!AI换脸、图片去背、人声分离等多种超实用的功能!

  1.AI Face Swapper 换脸 【点击进入】 2.图片在线去背 【点击进入】 3.人声背景音乐分离 【点击进入】、 【Chrome听音识曲插件】 4.DeepAI 图片色彩修复 【点击进入】 5.多人贪吃蛇 【点...
admin的头像-零度博客admin
1.9W+2250
如何找到 Windows 10 桌面上我的電腦-零度博客

如何找到 Windows 10 桌面上我的電腦

要開啟這個設定其實不難!我们只要在桌面上右鍵點選個人化就可以進行調整, 可以把資源回收桶、控制台、使用者文件、網路呼叫出來,當然也可以全部再關閉不顯示, 接下來就讓我們看看如何找回你...
币圈震荡!59亿元比特币流出,大陆用户被清退,该如何快速安全提现? | 零度解说-零度博客
Chrome 限制广告拦截扩展的“Manifest V3”计划被推迟-零度博客

Chrome 限制广告拦截扩展的“Manifest V3”计划被推迟

Manifest V3 转换再次延迟,让各地的 Chrome 用户松了一口气。 几年来,谷歌一直想取消 Chrome 当前的扩展系统,转而支持一个更有限的扩展系统,对过滤阻止广告和/或保护用户隐私的扩展程序设置...
admin的头像-零度博客admin
1.7W+1091
Nvidia英伟达和AMD显卡的官方设置软件-零度博客

Nvidia英伟达和AMD显卡的官方设置软件

  1.Nvidia英伟达:https://www.nvidia.com/Download/index.aspx?lang=cn 2.AMD显卡:https://www.amd.com/zh-hans/support   注意:请根据自己的显卡型号下载对应的版本!
价值 2 亿美元的 BitMart 加密货币交易所的受害者仍在等待取回他们的钱-零度博客

价值 2 亿美元的 BitMart 加密货币交易所的受害者仍在等待取回他们的钱

Cryptocurrency交换BitMart答应全额报销的平台范围内的2亿$黑客的受害者,但一些用户仍然没有得到他们的钱,根据从报表CNBC。12 月 4 日,黑客在使用被盗的隐私密钥访问 BitMart 的一个热钱包(...
admin的头像-零度博客admin
1.5W+2251
2021年最值得推荐的五款免费精品软件-零度博客

2021年最值得推荐的五款免费精品软件

https://youtu.be/95vdNVQDaTk 火绒安全:https://www.huorong.cn/person5.html Recuva:https://www.ccleaner.com/recuva PotPlayer:https://potplayer.daum.net/ BleachBit:https://www.ble...
10个被隐藏的Chrome高级功能!探索谷歌浏览器更多的潜力-零度博客