当前位置: 源码素材网 » Python教程 » 详情页

Python抓取百度贴吧图片附代码

  •   时间:2018-11-07
  • 概述:采集图片 抓取图片

Python数据采集例子,抓取百度贴吧图片,远程采集贴吧指定ID帖子中所有的JPG格式的文件,本代码只是示例抓取,演示如何获取到图片信息,并不包括下一步的处理(保存或上传)等。

import urllib
import re
def getHtml(url):
    page=urllib.urlopen(url)
    html=page.read()
    return html

def getImg(html):
    #reg=r'src="(.*?\.jpg)" width'
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre=re.compile(reg)
    imglist=re.findall(imgre,html)
    x=0
    for imgurl in  imglist:
        urllib.urlretrieve(imgurl,'%s.jpg' %x)
        x=x+1
html= getHtml('http://tieba.baidu.com/p/3446014758')
print getImg(html)

    相关内容:

    相关声明:

      若“Python抓取百度贴吧图片附代码”有损您的权益,请告之我们删除内容。
      部分文章来源于网络,版权归原作者所有。