国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python爬虫 > 看kindle网站电子书用Python爬取下载

看kindle网站电子书用Python爬取下载

头像

Python

2019-05-31 14:20:038162浏览 · 0收藏 · 0评论

一个下载看kindle(kankindle.com)的所有电子书的python脚本,程序会自动下载首页部分13页的所有电子书,下载到ebook目录下,程序会检测是否下载过。

 

#!/usr/bin/env python
# coding=utf-8
from bs4 import BeautifulSoup
import urllib2
import socket
import re
import unicodedata
import os
from urwid.text_layout import trim_line
def download(url):
    print 'starting download %s' % url
    response=urllib2.urlopen(url,timeout=30)
    html_data=response.read()
    
    soup=BeautifulSoup(html_data)
    print 'start to analayse---------------'
    
    
    title_soup=soup.find_all(class_='yanshi_xiazai')
    name_soup = soup.find_all('h1')
    tag_a = title_soup[0].a.attrs['href']
    tag_name= title_soup[0].a.contents
    link_name = name_soup[0]
    link_name = str(link_name).replace("<h1>","").replace("</h1>","")
    #print tag_name[0]
    #print link_name
    
    
    filename = link_name+".mobi"
    filename = "ebook/"+filename
    print 'filename is :%s' % filename
    
    print "downloading with urllib2 %s" % tag_a
    if os.path.exists(filename):
        print 'already donwload ,ignore'
    else:
        try:
            f = urllib2.urlopen(tag_a,timeout=60)
            data = f.read()
            #print 'the data is %s'% data
            with open(filename, "wb") as code:
                code.write(data)
        except Exception,e:
            print e
def get_all_link(url):
    print 'Starting get all the list'
    response=urllib2.urlopen(url,timeout=30)
    html_data=response.read()
    #print html_data
    
    soup=BeautifulSoup(html_data)
    link_soup = soup.find_all('a')
    #print link_soup
   
    for each_link in link_soup:
        if re.search('view',str(each_link)):
            #print each_link
            print each_link
            print each_link.attrs['href']
            download(each_link.attrs['href'])
if __name__ == '__main__':
    for page in range(1,13):
        url = "http://kankindle.com/simple/page/3"+str(page)
        url = url.strip()
        print url
        get_all_link(url)
关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

妻子的谎言片尾曲| 韩漫免费浸画在线阅读| 张柏芝门户大开照| 美女和帅哥一起努力生产豆浆的视..| 小妹妹爱大棒棒免费观看电视剧一| 白日梦我电视剧| 免费网站在线观看人数在哪省| MV在线观看免费播放历史| 放荡的小峡子2中文字幕| 啵啵影院| 少女与狗2在线观看免费版高清 | 人犬兽人在线观看免费完整版| 欧美片《肉欲进入》| 《诱人的女房东3》| 年轻的母亲2| 风间由美| 榜上佳婿电视剧全集免费观看高清| 局长边摸边吃奶边做爰| 《尼姑春心荡漾》大结局| 成色P31S是国精产品吗| 潮湿的体温2| 国产少女免费观看电视剧大全 | 被两个老头又日又添| 穿真空短裙挤公交会被赶走吗| 《黏糊糊的你》免费观看| 黑丝美女| 女人一旦尝到粗硬的心理| 《特别酒店》免费观看| 77777免费观看电视剧推荐适..| 麻花传剧原创MV免费播放小米车| 小男生趴着扭屁股很舒服怎么回事| 小雪解开乳罩给老杨摸| 老公你好棒啊我好爱你| 妈妈装睡配合孩子阴阳调和| 咬女生小头头视频| 《从上司到妻子》动画结局| 7777777亚洲和欧洲尺码表 | 碎花裙| 妈妈你真棒插曲最后接吻是谁| 《喂奶人妻厨房HD》| 《熟妇的荡欲》HD中字