日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python 下載小說

系統(tǒng) 1722 0

使用beautifulsoup 爬取小說,并整合到txt中。

            
              """
======================
@Auther:CacheYu
@Time:2019/9/16:16:09
======================
"""
# -*- coding:utf-8 -*-
import urllib.request
import urllib.error
import bs4
from bs4 import BeautifulSoup

def readdown(url):
    soup = BeautifulSoup(urllib.request.urlopen(url), 'html.parser')
    fixed_html = soup.prettify()
    table = soup.find('table', attrs={'id': 'tabletxt'})
    # # if isinstance(table, bs4.element.Tag):
    # tds = table.find_all('td')
    i = table.find('i').string
    print(i)
    div = table.find_all('div', attrs={'class': 'txt'})
    content = div[0].get_text().strip()
    couple = i + '\n' + content
    return couple

page_url = 'https://www.dushiyanqing.net/book/90/90659/index.html'
book = r'E:\story\誰把風(fēng)聲聽成離別歌.txt'

soup = BeautifulSoup(urllib.request.urlopen(page_url), 'html.parser')
fixed_html = soup.prettify()

table = soup.find('table')
if isinstance(table, bs4.element.Tag):
    tds = table.find_all('td', attrs={'class': 'k4'})
    default_encode = 'utf-8'

    print('開始寫入,請(qǐng)稍等……')
    with open(book, 'r+', encoding=default_encode) as target_file_writer:
        for td in tds:
            a = td.find('a')
            if a is not None:
                 + a.get('href')
                # print(href)
                target_file_writer.write(readdown(href))
                # time.sleep(random.randint(5, 10))
    print('已完成!\n目錄地址為:', book)
            
          

?


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 望谟县| 班玛县| 松溪县| 江川县| 宜兰县| 青岛市| 黄冈市| 策勒县| 乌拉特后旗| 曲周县| 长子县| 榆林市| 石嘴山市| 宕昌县| 天柱县| 建宁县| 凤山市| 长葛市| 睢宁县| 江安县| 扎兰屯市| 芒康县| 正镶白旗| 盱眙县| 自贡市| 黑山县| 洛阳市| 吐鲁番市| 奉新县| 三门峡市| 荃湾区| 右玉县| 巴中市| 合山市| 泸州市| 华安县| 明水县| 平湖市| 行唐县| 青海省| 宁陵县|