日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python3爬取貓眼電影信息

系統(tǒng) 1918 0

Python3爬取貓眼電影信息

            
              import json
import requests
from requests.exceptions import RequestException
import re
import time

#爬取貓眼電影信息

def get_one_page(url):
		#增加了User-Agent識(shí)別,需要在headers中添加User-Agent參數(shù)。
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36'
        }
        response = requests.get(url, headers=headers)
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None

	#正則提取
def parse_one_page(html):
    pattern = re.compile('
              
.*?board-index.*?>(\d+).*?data-src="(.*?)".*?name"> (.*?) .*?star">(.*?)

.*?releasetime">(.*?)

' + '.*?integer">(.*?).*?fraction">(.*?).*?
', re.S) items = re.findall(pattern, html) #遍歷提取結(jié)果并生成字典 for item in items: yield { 'index': item[0], 'image': item[1], 'title': item[2], 'actor': item[3].strip()[3:], 'time': item[4].strip()[5:], 'score': item[5] + item[6] } #寫入文件 def write_to_file(content): with open('result.txt', 'a', encoding='utf-8') as f: f.write(json.dumps(content, ensure_ascii=False) + '\n') def main(offset): url = 'http://maoyan.com/board/4?offset=' + str(offset) html = get_one_page(url) for item in parse_one_page(html): print(item) write_to_file(item) #分頁(yè)爬取 if __name__ == '__main__': for i in range(10): main(offset=i * 10) #延時(shí)等待 time.sleep(1)

更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!??!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 兰州市| 苏尼特左旗| 天峨县| 龙川县| 军事| 惠东县| 岱山县| 长乐市| 扎囊县| 涞源县| 泾源县| 黄浦区| 新泰市| 仲巴县| 祁东县| 科尔| 扬中市| 宜宾市| 本溪市| 乐陵市| 凤阳县| 靖边县| 张家川| 邹城市| 台中县| 杭锦旗| 惠来县| 云南省| 若尔盖县| 田东县| 巨野县| 顺昌县| 开原市| 沿河| 柞水县| 成武县| 车险| 石渠县| 茶陵县| 花莲县| 和顺县|