日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python aiohttp 客戶(hù)端使用方法 加快爬蟲(chóng)速度

系統(tǒng) 2132 0

python aiohttp 客戶(hù)端使用方法 加快爬蟲(chóng)速度_第1張圖片

介紹

aiohttp是python的一個(gè)異步網(wǎng)絡(luò)模塊,包含客戶(hù)端和服務(wù)端模塊。
相比requests模塊,除了是異步寫(xiě)法外,大同小異,其速度比requests模塊快。
python的多線程有全局解釋器鎖(GIL),使用多線程實(shí)際上同一時(shí)刻僅有一個(gè)線程在執(zhí)行,使用協(xié)程的相對(duì)比較快,可以再配合多進(jìn)程使用。

基本用法

安裝

使用pip命令安裝即可。 pip install aiohttp

發(fā)起請(qǐng)求

aiohttp 模塊需要配合python 自帶的 asyncio 模塊使用,以下代碼為發(fā)起客戶(hù)端發(fā)起一個(gè)get請(qǐng)求。

            
              # _*_ coding:utf8_*_
import asyncio
import aiohttp


async def fetch(session, url):
    """
    獲取網(wǎng)頁(yè)html代碼
    :param session:
    :param url:
    :return:
    """
    async with session.get(url) as response:
        return await response.text()


async def main():
    """
    :return:
    """
    async with aiohttp.ClientSession() as session:
        html = await fetch(session, "http://blog.fenlanli.com")
        print(html)


if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    loop.run_until_complete(main())

            
          

其他http請(qǐng)求方法均有提供方便使用的函數(shù):

            
                  url = ""
    session.put(url, data='data')
    session.delete(url)
    session.head(url)
    session.patch(url, data='data')
    session.post(url, data='data')

            
          

還提供了一個(gè)request函數(shù),可以動(dòng)態(tài)的選擇請(qǐng)求方式。

            
              session.request('get', url, data={'key': 'val'})

            
          

參數(shù)傳遞

get方法

跟requests模塊中的GET請(qǐng)求傳參數(shù)是一樣的。

            
                  params = {'key': 'value'}
    async with session.get(url, params=params) as response:
        return await response.text()

            
          

post方法

提交文本數(shù)據(jù):

            
              async def post_data(session, url):
    """
    提交數(shù)據(jù)
    :param session:
    :param url:
    :return:
    """
    data = 'data'
    async with session.post(url, data=data) as response:
        return await response.text()

            
          

提交json數(shù)據(jù):

            
              async def fetch(session, url):
    """
    提交數(shù)據(jù)
    :param session:
    :param url:
    :return:
    """
    data = {'key': 'val'}
    async with session.post(url, json=data) as response:
        return await response.text()

            
          

獲取返回值

一般常用的是獲取文本內(nèi)容或者json數(shù)據(jù)。
獲取文本數(shù)據(jù):

            
              async with session.post(url, json=data) as response:
       return await response.json()

            
          

獲取json數(shù)據(jù):

            
              async with session.post(url, json=data) as response:
       return await response.json()

            
          

自定義請(qǐng)求頭

設(shè)置session的cookies參數(shù)即可:

            
              async def fetch(session, url):
    """
    提交數(shù)據(jù)
    :param session:
    :param url:
    :return:
    """
    headers = {
        'User-Agent': 'User-Agent'
    }
    async with session.get(url, headers=headers) as response:
        return await response.text()

            
          

設(shè)置cookies

設(shè)置session的參數(shù)cookies即可:

            
              async def fetch(session, url):
    """
    提交數(shù)據(jù)
    :param session:
    :param url:
    :return:
    """
    cookies = {'cookies_are': 'working'}
    async with session.get(url, cookies=cookies) as response:
        return await response.text()

            
          

使用代理

設(shè)置session的參數(shù)proxy即可:

            
              async def fetch(session, url):
    """
    提交數(shù)據(jù)
    :param session:
    :param url:
    :return:
    """
    proxy = "http://my.proxy.cn"
    async with aiohttp.ClientSession() as session:
        async with session.get(url, proxy=proxy) as resp:
            print(resp.status)


            
          

至此,對(duì)于普通網(wǎng)站的爬蟲(chóng)基本夠用了。

個(gè)人博客


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 农安县| 宣威市| 宁国市| 工布江达县| 仁化县| 美姑县| 慈溪市| 堆龙德庆县| 绵阳市| 自治县| 黎城县| 保定市| 通海县| 五家渠市| 班戈县| 通化市| 江陵县| 金塔县| 青州市| 台北县| 龙南县| 利川市| 博客| 徐州市| 丹阳市| 承德县| 麻城市| 高青县| 淮安市| 页游| 永年县| 酒泉市| 竹溪县| 广宗县| 威信县| 抚松县| 普兰县| 成武县| 龙江县| 隆林| 新野县|