application->cookie里面找到登錄以后的cookie信息將他寫到你的瀏覽器里面就可以了!importioimportsys#改變標(biāo)準(zhǔn)輸出的默認(rèn)編碼(改變中文輸出的亂碼問題)sys.stdout=io.TextIOWrapper(sys." />

日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

cookie 的尋找和使用以及頁面滾動(python+selenium)

系統(tǒng) 2245 0

cookie:

本文以登錄的自己的 知乎 為例,找到當(dāng)前的cookie信息,然后讓瀏覽器帶著自己的cookie信息去訪問 網(wǎng)址:知乎

在goole瀏覽器下面 Ctrl+shift+J? (F12)打開console工作臺->application->cookie里面找到登錄以后的cookie信息 將他寫到你的瀏覽器里面就可以了!

cookie 的尋找和使用以及頁面滾動(python+selenium)_第1張圖片

?

?

            
              import
            
            
               io

            
            
              import
            
            
               sys

            
            
              #
            
            
              改變標(biāo)準(zhǔn)輸出的默認(rèn)編碼(改變中文輸出的亂碼問題)
            
            
sys.stdout=io.TextIOWrapper(sys.stdout.buffer,encoding=
            
              '
            
            
              utf8
            
            
              '
            
            
              )


            
            
              #
            
            
              導(dǎo)入selenium的瀏覽器驅(qū)動接口
            
            
              from
            
             selenium 
            
              import
            
            
               webdriver

            
            
              from
            
             time 
            
              import
            
            
               sleep
driver 
            
            = webdriver.Chrome(
            
              "
            
            
              C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe
            
            
              "
            
            
              )
 
            
            
              #
            
            
               加載知乎主頁,查看快照知此時處于未登錄狀態(tài)
            
            
driver.get(
            
              "
            
            
              https://www.zhihu.com
            
            
              "
            
            
              )
sleep(
            
            1
            
              )

            
            
              print
            
            (driver.save_screenshot(
            
              "
            
            
              zhihu_nocookies.png
            
            
              "
            
            
              ))

    
            
            
              #
            
            
               操作瀏覽器登錄知乎并抓包c(diǎn)ookies
            
            
zhihu_cookies =
            
               {
        
            
            
              #
            
            
              第一個cookie信息不要,注釋掉
            
            
              #
            
            
              '_xsrf':'    4Aehy9uAVpUQwh63ft2lgIFMZSwlqGs7',            
            
            
              '
            
            
              _zap
            
            
              '
            
            :    
            
              '
            
            
              047801d6-2a5c-490d-89eb-14c27fed8f63
            
            
              '
            
            
                  ,        
     
            
            
              '
            
            
              capsion_ticket
            
            
              '
            
                :
            
              "
            
            
              2|1:0|10:1568897272|14:capsion_ticket|44:NDA4MmQwZjI1MGVmNGI2OGIwMzdjODViYTdmZDhjMWI=|b491fbdbb7c4a73a344512fabd38111217ff6846d10c831a266fd0a0119856a2
            
            
              "
            
            
                  ,
     
            
            
              '
            
            
              d_c0
            
            
              '
            
            :    
            
              "
            
            
              ANCi2eDKEw-PTp0vSECsR7vX7XcdN1VL5b4=|1551806289
            
            
              "
            
            
                  ,            
     
            
            
              '
            
            
              q_c1
            
            
              '
            
            :    
            
              '
            
            
              ee90e06b16e049d2b6395ae23eb3328d|1551806291000|1551806291000
            
            
              '
            
            
              ,
     
            
            
              '
            
            
              tgw_l7_route
            
            
              '
            
            :    
            
              '
            
            
              060f637cd101836814f6c53316f73463
            
            
              '
            
            
              ,            
     
            
            
              '
            
            
              tgw_l7_route
            
            
              '
            
            :    
            
              '
            
            
              18884ea8e9aef06cacc0556da5cb4bf1
            
            
              '
            
            
              ,                
     
            
            
              '
            
            
              tgw_l7_route
            
            
              '
            
            :    
            
              '
            
            
              060f637cd101836814f6c53316f73463
            
            
              '
            
            
              ,                
     
            
            
              '
            
            
              tst
            
            
              '
            
            :    
            
              '
            
            
              r
            
            
              '
            
            
                  ,                
     
            
            
              '
            
            
              z_c0
            
            
              '
            
            :    
            
              "
            
            
              2|1:0|10:1568897286|4:z_c0|92:Mi4xemNkekNRQUFBQUFBMEtMWjRNb1REeVlBQUFCZ0FsVk5Cc2R3WGdBalhkbVNieHZUY3dLMTA0RlFHVFBiNjh5RjFR|c90ecb48ce8d612f537305315f543bcdf43d0ad588d28618896faacd085f11fd
            
            
              "
            
            
                  ,

    }

    
            
            
              #
            
            
               將用戶登錄產(chǎn)生的cookies全部添加到當(dāng)前會話
            
            
              for
            
             k, v 
            
              in
            
            
               zhihu_cookies.items():
        driver.add_cookie({
            
            
              '
            
            
              domain
            
            
              '
            
            : 
            
              '
            
            
              .zhihu.com
            
            
              '
            
            , 
            
              '
            
            
              name
            
            
              '
            
            : k, 
            
              '
            
            
              value
            
            
              '
            
            
              : v})

    
            
            
              #
            
            
               再次訪問知乎主頁并拍照,此時已經(jīng)是登錄狀態(tài)了
            
            
driver.get(
            
              "
            
            
              https://www.zhihu.com
            
            
              "
            
            
              )
sleep(
            
            3
            
              )

            
            
              print
            
            (driver.save_screenshot(
            
              "
            
            
              zhihu_cookies.png
            
            
              "
            
            
              ))
            
          
#模擬滾動條的滾動(這個用常規(guī)的爬蟲很難實(shí)現(xiàn))

????#?加載知乎主頁
?#?將頁面滾動到最后,執(zhí)行多次
for?i?in?range(3):
????????js?=?"var?q=document.documentElement.scrollTop=10000"
????????driver.execute_script(js)
????????sleep(3)

????#?截圖并退出,頁面?zhèn)冗厺L動條已經(jīng)下滑了許多像素
print(driver.save_screenshot("zhihu_scroll.png"))
            
              #
            
            
               退出瀏覽器
            
            
driver.quit()
          

?


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 凌海市| 元朗区| 炎陵县| 建平县| 永泰县| 绵阳市| 三穗县| 潼关县| 同德县| 项城市| 信丰县| 昭通市| 清丰县| 潼关县| 磐安县| 宝兴县| 奉新县| 四川省| 尼勒克县| 新郑市| 乌兰浩特市| 郎溪县| 九龙县| 永昌县| 闸北区| 巢湖市| 衡东县| 鱼台县| 平顶山市| 旬邑县| 江达县| 中宁县| 子洲县| 襄城县| 五原县| 桦甸市| 甘泉县| 奉贤区| 南溪县| 亳州市| 五家渠市|