日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python爬蟲學習之獲取指定網頁源碼

系統 1868 0

本文實例為大家分享了Python獲取指定網頁源碼的具體代碼,供大家參考,具體內容如下

1、任務簡介

前段時間一直在學習Python基礎知識,故未更新博客,近段時間學習了一些關于爬蟲的知識,我會分為多篇博客對所學知識進行更新,今天分享的是獲取指定網頁源碼的方法,只有將網頁源碼抓取下來才能從中提取我們需要的數據。

2、任務代碼

Python獲取指定網頁源碼的方法較為簡單,我在Java中使用了38行代碼才獲取了網頁源碼(大概是學藝不精),而Python中只用了6行就達到了效果。

Python中獲取網頁源碼最簡單的方法就是使用urllib包,具體代碼如下:

            
import urllib.request    #導入urllib.request庫
b = str(input("請輸入:"))  #提示用戶輸入信息,并強制類型轉換為字符串型
a = urllib.request.urlopen(b)#打開指定網址
html = a.read()       #讀取網頁源碼
html = html.decode("utf-8") #解碼為unicode碼
print(html)         #打印網頁源碼
          

我輸入的網址是我博客主頁的網址 https://blog.csdn.net/lsylsy726

運行結果如下:

Python爬蟲學習之獲取指定網頁源碼_第1張圖片

3、總結

這篇博客介紹的方法較為簡單,其實有的網站會“反爬蟲”,這時就需要我們使用User-Agent或者代理,這些東西都會在后面的博客中進行更新,我預計在后面博客中更新“讀取CSDN博客訪問量的小程序”和“有道翻譯小程序”及其他更難一些的知識,由于剛開始學習爬蟲,水平有限,請大家多多包涵。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 黔西县| 新丰县| 佛冈县| 南平市| 竹溪县| 孝昌县| 醴陵市| 堆龙德庆县| 新干县| 中宁县| 宜兰市| 苏尼特左旗| 孝昌县| 五河县| 临沧市| 富宁县| 霸州市| 东城区| 文安县| 丽江市| 奉贤区| 库尔勒市| 紫阳县| 壶关县| 来安县| 黄大仙区| 大足县| 凭祥市| 长宁区| 崇仁县| 平南县| 双城市| 醴陵市| 漳平市| 四川省| 长阳| 甘肃省| 赤水市| 碌曲县| 岳西县| 北京市|