日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python之爬取郵箱電話

系統 1910 0

這里使用requests庫爬取網頁要比urllib庫方便
用finditer查詢

            
              import requests
import re
url='https://www.flyai.com/' # 帶爬取的網頁
html=requests.get(url).text  # text為轉化為str數據
pat='(\w+@\w+.com)|(\d{11})' # 正則模式
res=re.finditer(pat,html)    # finditer返回的是一個迭代器
for i in res:                # i 是一個Match對象
   print(i.group())          #  group()為輸出所有組

            
          

python之爬取郵箱電話_第1張圖片 用findall查詢

            
              import requests
import re
url='https://www.flyai.com/'
html=requests.get(url).text
pat='(?:[a-zA-Z_-]+@[a-zA-Z_-]+.com)|(?:\d{11})' 
res=re.findall(pat,html)   # 返回的結果在一個列表中
print(res)

            
          

python之爬取郵箱電話_第2張圖片

            
              import requests
import re
url='https://www.sina.com.cn/'
html=requests.get(url).text
pat='[a-zA-Z_-]+@[a-zA-Z_-]+.\w*'
res=set(re.findall(pat,html))
print(res)

            
          

python之爬取郵箱電話_第3張圖片


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 南岸区| 黔江区| 甘谷县| 漯河市| 南宫市| 齐齐哈尔市| 新宾| 右玉县| 三江| 三台县| 淳安县| 齐齐哈尔市| 昌乐县| 呼和浩特市| 梓潼县| 历史| 崇阳县| 抚顺县| 德格县| 象山县| 烟台市| 宣恩县| 衡阳市| 工布江达县| 菏泽市| 富源县| 葵青区| 同江市| 龙岩市| 丹巴县| 藁城市| 河北省| 尉犁县| 和田市| 承德市| 班玛县| 广南县| 乌拉特后旗| 永和县| 博乐市| 红安县|