日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python批量獲取文本中的郵箱,并寫入文件增強(qiáng)版,全匹配版

系統(tǒng) 1874 0

百度貼吧爬蟲之獲取郵箱系列之增強(qiáng)版,應(yīng)該是 任意郵箱了

  • 功能:獲取文本中的郵箱
  • 上個(gè)基礎(chǔ)版支持的不大好,對(duì)有些郵箱不支持,還有些其他問題
  1. 讀文本,且獲取文本中的各種電子郵箱
  2. 對(duì)獲得的郵箱去重
  3. 每個(gè)郵箱獨(dú)占一行
  4. 寫入新的文件
            
              # coding:utf-8
"""
Name : email.py
Author  : GS
Contect : 2903344135@qq.com
Time    : 2019/7/8 20:23
Desc:
"""
import  re

f = open('test.txt', 'r',encoding='utf-8')#讀取文件
strings=f.read()#獲取文件內(nèi)容,到內(nèi)存
f.close()#讀關(guān)閉
matches = []

emailRegex = re.compile(r'''(
    [a-zA-Z0-9._%+-]+      # username
    @                      # @ symbol
    [a-zA-Z0-9.-]+         # domain name
    (\.[a-zA-Z]{2,4}){1,2} # dot-something
    )''', re.VERBOSE)
for groups in emailRegex.findall(strings):
    matches.append(groups[0])

f1 = open('test1.txt','a',encoding='utf-8')#打開新的文件

list2 = list(set(matches))#去重
# print(list2)
list_nums = len(list2)#列表的數(shù)量,長度

#循環(huán)寫入文件,并換行
for line in range(list_nums):

    f1.writelines(list2[line]+"\n")
#關(guān)閉流
f1.close()
            
          

原始文本文件text.txt:

python批量獲取文本中的郵箱,并寫入文件增強(qiáng)版,全匹配版_第1張圖片

?

執(zhí)行完程序之后的樣子:test1.txt

python批量獲取文本中的郵箱,并寫入文件增強(qiáng)版,全匹配版_第2張圖片

?

從實(shí)現(xiàn)功能上講,對(duì)我所知道的郵箱都是完美提取,完美去重,但是代碼有待進(jìn)一步優(yōu)化。

覺得有用的話,加我可交流

?


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 万源市| 湘潭县| 应用必备| 蒙城县| 甘肃省| 天长市| 武穴市| 涿鹿县| 永丰县| 巩义市| 新乡县| 辽中县| 旅游| 临武县| 昌邑市| 扎兰屯市| 扎赉特旗| 南陵县| 育儿| 四会市| 积石山| 德安县| 阿勒泰市| 田阳县| 华池县| 龙井市| 民丰县| 曲周县| 黄浦区| 曲阜市| 涿鹿县| 澎湖县| 交城县| 金山区| 西吉县| 东光县| 金沙县| 汉阴县| 山东省| 集贤县| 离岛区|