色一情一乱一伦一区二区三区,老鸭窝毛片一区二区三区,国产一区福利

百度貼吧爬蟲之獲取郵箱系列之增強(qiáng)版，應(yīng)該是任意郵箱了

功能：獲取文本中的郵箱
上個(gè)基礎(chǔ)版支持的不大好，對(duì)有些郵箱不支持，還有些其他問題

讀文本，且獲取文本中的各種電子郵箱
對(duì)獲得的郵箱去重
每個(gè)郵箱獨(dú)占一行
寫入新的文件

            
              # coding:utf-8
"""
Name : email.py
Author  : GS
Contect : 2903344135@qq.com
Time    : 2019/7/8 20:23
Desc:
"""
import  re

f = open('test.txt', 'r',encoding='utf-8')#讀取文件
strings=f.read()#獲取文件內(nèi)容，到內(nèi)存
f.close()#讀關(guān)閉
matches = []

emailRegex = re.compile(r'''(
    [a-zA-Z0-9._%+-]+      # username
    @                      # @ symbol
    [a-zA-Z0-9.-]+         # domain name
    (\.[a-zA-Z]{2,4}){1,2} # dot-something
    )''', re.VERBOSE)
for groups in emailRegex.findall(strings):
    matches.append(groups[0])

f1 = open('test1.txt','a',encoding='utf-8')#打開新的文件

list2 = list(set(matches))#去重
# print(list2)
list_nums = len(list2)#列表的數(shù)量，長度

#循環(huán)寫入文件，并換行
for line in range(list_nums):

    f1.writelines(list2[line]+"\n")
#關(guān)閉流
f1.close()

原始文本文件text.txt：

執(zhí)行完程序之后的樣子：test1.txt

從實(shí)現(xiàn)功能上講，對(duì)我所知道的郵箱都是完美提取，完美去重，但是代碼有待進(jìn)一步優(yōu)化。

覺得有用的話，加我可交流

更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系： 360901061

您的支持是博主寫作最大的動(dòng)力，如果您喜歡我的文章，感覺我的文章對(duì)您有幫助，請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點(diǎn)擊下面給點(diǎn)支持吧，站長非常感激您！手機(jī)微信長按不能支付解決辦法：請(qǐng)將微信支付二維碼保存到相冊(cè)，切換到微信，然后點(diǎn)擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】元

2元

5元

10元

20元

自定義

日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python批量獲取文本中的郵箱，并寫入文件增強(qiáng)版，全匹配版

百度貼吧爬蟲之獲取郵箱系列之增強(qiáng)版，應(yīng)該是任意郵箱了

原始文本文件text.txt：

執(zhí)行完程序之后的樣子：test1.txt

日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

百度貼吧爬蟲之獲取郵箱系列之增強(qiáng)版，應(yīng)該是 任意郵箱了

原始文本文件text.txt：

執(zhí)行完程序之后的樣子：test1.txt

百度貼吧爬蟲之獲取郵箱系列之增強(qiáng)版，應(yīng)該是任意郵箱了