日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python使用get_text()方法從大段html中提取文本的實例

系統(tǒng) 1967 0

如下所示:

                      

比如這兒有這么一大段帶html的字串,想要從中提取文本,首先發(fā)現(xiàn)這是一個textarea

我們使用beautifulsoup

            
def get_content(url):
 resp = urllib.request.urlopen(url)
 html = resp.read()
 bs = BeautifulSoup(html, "html.parser")
 return bs.textarea.get_text()
          

首先用那段html字符串初始化beautifulsoup對象

然后bs.textarea返回找到的第一個textarea,找到后使用get_text()清空所有html標簽元素

之后就會返回干凈的文字

以上這篇Python使用get_text()方法從大段html中提取文本的實例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 讷河市| 剑阁县| 武宣县| 衡阳市| 吕梁市| 枣强县| 阳东县| 田林县| 马龙县| 报价| 太白县| 布拖县| 和硕县| 舞钢市| 马边| 正安县| 会理县| 孙吴县| 禄丰县| 石楼县| 柞水县| 云和县| 武威市| 红桥区| 萝北县| 临西县| 仁化县| 阿城市| 纳雍县| 武威市| 保山市| 肃北| 紫阳县| 包头市| 洛扎县| 伊通| 娄烦县| 武川县| 平遥县| 邹城市| 苗栗市|