日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python常用內(nèi)置模塊之xml模塊(詳解)

系統(tǒng) 1697 0

xml即可擴展標記語言,它可以用來標記數(shù)據(jù)、定義數(shù)據(jù)類型,是一種允許用戶對自己的標記語言進行定義的源語言。從結(jié)構(gòu)上,很像HTML超文本標記語言。但他們被設計的目的是不同的,超文本標記語言被設計用來顯示數(shù)據(jù),其焦點是數(shù)據(jù)的外觀。它被設計用來傳輸和存儲數(shù)據(jù),其焦點是數(shù)據(jù)的內(nèi)容。那么Python是如何處理XML語言文件的呢?下面一起來看看Python常用內(nèi)置模塊之xml模塊吧。

本文主要學習的ElementTree是python的XML處理模塊,它提供了一個輕量級的對象模型。在使用ElementTree模塊時,需要import xml.etree.ElementTree的操作。ElementTree表示整個XML節(jié)點樹,而Element表示節(jié)點數(shù)中的一個單獨的節(jié)點。

構(gòu)建XML文件

ElementTree(tag),其中tag表示根節(jié)點,初始化一個ElementTree對象。

Element(tag, attrib={}, **extra)函數(shù)用來構(gòu)造XML的一個根節(jié)點,其中tag表示根節(jié)點的名稱,attrib是一個可選項,表示節(jié)點的屬性。

SubElement(parent, tag, attrib={}, **extra)用來構(gòu)造一個已經(jīng)存在的節(jié)點的子節(jié)點 Element.text和SubElement.text表示element對象的額外的內(nèi)容屬性,Element.tag和Element.attrib分別表示element對象的標簽和屬性。

ElementTree.write(file, encoding='us-ascii', xml_declaration=None, default_namespace=None, method='xml'),函數(shù)新建一個XML文件,并且將節(jié)點數(shù)數(shù)據(jù)寫入XML文件中。

下面以新建一個網(wǎng)站的sitemap.xml文件為例進行代碼示例

            
#!/usr/bin/env python
# -*- coding:utf-8 -*-
from xml.etree import ElementTree as ET
def build_sitemap():
  urlset = ET.Element("urlset")  #設置一個根節(jié)點,標簽為urlset
  url = ET.SubElement(urlset,"url")  #在根節(jié)點urlset下建立子節(jié)點
  loc = ET.SubElement(url,"loc")
  loc.text = "http://www/baidu.com"
  lastmod = ET.SubElement(url,"lastmod")
  lastmod.text = "2017-10-10"
  changefreq = ET.SubElement(url,"changefreq")
  changefreq.text = "daily"
  priority = ET.SubElement(url,"priority")
  priority.text = "1.0"
  tree = ET.ElementTree(urlset)
  tree.write("sitemap.xml")
if __name__ == '__main__':
  build_sitemap()
          

結(jié)果如下圖所示:

Python常用內(nèi)置模塊之xml模塊(詳解)_第1張圖片

解析和修改XML文件

ElementTree.parse(source, parser=None), 將xml文件加載并返回ElementTree對象。parser是一個可選的參數(shù),如果為空,則默認使用標準的XMLParser解析器。

ElementTree.getroot(), 得到根節(jié)點。返回根節(jié)點的element對象。

Element.remove(tag), 刪除root下名稱為tag的子節(jié)點 以下函數(shù),ElementTree和Element的對象都包含。

find(match), 得到第一個匹配match的子節(jié)點,match可以是一個標簽名稱或者是路徑。返回個element findtext(match,default=None),得到第一個配置的match的element的內(nèi)容 findall(match),得到匹配match下的所有的子節(jié)點,match可以是一個標簽或者是路徑,它會返回一個list,包含匹配的elements的信息 iter(tag),創(chuàng)建一個以當前節(jié)點為根節(jié)點的iterator。

還是以上面創(chuàng)建的sitemap.xml為例,對其進行一定的修改,代碼示例如下:

            
#!/usr/bin/env python
# -*- coding:utf-8 -*-
 
from xml.etree import ElementTree as ET
tree = ET.parse("sitemap.xml")
url = tree.find("url")
for rank in tree.iter('loc'):
  rank.text = "http://www.adminba.com"
tree.write("sitemap.xml")
          

以上的代碼將url修改為http://www.adminba.com了。另外,節(jié)點還有set(設置節(jié)點屬性)、attrib(刪除節(jié)點屬性)方法。

這篇Python常用內(nèi)置模塊之xml模塊(詳解)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 新和县| 辽阳市| 仁寿县| 湟中县| 革吉县| 历史| 弋阳县| 长乐市| 南城县| 柘城县| 金门县| 凉山| 墨竹工卡县| 铜鼓县| 杭锦后旗| 玛纳斯县| 明光市| 蓬溪县| 启东市| 井研县| 辛集市| 山东省| 柯坪县| 呼玛县| 洪江市| 吴忠市| 张家界市| 洛扎县| 阳原县| 大安市| 定陶县| 芦山县| 香格里拉县| 德阳市| 和政县| 丘北县| 名山县| 内黄县| 乐亭县| 洱源县| 临海市|