>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']>>>str=s[0].decode('unicode_escape')#.encode("EUC_KR")>>>printstr中國當(dāng)字符串是:'東亞學(xué)團一中'>>>printunichr(19996)東ord()支持uni" />

日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python中文編碼問題小結(jié)

系統(tǒng) 1687 0

中文編碼問題一直是Python程序設(shè)計中很頭痛的問題,本文對此較為詳細(xì)的進行了總結(jié)歸納。具體如下:
?
當(dāng)字符串是:'\u4e2d\u56fd'?

            
>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']
>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")
>>>print str
中國

          

當(dāng)字符串是:' 東亞學(xué)團一中'

            
>>>print unichr(19996)
東

          

ord()支持unicode,可以顯示特定字符的unicode號碼,如:

            
>>>print ord('A')
65

          

只要和Unicode連接,就會產(chǎn)生Unicode字串。如:

            
>>> 'help'
'help'
>>> 'help,' + u'python'   
u'help,python'

          

對于ASCII(7位)兼容的字串,可和內(nèi)置的str()函數(shù)把Unicode字串轉(zhuǎn)換成ASCII字串。如:

            
>>> str(u'hello world')
'hello world'

          

對幾個概念的理解:

ASCII碼 用數(shù)據(jù)字 對應(yīng) 相應(yīng)的字符 如下圖所示:

python中文編碼問題小結(jié)_第1張圖片

而中文 就是區(qū)位碼對應(yīng)漢字。如:“好” 的ASCII碼為: 22909
?
unicode 編碼 每個國家分一塊。它有UTF-8、UTF-16、UTF-32等形式
中文范圍 4E00-9FBF:這個范圍內(nèi)有 gbk,gb2312,
?
utf-8是基于unicode的 國際化的場合適合使用

gb2312和gb2312都是國標(biāo)碼 出現(xiàn)的較早 主要用于編解碼常用漢字

希望本文所述對大家的Python程序設(shè)計有所幫助。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 凤冈县| 深圳市| 沛县| 东乌珠穆沁旗| 江津市| 苏州市| 家居| 宜黄县| 鸡西市| 伊春市| 鹤山市| 云霄县| 丰原市| 临朐县| 永丰县| 西城区| 烟台市| 张北县| 商丘市| 芦山县| 云林县| 成安县| 通许县| 喜德县| 长顺县| 手游| 龙游县| 安丘市| 泰顺县| 沂水县| 滕州市| 兴化市| 平和县| 都昌县| 绥化市| 阿尔山市| 准格尔旗| 五寨县| 泾阳县| 宜章县| 大连市|