日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python中還原JavaScript的escape函數(shù)編碼后字符串的方法

系統(tǒng) 4068 0

遇到一個問題需要用Python把JavaScript中escape的中文給還原,但找了大半天,也沒有找到答案,只好自己深入研究解決方案。
我們先來看在js中escape一段文字的編碼

復(fù)制代碼 代碼如下:

a = escape('這是一串文字');
alert(a);

輸出:
復(fù)制代碼 代碼如下:

%u8FD9%u662F%u4E00%u4E32%u6587%u5B57

咋一看,就感覺有點類似json格式,我們來看看標(biāo)準(zhǔn)的json格式編碼同樣的漢子“這是一串文字”
復(fù)制代碼 代碼如下:

# encoding=utf-8
import json
a = '這是一串文字'
print json.dumps(a)

輸出:
復(fù)制代碼 代碼如下:
"\u8fd9\u662f\u4e00\u4e32\u6587\u5b57"

經(jīng)過對比,其實就是js escape編碼每個漢子都是“%u”符號加4位字符編碼,而json編碼每個漢子都是“\u”符號加4位字符編碼,這樣的話,我們可以利用字符串替換操作還原json格式,然后再使用json模塊loads就好
復(fù)制代碼 代碼如下:

# encoding=utf-8
import json
?
# js escape 字符串編碼
c = '%u8FD9%u662F%u4E00%u4E32%u6587%u5B57'
?
# 還原Json對象
jsonObj =? '"'+"".join([(i and "\\"+i) for i in c.split('%')])+'"'
?
print json.loads(jsonObj)

特別記得在把“%”替換為“\”符號以后還要再使用雙引號把字符串包一下,才能算是一個json對象,然后才能json.loads出來
后來,好不容易在一個站點上看到了更簡便的方法。代碼如下:
復(fù)制代碼 代碼如下:

# encoding=utf-8
c = '%u8FD9%u662F%u4E00%u4E32%u6587%u5B57'
print "".join([(len(i)>0 and unichr(int(i,16)) or "") for i in c.split('%u')])

它的思路其實都差不多,把“%u”號替換掉,剩下每一個都是4位固定長度的字符編碼,最后在unichr反編碼回中文字符。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 丰顺县| 寿光市| 青州市| 安泽县| 武冈市| 秀山| 抚远县| 乌鲁木齐市| 泸州市| 益阳市| 江达县| 东安县| 唐河县| 鱼台县| 郁南县| 桦甸市| 皋兰县| 平和县| 阳高县| 丹凤县| 新巴尔虎右旗| 中山市| 铁岭县| 无棣县| 泾源县| 阳城县| 德令哈市| 云安县| 宜州市| 呼图壁县| 徐州市| 梅河口市| 平顶山市| 湘阴县| 浦东新区| 桃园县| 报价| 武胜县| 金坛市| 祁连县| 罗江县|