日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

使用Protocol Buffers的C語言拓展提速Python程序的示例

系統(tǒng) 1775 0

?Protocol Buffers (類似XML的一種數(shù)據(jù)描述語言)最新版本2.3里,protoc―py_out命令只生成原生的Python代碼。 盡管PB(Protocol Buffers)可以為C++語言生成快速解析和序列化代碼,但是這種方式對(duì)于Python不適用,并且手動(dòng)生成的已包裝的代碼需要非常大的維護(hù)工作。在討論組里,這是一個(gè)常見的功能要求,由于一個(gè)必備的客戶端組件―AppEngine(根據(jù)團(tuán)隊(duì)介紹名稱為AppEngine),生成原生的Python代碼有更高的優(yōu)先級(jí)。

幸運(yùn)的是, PB 2.4版本中本地化代碼已被提名,在 svn的分支中已經(jīng)可以下載,因此你能夠使用快速的 PB有一段時(shí)間了。 (我們使用 r352版本有一段時(shí)間了,還沒有遇到任何問題。) PB團(tuán)隊(duì)一直不愿輕易指定任何發(fā)布日期,在我的威脅下, Kenton Varda提到日期初步定在 2011年初。


我沒有在其它地方看見過這個(gè)文檔,希望它能對(duì)其他人有所幫助.

如何做能讓它快起來

安裝好新的PB庫之后并使用 protoc --py_out=...? 重新構(gòu)建好你的PB之后,你需要在運(yùn)行你的Python程序之前進(jìn)行環(huán)境變量 PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=cpp 的設(shè)置,以便于選擇C++的,或者PB默認(rèn)使用的Python實(shí)現(xiàn).

就這樣了!這至少就能在可以動(dòng)態(tài)轉(zhuǎn)化/序列化消息的PB運(yùn)行時(shí)庫用通用的C++代碼了. (注意我們還沒有生成任何C++代碼.)

它能有多快呢? 我編寫了一個(gè)簡單的程序來獲得性能在我們的應(yīng)用程序中的提升感觀:
?

            
nruns = 1000nwarmups = 100xs = ... # your protobufsdef ser(): return [x.SerializeToString() for x in xs]def parse(ys): for y in ys: pb.Email().ParseFromString(y)
 
t = timeit.Timer(lambda:None)
t.timeit(nwarmups)print 'noop:', t.timeit(nruns) / nruns
 
t = timeit.Timer(ser)
t.timeit(nwarmups)print 'ser:', t.timeit(nruns) / nruns / len(xs)
 
ys = ser()
t = timeit.Timer(lambda: parse(ys))
t.timeit(nwarmups)print 'parse:', t.timeit(nruns) / nruns / len(xs)print 'msg size:', sum(len(y) for y in ys) / len(ys)

          

以秒為單位,這段程序在我的桌面上給出了如下幾個(gè)時(shí)間結(jié)果:
?

            
$ python sandbox/pbbench.py out.ini
ser: 0.000434461673101
parse: 0.000602062404156
msg size: 10730
 
$ PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=cpp \
> python sandbox/pbbench.py out.ini
ser: 2.86788344383e-05
parse: 7.63910810153e-05
msg size: 10730

          

這顯示出在序列化和轉(zhuǎn)化方面分別有15和8被的速度提升。不壞!但還可以更快.

如何做讓它更快

現(xiàn)在我們實(shí)際上只是特地針對(duì)你的PB生成了一個(gè)C++實(shí)現(xiàn),而我們從來沒有使用過運(yùn)行時(shí)反射。首先,為你的Python項(xiàng)目添加一個(gè)C擴(kuò)展,不如,通過修改如下的 setup.py:
?

            
setup(
  ...
  ext_modules=[Extension('podpb',
sources=['cpp/podpb.c','cpp/main.pb.cc'], libraries=['protobuf'])],
  ...
  )

          

使用 protoc --cpp_out=cpp 生成main.pb.c, 并按如下所示創(chuàng)建 podpb.c 來設(shè)置一個(gè)空的 Python C 模塊:
?

            
#include 
            
              
 
static PyMethodDef PodMethods[] = {
 {NULL, NULL, 0, NULL}    /* Sentinel */};
 
PyMODINIT_FUNC
initpodpb(void)
{
 PyObject *m;
 
 m = Py_InitModule("podpb", PodMethods); if (m == NULL)  return;
}

            
          

現(xiàn)在就運(yùn)行 python setup.py build 命令會(huì)構(gòu)建所有的東西. 只要將C模塊(在這里是podpb)導(dǎo)入到你的項(xiàng)目中,PB 運(yùn)行時(shí)庫就將會(huì)自動(dòng)使用 C++ 實(shí)現(xiàn)了.

現(xiàn)在我們就分別有了68倍x 和 13倍 的速度提升. 吼吼.
?

            
$ PYTHONPATH=build/lib.linux-x86_64-2.6/:$PYTHONPATH \
> PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=cpp \
> python sandbox/pbbench.py out.ini
ser: 6.39575719833e-06
parse: 4.55250144005e-05
msg size: 10730

          


我這篇文章發(fā)布到很多地方,大事完全忘了它的存在。同時(shí) connex.io 和 Greplin 發(fā)布了他們的原生的 Python實(shí)現(xiàn),cypb和fast-python-pb。cypb在PB的郵件列表中公布過,可以運(yùn)行,但仍需要提升到可用的狀態(tài)。fast-python-pb目前只支持string int32, int64 雙精度浮點(diǎn)和子消息成員。除了這些項(xiàng)目,其他的我都不了解。你也可以查看我的orginal thread PB郵列表來了解到這些。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 方城县| 泽普县| 美姑县| 板桥市| 黔东| 五莲县| 奉节县| 平武县| 大理市| 湘阴县| 安新县| 咸阳市| 平度市| 邛崃市| 新营市| 渑池县| 呼图壁县| 精河县| 胶南市| 紫阳县| 长寿区| 普陀区| 景德镇市| 渭南市| 观塘区| 德庆县| 剑河县| 宜城市| 亳州市| 黎川县| 镇沅| 阳山县| 巴林左旗| 三亚市| 盐边县| 青冈县| 湖南省| 微山县| 南皮县| 镇雄县| 南陵县|