日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

[編程技巧] 巧用CPU緩存優化代碼:數組 vs. 鏈表

系統 2320 0

?一個常見的編程問題: 遍歷 同樣大小的數組和鏈表, 哪個比較快? 如果按照大學教科書上的算法分析方法,你會得出結論,這2者一樣快, 因為時間復雜度都是 O(n)。 但是在實踐中, 這2者卻有極大的差異。?? 通過下面的分析你會發現, 其實數組比鏈表要快很多。

?

首先介紹一個概念:memory hierarchy (存儲層次結構),電腦中存在多種不同的存儲器,如下表

  • CPU?寄存器 – immediate access (0-1個CPU時鐘周期)
  • CPU L1?緩存 ? – fast access (3個CPU時鐘周期)
  • CPU L2 緩存 – slightly slower access (10個CPU時鐘周期)
  • 內存?(RAM) ? ?– slow access (100個CPU時鐘周期)
  • 硬盤?(file system) ?– very slow (10,000,000個CPU時鐘周期)

????? (數據來自 http://www.answers.com/topic/locality-of-reference

?

各級別的存儲器速度差異非常大,CPU寄存器速度是內存速度的100倍! 這就是為什么CPU產商發明了CPU緩存。 而這個CPU緩存,就是數組和鏈表的區別的關鍵所在。

?

CPU緩存會把一片連續的內存空間讀入, 因為數組結構是 連續的內存地址 ,所以數組全部或者部分元素被連續存在CPU緩存里面, 平均讀取每個元素的時間只要3個CPU時鐘周期。?? 而鏈表的節點是 分散 在堆空間里面的,這時候CPU緩存幫不上忙,只能是去讀取內存,平均讀取時間需要100個CPU時鐘周期。 這樣算下來, 數組訪問的速度比鏈表快33倍! (這里只是介紹概念,具體的數字因CPU而異)

?

因此,程序中盡量使用連續的數據結構,這樣可以充分發揮CPU緩存的威力。 這種對緩存友好的算法稱為 Cache-oblivious algorithm , 有興趣可以參考相關資料。再舉一個簡單例子:

?

對比

for i in 0..n
? for j in 0..m
??? for k in 0..p
????? C[i][j] = C[i][j] + A[i][k] * B[k][j];

for i in 0..n

? for k in 0..p
??? for j in 0..m
????? C[i][j] = C[i][j] + A[i][k] * B[k][j];

?

雖然兩者執行結果一樣,算法復雜度也一樣,但是你會發現第二種寫法要快很多。?

?

總結一下, 各種存儲器的速度差異很大,在編程中絕對有必要考慮這個因素。 比如,內存速度比硬盤快1萬倍,所以程序中應該盡量避免頻繁的硬盤讀寫;CPU緩存比內存快幾十倍,在程序中盡量多加利用。

?

?

?>> 原創文章的版權屬于作者,轉載請注明出處和作者信息( http://blog.csdn.net/WinGeek/ ), 謝謝。 <<

?

?

?

?

?

[編程技巧] 巧用CPU緩存優化代碼:數組 vs. 鏈表


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 彰化市| 马尔康县| 友谊县| 金山区| 高州市| 刚察县| 晋江市| 瑞昌市| 西乌珠穆沁旗| 柳林县| 拜城县| 赫章县| 天峨县| 樟树市| 娱乐| 那坡县| 凌源市| 鹤壁市| 呼伦贝尔市| 两当县| 长海县| 博白县| 文安县| 米易县| 武威市| 杭锦后旗| 钟山县| 株洲市| 宜良县| 江都市| 黑河市| 宾阳县| 泌阳县| 应城市| 汕尾市| 韶山市| 互助| 威信县| 天台县| 叙永县| 寿阳县|