日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

greenplum表的distributed key值查看

系統 2265 0

  greenplum屬于分布式的數據庫,MPP+Share nothing的體系,查詢的效率很快.不過,這是建立在數據分散均勻的基礎上的.如果DK值設置不合理的話,完全有可能出現所有數據落在單個節點上的情況,這就體現不出優勢來.因此,DK值的設置是否合適是建表的時候,需要考慮的重要因素之一.

????? 查看表(table_name)的數據在節點的分布情況:

      
        select
      
       gp_segment_id,
      
        count
      
      (
      
        *
      
      ) 
      
        from
      
       table_name 
      
        group
      
      
        by
      
       gp_segment_id;
    

  如果數據有嚴重傾斜的話,即某些節點的數據量過大,表示DK值需要重新調整.調整語句為alter table table_name set distirbuted by(col1,col2,...);

???? 現在有個問題是:如何發現哪些DK值設置不合理的表呢?可以參照之前寫的文章: 數據分布查看 , 執果索因調整

???? 這里介紹的是如何把DK值展現出現,一般設置單列(該列為日期類型,每天一份的話)的表,就很有可能出現DK值不合理的情況。我們需要利用到三張表:

???? pg_class?????? --object屬性表,relkind表示object屬性,'r'代表table

???? pg_attribute? --展現詳細的列

???? gp_distribution_policy? --存儲DK值

首先,創建一個類型,用來顯示function的結果集.

      
        create
      
      
         type dk_table_type as

(

    table_name 
      
      
        varchar
      
      
        ,

    dk_cols 
      
      
        varchar
      
      
        

);
      
    

然后,用上面三張表組合起來,得到相應的所需要的結果信息.

      
        
CREATE
OR REPLACE FUNCTION get_table_dk() RETURNS SETOF dk_table_type AS $BODY$ DECLARE v_cur_tb cursor for select d.nspname || ' . ' || a.relname,b.attname from pg_class a inner join pg_attribute b on a.oid = b.attrelid inner join gp_distribution_policy c on a.oid = c.localoid inner join pg_namespace d on a.relnamespace = d.oid where a.relkind = ' r ' and b.attnum =any (c.attrnums) order by d.nspname || ' . ' || a.relname,b.attname,b.attnum; v_tb varchar ( 500 ): = '' ; v_tb_new varchar ( 500 ): = '' ; v_dk_col varchar ( 100 ): = '' ; v_dk_cols varchar ( 1000 ): = '' ; v_record dk_table_type; BEGIN open v_cur_tb; loop fetch v_cur_tb into v_tb_new,v_dk_col; if not found THEN exit ; end if ; if v_tb = '' and v_dk_cols = '' then v_tb : = v_tb_new; v_dk_cols: = v_dk_col; ELSEIF v_tb <> v_tb_new THEN select v_tb,v_dk_cols into v_record; return next v_record; v_tb : = v_tb_new; v_dk_cols: = v_dk_col; ELSE v_dk_cols: = v_dk_cols || ' , ' || v_dk_col; end if ; end loop; select v_tb,v_dk_cols into v_record; return next v_record; close v_cur_tb; end ; $BODY$ LANGUAGE plpgsql VOLATILE;

  然后,執行select * from get_table_dk() 就可以獲得表以及其對應的DK值(列),從而可以直觀的發現是否有些表需要調整,此時就用上面的gp_segment_id來驗證.如果是的話,就進行相應的調整.

?

greenplum表的distributed key值查看


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦?。?!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 类乌齐县| 临漳县| 大悟县| 衢州市| 灌云县| 陆丰市| 富平县| 邵阳市| 东安县| 扎兰屯市| 武胜县| 宁武县| 定结县| 梧州市| 博客| 宁远县| 天镇县| 柘荣县| 民勤县| 武乡县| 铁岭市| 连江县| 大同市| 中牟县| 肥东县| 南雄市| 托克逊县| 金寨县| 郯城县| 麻城市| 汨罗市| 江西省| 容城县| 迁安市| 北海市| 闽侯县| 融水| 大竹县| 永和县| 元谋县| 沂水县|