日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

HIVE:用外連接替代子查詢

系統(tǒng) 2744 0

由于hive也支持sql,很多人會把hql跟標(biāo)準(zhǔn)sql進(jìn)行比較,甚至有的時候會直接套用。hive不支持事務(wù)也不支持索引,更不支持追加寫,但是對于一般的sql都是能夠支持的。但是對于一些子查詢確實無法支持的,例如

      select * from t_ext_1_bkdoubledelete where f1=(select max(f1) from t_ext_1_bkdoubledelete)
    

  這個sql在mysql中是能夠支持的,意思是找到val最大的那一行記錄,然后在hive中運(yùn)行確實報錯的;替代的是用左外連接:

      select * from (select max(f1) as maxf1 from t_ext_1_bkdoubledelete) t1  left outer join (select * from t_ext_1_bkdoubledelete) t2 on t1.maxf1=t2.f1


    

  在上面的外連接中,先生成一個臨時表t1獲取其中最大的值max(f1),然后以max(f1)為左值,通過對自己的連接獲取到相關(guān)的行;從而獲取到最大行;

?

? ? ? 下面的這個例子更有意義,使用外連接獲取到用戶的瀏覽記錄。用戶訪問apapche后留下一條訪問記錄,對 apache?log的一個數(shù)據(jù)分析,現(xiàn)在hive里有一個表,一個字段是url,就是請求的網(wǎng)頁的url,然后一個字段是time,按時間排序,想要得到所有的在訪問百度之后訪問的url,就比如說我訪問了www.baidu.com,然后我訪問了淘寶,那么www.taobao.com就是結(jié)果中的一條數(shù)據(jù)。

? ? ? ?

      select t1.time1,t1.fromurl,t2.tourl from 
      
(select time time1,url fromurl,userid from urlLog) t1
left outer join
urlLog t2
on t1.userid=t2.userid
where t1.time1<t2.time and fromurl="www.baidu.com"

更加蛋疼的例子,可以看這個:

http://bbs.csdn.net/topics/390414342

?

HIVE:用外連接替代子查詢


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 全南县| 青铜峡市| 瓮安县| 台北市| 湖北省| 巩留县| 都兰县| 佛坪县| 武定县| 丹江口市| 上高县| 高淳县| 永昌县| 石门县| 沿河| 渝北区| 景泰县| 彭泽县| 顺平县| 五常市| 惠水县| 普安县| 邹城市| 玉林市| 息烽县| 温州市| 上林县| 普兰县| 塔城市| 盐边县| 兴化市| 洪洞县| 永登县| 安陆市| 云霄县| 宽城| 隆子县| 永新县| 札达县| 安徽省| 图片|