Hive 中parse_url的使用


1、Hive的parse_url函数
parse_url(url, partToExtract[, key]) - extracts a part from a URL
解析URL字符串,partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]。
【host,path,query,ref,protocol,file,authority,userinfo】

举例 :

1
2
3
4
5
6
7
8
9
select parse_url('http://facebook.com/path/p1.php?query=1', 'PROTOCOL')    -- http
select parse_url('http://facebook.com/path/p1.php?query=1', 'HOST') -- -facebook.com
select parse_url('http://facebook.com/path/p1.php?query=1', 'REF') ---空
select parse_url('http://facebook.com/path/p1.php?query=1', 'PATH') ---/path/p1.php
select parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY') ---空
select parse_url('http://facebook.com/path/p1.php?query=1', 'FILE') ---/path/p1.php?query=1
select parse_url('http://facebook.com/path/p1.php?query=1', 'AUTHORITY') ---facebook.com
select parse_url('http://facebook.com/path/p1.php?query=1', 'USERINFO') ---空
select parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY','query') -- 1

Author: 杜宏飞
Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint policy. If reproduced, please indicate source 杜宏飞 !
  TOC