网易首页 > 网易号 > 正文 申请入驻

大数据开发之Hive应用分析

0
分享至

Hive架构
1.用户接口:Client
CLI(hive shell) JDBC(java访问hive) WEBUI(浏览器访问hive)
2.元数据(Metastore)-数据库
元数据包括:表名称、表所属的数据库、表的拥有者、列/分区字段名、表的类型(外部/内部)、表的数据所在的目录
默认存储在自带的derby的数据库中,推荐使用Mysql来存储元数据
3.hadoop
hive使用HDFS进行数据的存储,使用MR进行数据的计算
4.驱动器:driver
包含:解析器 -> 优化器 -> 编译器 -> 执行器


Hive的优点和使用场景
1.简单易用(操作接口采用类SQL语法,提供快速开发的能力)
2.避免我们去写MR,减少开发人员的学习成本
3.统一的元数据管理,可与impala、spark等共享数据
4.易扩展
5.数据的离线处理:比如日志分析,海量结构化数据离线分析
6.Hive的执行延迟比较高,因此Hive常用于数据离线分析,适合实时性要求不高的场景
7.Hive优势在于处理大数据,对于处理小数据没有优势,因为hive的执行延迟性很高。
Hive常用的命令
1.show databases;//查看数据库
2.create database db_hive;//创建数据库
3.drop database db_hive;//删除数据库(数据库内无表)
4.use db_hive;//使用数据库
5.创建表:
CREATE TABLE u_data (
userid INT,
movieid INT,
rating STRING,
unixtime STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;//textfile文本,以“,”为分隔符
6.load data local inpath '/opt/datas/ratings·txt' into table u_data;//加载本地数据到表中
7.select * from u_data;//查询表
8.select userid from u_data;//字段查询
9.select count(1) u_count from u_data;//统计行数,进行mr计算
10.desc u_data;//描述表信息
11.desc extended u_data;//描述表具体信息(无序)
12.desc formatted u_data;//描述具体信息(有序)
13.show functions;//查看hive自带所有函数
14.desc function upper;//查看upper函数的说明
15.desc function extended uppper;//查看upper函数的具体说明
16.select userid,upper(username) uppper_name from student;//利用upper函数进行大写转换
Hive常用的配置属性
1.Hive数据仓库位置配置:hive-default.xml
hive.metastore.warehouse.dir
/user/hive/warehouse //数仓地址
location of default database for the warehouse
//赋权命令
$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse
2.Hive运行日志的配置:hive-log4j.properties
hive.log.dir=/opt/modules/hive-1.1.0-cdh5.5.0/logs //日志存放目录
hive.log.file=hive.log
3.Hive运行日志的级别:hive-log4j.properties
hive.root.logger=info,DRFA //可改为(DEBUG,DRFA)
4.在cli命令行上显示当前数据库名称,以及查询表的表头信息:hive-site.xml
hive.cli.print.header
true //打开查询表会显示列名

hive.cli.print.current.db
true //打开客户端会显示所在数据库
5.在启动hive时设置配属属性项信息
bin/hive --hiveconf
eg:
bin/hvie --hiveconf hive.cli.print.header=false //将表头关闭
要注意此种方式的设置,仅仅在当前会话session中有效,退出则失效。
6.查看hive当前所有的配置信息
set;
set hive.cli.print.header;
set hive.cli.print.header=false; //将表头关闭
修改配置信息优先级:
set -> --hiveconf -> hive-site.xml -> hive-defualt.xml
Hive shell常用的操作
bin/hive -help
usage: hive
-d,--define Variable subsitution to apply to hive
commands. e.g. -d A=B or --define A=B
--database Specify the database to use
-e SQL from command line
-f SQL from files
-H,--help Print help information
--hiveconf Use value for given property
--hivevar Variable subsitution to apply to hive
commands. e.g. --hivevar A=B
-i Initialization SQL file
-S,--silent Silent mode in interactive shell
-v,--verbose Verbose mode (echo executed SQL to the
console)
1. bin/hive -e "select * from db_hive.student"
bin/hive -e "select count(1) from db_hive.student"
可直接执行查询语句
2.bin/hive -f /opt/jars/stu.sql
可直接执行sql文件进行查询交互
3·save result
bin/hive -f stu.sql > /opt/datas/student.txt
将查询结果储存到本地
Hive中数据库的操作方式
CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name
[COMMENT database_comment]
[LOCATION hdfs_path]
[WITH DBPROPERTIES (property_name=property_value, ...)];
1.create database db_hive;
CREATE DATABASE IF NOT EXISTS db_hive --- 标准方式
CREATE DATABASE IF NOT EXISTS db_kfk LOCATION '/user/kfk/kfkwarehouse';
2.drop database
DROP (DATABASE|SCHEMA) [IF EXISTS] database_name [RESTRICT|CASCADE];
drop database IF EXISTS db_kfk;--- 标准方式
drop database IF EXISTS db_hive cascade; --- 当数据库里有表时可直接删除
3.use database
USE database_name;
Hive中数据库表的创建方式(三种)
第一种:创建Textfile类型以“,”为分隔符的表
CREATE TABLE IF NOT EXISTS db_name.table_name
(col_name data_type )
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
eg:
CREATE TABLE student (
userid string,
username string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
第二种:复制已有表或视图的结构
CREATE TABLE IF NOT EXISTS db_name.table_name
LIKE existing_table_or_view_name
eg:
CREATE TABLE IF NOT EXISTS db_hive.stu
LIKE db_hive.student
第三种:复制已有表的结构和数据
CREATE TABLE IF NOT EXISTS db_name.table_name
AS select * from table
eg:
CREATE TABLE IF NOT EXISTS db_hive.stu
AS select * from db_hive.student

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国家安全部:1人向从事间谍活动嫌犯通风报信被行拘

国家安全部:1人向从事间谍活动嫌犯通风报信被行拘

新京报
2024-05-29 08:37:06
“发现一个、查处一个”!中央纪委重要内设部门,披露查办“老虎”孙力军案细节

“发现一个、查处一个”!中央纪委重要内设部门,披露查办“老虎”孙力军案细节

政知新媒体
2024-05-28 19:31:46
东体:待遇方面,穆里奇在恒大期间总薪水加奖金拿到了2000万美元

东体:待遇方面,穆里奇在恒大期间总薪水加奖金拿到了2000万美元

直播吧
2024-05-29 12:41:10
衢州男子买0.31元“炒股教程”5天被骗510万,警方成立专案组

衢州男子买0.31元“炒股教程”5天被骗510万,警方成立专案组

澎湃新闻
2024-05-29 10:34:28
俄罗斯国防部“大洗牌”,一个月内5名高官落马

俄罗斯国防部“大洗牌”,一个月内5名高官落马

中国新闻周刊
2024-05-29 14:18:00
以色列议会拟推动认定联合国机构为恐怖组织!

以色列议会拟推动认定联合国机构为恐怖组织!

鲁中晨报
2024-05-29 09:30:09
郭有才凉了!

郭有才凉了!

新动察
2024-05-29 09:48:19
三上悠亚半素颜现身街头:真实样貌曝光网友惊呆

三上悠亚半素颜现身街头:真实样貌曝光网友惊呆

葫芦哥爱吐槽
2024-05-29 05:37:54
台湾上空发生激烈交锋,中美军机交手,专家发现不对:大陆咋来的

台湾上空发生激烈交锋,中美军机交手,专家发现不对:大陆咋来的

星辰故事屋
2024-05-27 22:00:17
有的官员已经不管老百姓死活了

有的官员已经不管老百姓死活了

浮事记
2024-05-29 11:18:51
公开娶“小老婆”的常务副市长,最新消息来了!

公开娶“小老婆”的常务副市长,最新消息来了!

天闻地知
2024-05-29 09:25:11
入伍前瘦得皮包骨,退伍时衣服包不住肥肉?印度军人到底吃的啥?

入伍前瘦得皮包骨,退伍时衣服包不住肥肉?印度军人到底吃的啥?

青栀伊人
2024-05-27 22:11:13
中国一则爆料疯传全网!父亲多年前4000枚比特币意外寻获 现价已破20亿元人民币

中国一则爆料疯传全网!父亲多年前4000枚比特币意外寻获 现价已破20亿元人民币

FX168链界观察
2024-05-29 12:42:11
网红医生天天直播抢救病人,真实身份是整形医生,全是自编自导?

网红医生天天直播抢救病人,真实身份是整形医生,全是自编自导?

毒哥的毒鸡汤
2024-05-29 11:49:41
美媒P图嘲讽东契奇被华子KO!赛后主动发声揽责 豪言要赢4场

美媒P图嘲讽东契奇被华子KO!赛后主动发声揽责 豪言要赢4场

醉卧浮生
2024-05-29 11:58:26
这样的人越来越多了!

这样的人越来越多了!

吴女士
2024-05-29 10:58:00
好家伙,这是立了多大的功,给全国人民发短信,表扬大家收到了吗

好家伙,这是立了多大的功,给全国人民发短信,表扬大家收到了吗

芯怡飞
2024-05-28 08:25:19
凯特王妃的包头造型曝光,即使有化疗后遗症,但笑容不可替代的!

凯特王妃的包头造型曝光,即使有化疗后遗症,但笑容不可替代的!

阿桥侃娱乐
2024-05-29 08:47:33
美国巨星约翰尼遭枪击身亡!享年37岁,他并没反抗本来可以不用死

美国巨星约翰尼遭枪击身亡!享年37岁,他并没反抗本来可以不用死

娱乐白名单
2024-05-29 12:04:08
救赎之战!华子29+10+9最后38秒制胜球 唐斯25分末节3记关键三分

救赎之战!华子29+10+9最后38秒制胜球 唐斯25分末节3记关键三分

厝边人侃体育
2024-05-29 11:09:28
2024-05-29 15:50:44
IT爱好者小尚
IT爱好者小尚
分享IT教育类信息
630文章数 55关注度
往期回顾 全部

科技要闻

王传福再放狠话,燃油车要成“非主流”

头条要闻

餐馆老板诉民警喝茅台吃野味不付钱 法院:系老板宴请

头条要闻

餐馆老板诉民警喝茅台吃野味不付钱 法院:系老板宴请

体育要闻

巴黎主席向皇马索要8000万 佛爷:1分不给

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功 向燃油车绝缘智能SAY NO

态度原创

艺术
房产
数码
亲子
健康

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

房产要闻

有点猛!最新房价:海南每㎡跌了2000多!

数码要闻

4.5插槽巨物!微星RTX 4090 SUPRIM FUZION用上一体水冷

亲子要闻

小女孩跟老师学跳舞,又甜又酷,这么小就这么厉害!

晚餐不吃or吃七分饱,哪种更减肥?

无障碍浏览 进入关怀版