kudu 虚拟机环境使用
2024-10-21 11:33:59
安装
curl -s https://raw.githubusercontent.com/cloudera/kudu-examples/master/demo-vm-setup/bootstrap.sh | bash
备注: 会比较慢,可以使用其他的下载工具,提前下载放到目录即可,同时默认会自动启动服务
基本使用
a. 链接
ssh demo@quickstart.cloudera
b. 查看服务
$ ps aux | grep kudu
$ ps aux | grep impalad
c. 加载数据
wget http://kudu-sample-data.s3.amazonaws.com/sfmtaAVLRawData01012013.csv.gz
hdfs dfs -mkdir /sfmta
zcat sfmtaAVLRawData01012013.csv.gz | tr -d '\r' | hadoop fs -put - /sfmta/data.csv
d. 使用impala 进行数据处理
ssh demo@quickstart.cloudera -t impala-shell
CREATE EXTERNAL TABLE sfmta_raw (
revision int,
report_time string,
vehicle_tag int,
longitude float,
latitude float,
speed float,
heading float
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LOCATION '/sfmta/'
TBLPROPERTIES ('skip.header.line.count'='1');
SELECT count(*) FROM sfmta_raw;
+----------+
| count(*) |
+----------+
| 859086 |
+----------+
CREATE TABLE sfmta
PRIMARY KEY (report_time, vehicle_tag)
PARTITION BY HASH(report_time) PARTITIONS 8
STORED AS KUDU
AS SELECT
UNIX_TIMESTAMP(report_time, 'MM/dd/yyyy HH:mm:ss') AS report_time,
vehicle_tag,
longitude,
latitude,
speed,
heading
FROM sfmta_raw;
SELECT * FROM sfmta ORDER BY speed DESC LIMIT 1;
参考资料
http://kudu.apache.org/docs/quickstart.html
最新文章
- canvas学习和面向对象(二)
- TEST===>;Sqlserver中获取年月日时分秒
- SQL Server 2008 R2数据库镜像部署
- php 函数 array_slice
- #include <;iomanip>;
- nginx代理配置
- HDU 5889 (最短路+网络流)
- 去掉Dedecms幻灯片的标题文字和绿色背景
- Android异步处理技术
- 【原创】IDEA一定要改的八条配置
- C++版 - LeetCode 144. Binary Tree Preorder Traversal (二叉树先根序遍历,非递归)
- 插件使用一颜色选择器---cxColor
- 使用强类型DataSet增加数据并获取自动增长的ID
- Oracle下SQL学习笔记
- 如何在eclipse 里面调试java.lang包的代码
- Linux学习笔记09—Sqlyog链接mysql配置
- 随笔 -- IO -- Socket/ServerSocket -- Echo(BIO)实例
- ZOJ 1456 Minimum Transport Cost(floyd+后继路径记录)
- SharePoint 数据库管理-PowerShell
- angularjs 常用功能练习