一、环境介绍:

elasticsearch:2.3.1

hive:0.12

二、环境搭建

2.1 首先获取elasticsearc-hadoop的jar包

链接地址:http://jcenter.bintray.com/org/elasticsearch/elasticsearch-hadoop/2.3.1/elasticsearch-hadoop-2.3.1.jar,下载即可。需要说明的是你的elasticsearch什么版本,那么elasticsearch-hadoop的jar包就什么版本,否则后果难料

2.2 hive集成elasticsearch

将elasticsearch-hadoop-2.3.1.jar拷贝到hive的默认lib目录即可。我的目录是:$HIVE_HOME/auxlib目录

启动hive,查看效果:

/home/q/java/default/bin/java -Xmx256m -Djava.net.preferIPv4Stack=true ***  -hiveconf hive.aux.jars.path=file:///home/q/hive/hive-0.12.0-bin/auxlib/elasticsearch-hadoop-2.0.1.jar

只要包含了上面的红色部分说明集成成功

三、插入数据

3.1 建立数据表

3.1.1 建立view表

CREATE EXTERNAL TABLE user  (id INT, name STRING)
STORED BY 'org.elasticsearch.hadoop.hive.EsStorageHandler'
TBLPROPERTIES('es.resource' = 'radiott/artiststt','es.index.auto.create' = 'true','es.nodes' = 'elastisticsearch.*.qunar.com','es.port' = '');

有几个参数,es.nodes是配置的es的url地址,默认是localhost。es.port是端口号码,默认是9200

3.1.2 建立数据表

CREATE TABLE user_source  (id INT, name STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';

3.2 加载数据

3.2.1 加载基础数据

数据示例,我放在/tmp/user_source.log

1,medcl
2,lcdem
3,tom
4,jack

加载到user_source表,命令如下:LOAD DATA LOCAL INPATH '/tmp/user_source.log' OVERWRITE INTO TABLE user_source;

3.2.2 加载到es

INSERT OVERWRITE TABLE user  SELECT s.id, s.name FROM user_source s;

查看效果:

四、参考文档:

http://blog.csdn.net/sunflower_cao/article/details/39896189

https://www.elastic.co/guide/en/elasticsearch/hadoop/current/configuration.html#_essential_settings

最新文章

  1. *HDU2473 并查集
  2. Babel下的ES6兼容性与规范
  3. 深入理解java虚拟机【Java虚拟机垃圾收集器】
  4. C#6.0语法糖剖析(一)
  5. vmware-workstation-11中centos-6.6安装
  6. 图的最短路算法 Dijkstra及其优化
  7. http 301、304状态码
  8. [置顶] Android Provision (Setup Wizard)
  9. javaScript hook
  10. Appium环境配置
  11. SQL练习之不反复执行相同的计算
  12. swift 笔记 (七) —— 关闭
  13. StyleCop中有一些官方自己写好的检测规则下面就是英文的解释
  14. BNUOJ 6038 - Reaux! Sham! Beaux!(模拟)
  15. 表单中GET与POST的区别
  16. PHP秒杀系统全方位设计(一)
  17. shell-计算虚拟机创建时间
  18. LOJ #2205. 「HNOI2014」画框 解题报告
  19. vue 自动识别PC、移动端,并跳转到对应页面
  20. 分布式Session一致性解决方案有哪些?

热门文章

  1. 在Mac上用自己编译出的DNX运行.NET程序
  2. Entity Framework问题总结
  3. SQL——用户定义函数
  4. Linux下的NFS配置(转)
  5. Windows下安装Ruby
  6. atitit.提升备份文件复制速度(3) ----建立同步删除脚本
  7. 详解Bootstrap面板组件
  8. nginx是一个反向代理的软件
  9. 搞了台2ussd服务器
  10. reader