Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能 hive的元数据存储:通常是存储在关系数据库如 mysql(推荐) , derby(内嵌数据库)中 hive的组成部分 :解释器.编译器.优化器.执行器 hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做批量数据统计分析 hive中的数据表分为内部表.外部表 当删除内部表的时候,表中的数据会跟着一块删除 删除外部表时候,外部表会被删除,外部表的数据不会被删除 使用