一、Apache Ranger是什么?

Apache Ranger是一个框架,Hadoop上对于保护数据数据安全性的安全框架。用于在整个Hadoop平台上启用,监视和管理全面的数据安全性。

二、特性

Apache Ranger具有以下特性:

  • 集中式安全管理,可在中央UI或使用REST API管理所有与安全相关的任务。
  • 使用Hadoop组件/工具执行特定操作和/或操作的精细授权,并通过中央管理工具进行管理
  • 跨所有Hadoop组件标准化授权方法。
  • 增强了对不同授权方法的支持-基于角色的访问控制,基于属性的访问控制等。
  • 在Hadoop的所有组件中集中审核用户访问和管理操作(与安全性相关)。

三、ranger内部结构

1、包含的组件如下:

  • Ranger Admin 用户管理策略,提供WebUI和RestFul接口
  • Ranger UserSync 用于将Unix系统或LDAP用户/组同步到RangerAdmin
  • Ranger TagSync 同步Atlas中的Tag信息
  • Ranger KMS

2、依赖的组件如下:

  • JDK 运行RangerAdmin RangerKMS
  • RDBMS 1.存储授权策略 2.存储Ranger 用户/组 3.存储审核日志
  • Solr(可选) 存储审核日志
  • HDFS(可选) 存储审核日志
  • Kerberos(可选) 确保所有请求都被认证

3、当前2.1.0支持的组件如下:

  • YARN
  • HDFS
  • SOLR
  • KYLIN
  • ATLAS
  • OZONE
  • HBASE
  • KNOX
  • KAFKA
  • NIFI-REGISTRY
  • ELASTICSEARCH
  • HIVE
  • STORM
  • NIFI
  • SQOOP
  • PRESTO

4、处理流程如下:

四、安装

Ranger当前在GitHub中最新版本是2.1.0,从官网下载的源码包最新版本是2.0.0。安装ranger需要源码安装,官方没有提供编译好的二进制包,同时,对于要使用ranger部署的Hadoop组件,需要考虑到版本之间的兼容性。如下是我在做测试的时候,所使用的版本。

ranger版本 2.1.0
hadoop版本 2.9.2
hbase版本 2.0.2
hive版本 3.1.2

注:在测试的时候我使用hive2.x、hbase1.3和1.4都不能正常的使用,报错信息看后面ranger hive与ranger hbase相关的错误信息。

1、官网下载源码包

下载方式1:从GitHub下载,下载方式如下:

# git clone https://github.com/apache/ranger.git   #默认下载最新版本,下载位置随意,例如:
/data1/hadoop/ranger/
或者

# git clone https://github.com/apache/incubator-ranger.git

注:下载需要使用到git命令,请自行安装。

如果是centos,可以使用
# yum install git -y
如果是ubuntu
# apt-get update
#apt-get install git -y
如果是内网机器,可以使用yum代理或者下载rpm包(centos)、dep包(Ubuntu)

下载方式2:从官网下载源码tar包

# wget http://mirrors.tuna.tsinghua.edu.cn/apache/ranger/2.0.0/apache-ranger-2.0.0.tar.gz

2、下载maven

编译安装需要使用到maven,下载如下:

# wget http://mirrors.tuna.tsinghua.edu.cn/apache/maven/maven-3/3.6.2/binaries/apache-maven-3.6.2-bin.tar.gz

解压
做软连接
#ln -s apache-maven-3.6.-bin maven 添加环境变量
# vim ~/.bashrc
export MAVEN_HOME=/data1/hadoop/maven
export PATH=${MAVEN_HOME}/bin:$PATH

3、编译安装

# cd ranger
# mvn clean compile package assembly:assembly install -DskipTests -Drat.skip=true
(安装过程漫长,需要等待!!!),注意:源码安装需要JDK环境 我这里使用的是从GitHub下载的源代码进行编译安装的,其他方式都一样的操作。

编译过程看网络,看机器,时间不定,基本来说需要20分钟以上,我第一次编译花了两个多小时。机器不咋地,使用的kvm虚拟机。

编译完成如下:

如果出现绿色的BUILD SUCCESS说明编译成功。

编译完成以后,在当前目录下的target目录下会生成相应的tar包文件,如下:

接下来就可以使用这些编译完成二进制tar文件。

如果在编译安装的时候,需要对Hadoop、hbase、hive等相应的版本有要求,那么可以在下载的源代码目录下有一个pom.xml文件,这里面修改对于Hadoop组件的版本,我当初就是没有修改,导致后面在使用的时候,出现很多版本兼容性问题。

列如:我的安装目录

/data1/hadoop/ranger/ranger   第一个ranger是我自己创建的,第二个ranger是GitHub下载的时候自动生成的。

五、安装ranger-admin

安装ranger-admin的机器可以不在Hadoop集群内部,可以是随便一台。这里我就安装在当前机器上。

1、解压admin软件包

# tar zxvf ranger-2.1.-SNAPSHOT-admin.tar.gz -C /data/ranger

2、修改install.properties文件

注:ranger-admin依赖数据库,需要存储信息。安装数据库操作请自行百度。

# cd /data/ranger/ranger-2.1.-SNAPSHOT-admin
修改install.properties文件,需要修改的信息如下: (1)数据库配置:
  • SQL_CONNECTOR_JAR=/usr/share/java/mysql-connector-java.jar #sql连接器,需要从官网下载,然后修改成该名字,当然也可以自己定义
  • db_root_user=root   #数据库用户名
  • db_host=localhost  #数据库主机,如果不在一台机器,请修改

  • db_root_password=*****  #数据库密码

以下三个属性是用于设置ranger数据库的

db_name=ranger   #数据库名字
db_user=root      #管理数据库的用户
db_password=****  #密码

(2)、审计日志

如果没有安装solr,这里可以全部注释

audit_store=solr
audit_solr_urls=http://localhost:6083/solr/ranger_audits
audit_solr_user=solr

(3)、策略管理配置

policymgr_external_url=http://localhost:6080   #配置用户名和端口,如果不想使用默认值,可以修改。

这里需要注意:ranger在连接数据库的时候,对于密码强度要求很高,当然,这也是由于数据库的密码策略导致的,如果设置的密码不符合数据库的密码策略,那么ranger连接数据库会失败,同时,还需要在数据库里面赋予相应的权限。如下:

Mysql5.7数据库密码策略:大小写+数字+特殊字符+密码长度>8

create database ranger   #创建数据库

grant all on *.* to ‘root’@’%’ identified by ‘your password’;

Flush privileges;

3、安装solr

solr用于存储审计信息,solr可以单独安装,可以安装单节点,也可以部署为集群,这里使用ranger自带的方式安装。

(1) 修改配置

在当前目录下的contrib/solr_for_audit_setup目录下,修改install.properties文件

完整目录如下:

[hduser@yjt solr_for_audit_setup]$ pwd

/data/ranger/ranger-2.1.0-SNAPSHOT-admin/contrib/solr_for_audit_setup

修改如下配置文件:

SOLR_INSTALL=true

JAVA_HOME=/data/jdk

SOLR_DOWNLOAD_URL=http://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/8.3.0/solr-8.3.0.tgz     #solr下载地址

SOLR_INSTALL_FOLDER=/data/solr   #安装目录,这个随意

SOLR_RANGER_HOME=/data/solr/ranger_audit_server

SOLR_RANGER_PORT=6083   #默认端口

SOLR_DEPLOYMENT=standalone  #部署模式(单节点部署),还有solrcloud(集群)模式

SOLR_RANGER_DATA_FOLDER=/data/solr/ranger_audit_server/data   #数据存放目录

官方文档在配置的时候是配置的/data1/hadoop/ranger/ranger/security-admin/contrib/solr_for_audit_setup这个目录下的install.properties文件,也就是在源码的配置文件中修改。

(2) 初始化solr

在当前目录下执行setup.sh进行初始

#./setup.sh

4、初始化ranger-admin

# cd /data/ranger/ranger-2.1.-SNAPSHOT-admin
#./setup.sh

如果初始化ok,启动admin

如果执行的过程中报:

SQLException : SQL state: 42000 com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Access denied for user 'root'@'%' to database 'ranger' ErrorCode: 1044

连接数据库,执行:

UPDATE mysql.user SET Grant_priv='Y', Super_priv='Y' WHERE User='root';

5、启动ranger-admin

#ranger-admin start 或者 #./ews/ranger-admin-services.sh start  启动服务

Ranger的默认端口是6080,如果需要修改,请修改install.properties配置文件。

查看当前的端口信息:

浏览器连接测试:http://192.168.4.50:6080

登录界面用户名和密码为: admin/admin

登录进去以后界面如下:

接下来,配置其他的比如策略等等就在这里面配置就可以了。

当然需要同步用户的话,还需要配置userSync或者ldap等等组件

借鉴:

https://www.jianshu.com/p/d9941b8687b7

官网

最新文章

  1. Tokudb 参数优化
  2. 掌握Thinkphp3.2.0----连贯操作
  3. 非对称加密算法-RSA
  4. git 新建项目
  5. ural 1156. Two Rounds
  6. 2014多校第四场1005 || HDU 4901 The Romantic Hero (DP)
  7. Linux 基本命令(持续更新ing)
  8. winform登陆 记住用户名 代码
  9. 多个haproxy 之间跳转
  10. oracle 密码文件文件
  11. [置顶] cuzy sdk之起源
  12. hibernate第二天
  13. SpringBoot整合Sqlite数据库流程
  14. JAVA高级-面试题总结
  15. selenium中maven的使用
  16. 【LeetCode每天一题】Jump Game(跳跃游戏)
  17. Codeforces 377A - Maze
  18. html (第四本书第六章盒子模型参考)
  19. NBT(NetBIOS Over TCP)名称解析概述
  20. maven依赖信息获取

热门文章

  1. NMS(non maximum suppression,非极大值抑制)
  2. 打开文件报“EFailed to load resource: net::ERR_FILE_NOT_FOUND”错误
  3. Android为TV端助力之QQ空间热更新技术
  4. React-Native中使用到的一些JS特性
  5. mysql DDL数据定义语言
  6. 11g包dbms_parallel_execute在海量数据处理过程中的应用
  7. MySQL Replication--半同步复制(Semi-Sync Replication)
  8. 使用三层交换实现不同网段、不同 VLAN 互通
  9. Trunk 实现跨交换机 VLAN 通信
  10. K8S 部署 ingress-nginx 配置 https