安装前置
确认满足以下前置:
1.CM/CDH5.1.0或以上。
2.如果需要配置Sentry高可用,需要使用CM/CDH5.13.0以上。
3.如果需要配置Sentry高可用,需要准备一个关系型数据库用以保存Sentry的权限信息,而不是一个平面文件(flat file)。
4.使用的Java必须已经修复JDK-8055949。
https://bugs.openjdk.java.net/browse/JDK-8055949
5.HiveServer2和Hive Metastore(HMS)必须以强认证的方式运行。对于HiveServer2,强认证你可以选择Kerberos或者LDAP。对于Hive Metastore,只有Kerberos才是强认证的方式。
6.如果你需要将Impala与Sentry一起集成使用。Impala必须是1.4.0或更高版本,并且以强认证的方式运行。对于Impala,强认证你可以选择Kerberos或者LDAP。
7.如果你需要将Solr与Sentry一起集成使用,Sentry服务必须配置数据库。从CDH5.1.0开始才支持Solr,以下是不同版本的一些不同的特性:
a)CDH5.1.0开始支持基于策略文件的Sentry使用。注意你不能使用策略文件来配置Sentry的高可用,因为Sentry的高可用需要使用数据库。
b)CDH5.5.0开始支持基于配置的Sentry使用。
c)从CDH5.8.0开始支持基于关系型数据库的Sentry服务安装与使用。
8.集群已经启用Kerberos。
2
性能指南
使用以下指南可获得最佳性能:
1.在Sentry中创建大量角色可能会从各方面降低Sentry性能。使用5,000个或更少的角色以获得最佳性能。
2.HMS的heap size至少配置为10GB。默认需要这么多,因为Sentry需要使用12个连接与HMS进行通信。要检查HMS的heap size,从CM打开Hive服务,点击Configuration选项卡,然后搜索Java Heap Size of Hive Metastore Server in Bytes属性。
3.Cloudera建议对于每个Sentry主机,Hive数据库中每一百万个对象需要为Sentry服务配置2.25 GB内存。Hive对象包括server,数据库,表,分区,列,URI和视图。
确保将JVM的heap size设置为适合内存要求的值。你可以在Cloudera Manager中检查heap size。进入Sentry服务,单击Configuration选项卡,然后搜索Java Heap Size of Sentry Server in Bytes属性。将该属性设置为合适的值。
随着Hive数据库中对象数量的增加,Sentry所需的内存会线性增加。下图显示了基于Hive对象数量的Sentry所需的内存。
4.您可以配置Sentry一次从HMS提取的notification数量,以减少一次性获取所有HMS notification的开销。这在运行大型DDL作业时特别有用。要配置notification的数量,请在Cloudera Manager中打开Sentry服务,然后查看Configuration选项卡。搜索Sentry Service Advanced Configuration Snippet (Safety Valve) for sentry-site.xml属性。点击+号增加一个新参数。在Name字段中输入sentry.hms.fetch.size。在Value字段中,输入您希望Sentry一次获取的事件数。例如,如果Sentry需要获取1000个事件,则可以在Value字段中输入100,这样Sentry会分10次每次获取100个事件,而不是一次性获取1000个事件。
3
使用Cloudera Manager安装Sentry服务
3.1
在MariaDB中创建数据库
create database sentry default character set utf8;
CREATE USER 'sentry'@'%' IDENTIFIED BY 'password';
GRANT ALL PRIVILEGES ON sentry. * TO 'sentry'@'%';
FLUSH PRIVILEGES;
3.2
安装Sentry服务
1.进入Cloudera Manager主页点击“添加服务”。
2.在向导页面选择Sentry服务,点击“继续”。
3.选择一台节点作为Sentry Server,Gateway可以选择集群内所有主机,点击“继续”。
注意:您只能为Sentry Server选择一个主机。添加Sentry服务完成后,可以在启用高可用性时添加其他主机。
4.输入前面在MariaDB中创建的Sentry数据库名字与用户/密码,点击“测试连接”。
测试连接数据库成功后,点击“Continue”。
5.等待Sentry服务第一次运行并启动成功。
等待运行成功后,点击“继续”。
6.点击“完成”。
7.回到Cloudera Manager主页发现Sentry服务运行正常,显示为绿色。
自此Sentry服务安装完毕。