Apache Cassandra是一个高度可扩展的开源数据库系统,在多节点设置上实现了出色的性能。
在本教程中,您将学习如何安装和使用Cassandra在Ubuntu 14.04上运行多节点集群。
因为您即将构建一个多节点Cassandra集群,所以您必须确定您希望在集群中拥有多少台服务器并配置它们。建议但不要求它们具有相同或相似的规格。
要完成本教程,您需要以下内容:
Cassandra集群中的服务器称为节点。您现在在每台服务器上拥有的是单节点Cassandra集群。在此步骤中,我们将设置节点以用作多节点Cassandra集群。
必须在群集中的每个节点上重复此步骤和后续步骤中的所有命令,因此请确保打开的终端数与群集中的节点数一样多。
您将在每个节点上运行的第一个命令将停止Cassandra守护程序。
sudo service cassandra stop
完成后,删除默认数据集。
sudo rm -rf /var/lib/cassandra/data/system/*
Cassandra的配置文件位于/etc/cassandra
目录中。该配置文件cassandra.yaml
包含许多指令,并且评论很好。在此步骤中,我们将修改该文件以设置群集。
只需修改以下指令即可设置多节点Cassandra集群:
cluster_name
:这是您的群集的名称。-seeds
:这是以逗号分隔的群集中每个节点的IP地址列表。listen_address
:这是群集中的其他节点将用于连接到此节点的IP地址。它默认为localhost,需要更改为节点的IP地址。rpc_address
:这是远程过程调用的IP地址。它默认为localhost。如果正确配置了服务器的主机名,请保持原样。否则,请更改为服务器的IP地址或环回地址(127.0.0.1
)。endpoint_snitch
:snitch的名字,这是告诉Cassandra它的网络是什么样的。默认为SimpleSnitch,用于一个数据中心的网络。在我们的例子中,我们将其更改为GossipingPropertyFileSnitch,这是生产设置的首选。auto_bootstrap
:该指令不在配置文件中,因此必须添加并设置为false。这使新节点自动使用正确的数据。如果要将节点添加到现有群集,则它是可选的,但在初始化新群集(即没有数据的群集)时需要。使用nano
或您喜欢的文本编辑器打开配置文件进行编辑。
sudo nano /etc/cassandra/cassandra.yaml
在文件中搜索以下指令,并按如下所示修改它们以匹配您的群集。替换your_server_ip
为您当前正在处理的服务器的IP地址。每个服务器上的列表- seeds:
应该相同,并且将包含用逗号分隔的每个服务器的IP地址。
. . .
cluster_name: 'CassandraDOCluster'
. . .
seed_provider:
- class_name: org.apache.cassandra.locator.SimpleSeedProvider
parameters:
- seeds: "your_server_ip,your_server_ip_2,...your_server_ip_n"
. . .
listen_address: your_server_ip
. . .
rpc_address: your_server_ip
. . .
endpoint_snitch: GossipingPropertyFileSnitch
. . .
在文件的底部,auto_bootstrap
通过粘贴此行添加指令:
auto_bootstrap: false
完成修改文件后,保存并关闭它。对要包含在群集中的所有服务器重复此步骤。
此时,已配置群集,但节点未进行通信。在此步骤中,我们将配置防火墙以允许Cassandra流量。
首先,重新启动Cassandra守护程序。
sudo service cassandra start
如果检查群集的状态,您将发现只列出了本地节点,因为它还无法与其他节点通信。
sudo nodetool status
Datacenter: datacenter1
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
-- Address Load Tokens Owns Host ID Rack
UN 192.168.1.4 147.48 KB 256 ? f50799ee-8589-4eb8-a0c8-241cd254e424 rack1
Note: Non-system keyspaces don't have the same replication settings, effective ownership information is meaningless
为了允许通信,我们需要为每个节点打开以下网络端口:
7000
,这是命令和数据的TCP端口。9042
,这是本机传输服务器的TCP端口。Cassandra命令行实用程序cqlsh
将通过此端口连接到群集。要修改防火墙规则,请打开IPv4的规则文件。
sudo nano /etc/iptables/rules.v4
在INPUT链中复制并粘贴以下行,这将允许上述端口上的流量。如果您正在使用防火墙教程中的文件rules.v4
,则可以在# Reject anything that's fallen through to this point
注释之前插入以下行。
指定的IP地址-s
应该是群集中另一个节点的IP地址。如果你有一个IP地址的两个节点111.111.111.111
和222.222.222.222
,在对规则111.111.111.111
的机器应该使用的IP地址222.222.222.222
。
新防火墙规则
-A INPUT -p tcp -s your_other_server_ip -m multiport --dports 7000,9042 -m state --state NEW,ESTABLISHED -j ACCEPT
添加规则后,保存并关闭文件,然后重新启动IPTables。
sudo service iptables-persistent restart
我们现在已经完成了将节点变为多节点集群所需的所有步骤。您可以通过检查其状态来验证他们是否都在进行通信。
sudo nodetool status
Datacenter: datacenter1
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
-- Address Load Tokens Owns Host ID Rack
UN 192.168.1.4 147.48 KB 256 ? f50799ee-8589-4eb8-a0c8-241cd254e424 rack1
UN 192.168.1.6 139.04 KB 256 ? 54b16af1-ad0a-4288-b34e-cacab39caeec rack1
Note: Non-system keyspaces don't have the same replication settings, effective ownership information is meaningless
如果您可以看到您配置的所有节点,那么您刚刚成功设置了一个多节点Cassandra集群。
您还可以使用cqlsh
Cassandra命令行客户端检查是否可以连接到群集。请注意,您可以为此命令指定群集中任何节点的IP地址。
cqlsh your_server_ip 9042
你会看到它连接:
Connected to My DO Cluster at 192.168.1.6:9042.
[cqlsh 5.0.1 | Cassandra 2.2.3 | CQL spec 3.3.1 | Native protocol v4]
Use HELP for help.
cqlsh>
然后你可以退出CQL终端。
exit
恭喜!您现在在Ubuntu 14.04上运行了一个多节点Cassandra集群。如果需要对群集进行故障排除,则首先查找线索位于/var/log/cassandra
目录中的日志文件。
想要了解更多关于使用Cassandra运行多节点群集数据库的相关教程,请前往腾讯云+社区学习更多知识。
参考文献:《How To Run a Multi-Node Cluster Database with Cassandra on Ubuntu 14.04》
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。