Elasticsearch 作为一个搜索引擎,我们对它的基本要求就是存储海量数据并且可以在非常短的时间内查询到我们想要的信息。所以第一步我们需要保证的就是 Elasticsearch 的高可用性,什么是高可用性呢?它通常是指,通过设计减少系统不能提供服务的时间。假设系统一直能够提供服务,我们说系统的可用性是 100%。如果系统在某个时刻宕掉了,比如某个网站在某个时间挂掉了,那么就可以它临时是不可用的。所以,为了保证 Elasticsearch 的高可用性,我们就应该尽量减少 Elasticsearch 的不可用时间。
针对一个索引,Elasticsearch 中其实有专门的衡量索引健康状况的标志,分为三个等级:
如果你只有一台主机的话,其实索引的健康状况也是 yellow,因为一台主机,集群没有其他的主机可以防止副本,所以说,这就是一个不健康的状态,因此集群也是十分有必要的。
另外,既然是群集,那么存储空间肯定也是联合起来的,假如一台主机的存储空间是固定的,那么集群它相对于单个主机也有更多的存储空间,可存储的数据量也更大。
接下来我们再来了解下集群的结构是怎样的。
首先我们应该清楚多台主机构成了一个集群,每台主机称作一个节点(Node)。
如图就是一个三节点的集群:
在图中,每个 Node 都有三个分片,其中 P 开头的代表 Primary 分片,即主分片,R 开头的代表 Replica 分片,即副本分片。所以图中主分片 1、2,副本分片 0 储存在 1 号节点,副本分片 0、1、2 储存在 2 号节点,主分片 0 和副本分片 1、2 储存在 3 号节点,一共是 3 个主分片和 6 个副本分片。同时我们还注意到 1 号节点还有个 MASTER 的标识,这代表它是一个主节点,它相比其他的节点更加特殊,它有权限控制整个集群,比如资源的分配、节点的修改等等。
这里就引出了一个概念就是节点的类型,我们可以将节点分为这么四个类型:
登录到每一台服务器,修改内核参数
vi /etc/sysctl.conf
修改以下参数,如果没有,则添加
vm.max_map_count=262144
刷新参数
sysctl -p
docker run -d \
--name=elasticsearch \
--restart=always \
-p 9200:9200 \
-p 9300:9300 \
-e node.name=node-1 \
-e network.publish_host=192.168.31.149 \
-e network.host=0.0.0.0 \
-e discovery.seed_hosts=192.168.31.149,192.168.31.181,192.168.31.233 \
-e cluster.initial_master_nodes=192.168.31.149,192.168.31.181,192.168.31.233 \
-e cluster.name=es-cluster \
-e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
elasticsearch:7.5.1
环境变量说明:
docker run -d \
--name=elasticsearch \
--restart=always \
-p 9200:9200 \
-p 9300:9300 \
-e node.name=node-2 \
-e network.publish_host=192.168.31.181 \
-e network.host=0.0.0.0 \
-e discovery.seed_hosts=192.168.31.149,192.168.31.181,192.168.31.233 \
-e cluster.initial_master_nodes=192.168.31.149,192.168.31.181,192.168.31.233 \
-e cluster.name=es-cluster \
-e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
elasticsearch:7.5.1
注意:修改node.name和network.publish_host参数即可
docker run -d \
--name=elasticsearch \
--restart=always \
-p 9200:9200 \
-p 9300:9300 \
-e node.name=node-3 \
-e network.publish_host=192.168.31.233 \
-e network.host=0.0.0.0 \
-e discovery.seed_hosts=192.168.31.149,192.168.31.181,192.168.31.233 \
-e cluster.initial_master_nodes=192.168.31.149,192.168.31.181,192.168.31.233 \
-e cluster.name=es-cluster \
-e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
elasticsearch:7.5.1
注意:修改node.name和network.publish_host参数即可
默认的elasticsearch不允许跨域,因此elasticsearch head插件无法连接。需要修改配置文件才行!
拷贝数据文件
登录node-1,node-2,node-3分别执行:
mkdir -p /data/elk7
docker cp elasticsearch:/usr/share/elasticsearch /data/elk7/
编辑配置文件
vi /data/elk7/elasticsearch/config/elasticsearch.yml
内容如下:
cluster.name: "docker-cluster"
network.host: 0.0.0.0
http.cors.enabled: true
http.cors.allow-origin: "*"
重启eelasticsearch
本文系作者在时代Java发表,未经许可,不得转载。
如有侵权,请联系nowjava@qq.com删除。