首页 > 网络技术迭代 > 内容

从0到1

发布于：2024-10-24 编辑：匿名来源：网络

1了解ElasticSearch文档写入和检索的原理。 elasticsearch基本概念节点（Node）：物理概念，一个运行的elasticsearch实例，通常是机器上的一个进程，用于存储数据并参与集群索引和搜索。

可以分为以下几种：专用主节点（Master Node）：为了保证集群的稳定性，主节点和数据节点是分开的。主要职责是执行与集群相关的操作，例如创建和删除索引，以及跟踪哪些节点。

是集群的一部分，决定将哪些分片分配给相关节点。在大规模集群中，开启专用Master Node可以增强集群的稳定性。

协调节点：该节点仅处理路由请求、处理搜索、分发索引文件。它相当于一个负载均衡器。

协调器节点将请求分发到存储数据的数据节点。每个Data Node在本地执行请求，并将请求结果返回给Coordinator Node。

协调节点收集数据后，会将每个节点的数据合并为一个全局结果。数据节点：存储索引数据的节点，主要进行文档的增、删、改、聚合等操作。

数据节点对CPU、内存、IO要求较高。在优化过程中，需要监控数据节点的状态。

当资源不足时，需要向集群中添加新的节点。索引：逻辑概念。

索引是具有相同特征的文档的集合（相当于关系数据库），包括配置信息映射和倒排、正向数据文件。索引的数据文件可能分布在一台机器上。

也可以将其分布在多台机器上。类型：类型通常是索引的一个逻辑分区，允许不同类型的文档存储在一个索引下（相当于关系数据库中的一张表）。

在6.x版本中，只允许一个Index包含一种Type。这个概念将在 7.x 之后被删除。

文档：文档是可以索引的基本信息单元（相当于关系数据库中的一行数据）。文档可以用 Json 格式表示。

映射：Schema映射（相当于关系数据库的Schema）用于定义索引结构。 Field：字段是Elasticsearch中的最小单位，相当于数据库中的列，类似于Json中的key。

分片：为了支持更大的数据量，一般将索引按照一定的维度划分为多个部分。每个部分都是一个分片，分片由 Node 管理。

一个Node一般管理多个分片，但为了可靠性和可用性，相同索引的分片应尽可能分布在不同的Node上。分片有两种类型：主分片和副本分片。

分片数量只能在创建索引时指定，创建后无法更改。每个分片的大小建议小于50G，因此在设计分片时，提前预估数据量，设置合适的分片。

Replica：同一个分片（Shard）的备份数据。一个分片可能有 0 个或多个副本。

这些副本中的数据保证强一致性或最终一致性。 2.Elasticsearch集群架构 2.1．分层部署通过配置隔离Master Node和Data Node。

代码语言：javascript copy #主节点配置node.name: masternode.master: truenode.data: false #数据节点配置node.name:node1node. master: falsenode.data: true 分层部署图2.2，混合部署 Master Node也是Data Node，Master Node通过集群选举产生。选举策略discovery.zen.minimum_master_nodes = (master_eligible_nodes / 2) + 1 混合部署图3、Elasticsearch文档写入原理 3.1、文档写入流程文档写入流程图假设选择Node2（DataNode）发送写入Index1的请求指数。

此时Node2可以称为协调节点（Coordinating Node）； Coordinaing Node会根据算法（shard id的计算公式：shard_num = hash(_routing) % num_primary_shards，哈希函数为murmur3Hash，_routing默认为文档ID（_id））进行路由，将请求发送到对应的DataNode。假设对应的主分片为P1；请求数据写入进入P1；数据同步到R1；返回数据写入结果。

3.2.文档存储 3.2.1。文档存储结构每个Elasticsearch shard都是一个Lucene索引（Index）。

每个Lucene包含多个段（segment）。每个段都有多个文档（Documents）和维护。

获得术语与文档ID之间关系的倒排索引（Inverted Index）数据。文档存储结构如下图所示：文档存储结构图 3.2.2、倒排索引存储倒排索引存储流程图从内存缓冲区到磁盘页缓存的过程对应ElasticSearch的refresh() API，即默认每1秒触发一次。

;从磁盘页面缓存到磁盘的过程对应ElasticSearch的flush() API，默认每30分钟触发一次； translog本身从磁盘页缓存到磁盘的持久化是5s一次。 3.2.3.段合并段小文件合并过程图自动刷新过程每秒创建一个新段，每个段消耗文件句柄；小段合并成大段，然后这些大段再合并成更大的段（小于5G）；打开新段进行搜索，并删除旧段。

4.Elasticsearch检索原理文档检索流程图。如果选择Node3，则Node3称为协调节点。

协调节点将查询请求广播到各个数据节点，这些数据节点的分片将处理该查询。查询请求。

每个分片进行数据查询，将符合条件的数据放入优先级队列中，并将这些数据的文档ID、节点信息以及分片信息返回给协调节点。协调节点汇总所有结果并进行全局排序。

协调节点向包含这些文档ID的分片发送get请求，对应的分片将文档数据返回给协调节点，最后协调节点将数据返回给客户端。

站长声明

标签：

上一篇：Golang中有多少种并发控制方法？ Go语言中的

下一篇：万物皆可Serverless——我的Serverless之路

互联网教育品牌“道远课堂”完成1000万元A轮融资，由新金创投领投

据投资界3月29日消息，近日，互联网教育品牌“道远课堂”完成1000万元A轮融资。元A轮融资，由新金创投领投。本轮融资将主要用于教学产品开发。道远课堂今年10月获得青松基金天使轮融资。　　道远课堂由北京大学曾道远先生于2006年创办，主要为高中生提供高考冲刺课程。

06-18
牧鸟短租宣布完成数千万元B2轮融资，由华冠资本领投

据投资界5月8日消息，国内民宿预订平台牧鸟短租宣布完成获得华冠资本领投的数千万元B2轮融资。投资方面，大辰创投、梅花创投紧随其后。当被问及融资计划时，木鸟短租CEO黄越表示，“新一轮融资资金将主要用于继续扩建四木住房、加强线上运营服务。面对旅游消费升级，用户

06-17
云楚新能源再获PreA+轮超亿元融资 -兰驰世家

近日，“云楚新能源”正式完成PreA+轮超亿元融资。本次融资由正海集团、深圳健和、水木清华校友基金、天域九五、水木梧桐等机构共同出资。本轮融资将主要用于新产品研发、核心能力建设、市场开拓等，支持云存储持续提升技术、产品和行业竞争力。兰驰创投是云储新能源PreA轮

06-18
上市公司进军P2P融资？股价炒作？占个坑？

在P2P公司纷纷出走的同时，上市公司却不断涌入，行业的热潮吸引了资本的关注，催生了各种新的游戏玩法。　　上市公司进军P2P，融资？股价炒作？占个坑？　　上市公司大规模进入P2P，标志着行业竞争已从低门槛的无序发展，演变为大规模的资本竞争，逐渐行业规范化，　　最终

06-18
北京大兴经济开发区管委会关于印发《大兴区关于促进大兴经济开发区数字经济发展暂行办法》

京兴经济管理文件[]45号　　有关单位：　　为抢抓数字化发展机遇按照《北京市关于加快建设全球数字经济标杆城市的实施方案》、《大兴区促进产业高质量发展的指导意见》、等文件精神，精准引进培育数字经济企业，聚焦新一代软件创新基地，打造千亿级数字经济产业集群等文件，《

06-18
创业24小时投融资版-11月18日总结

11月18日投融资事件总结及详情。今日国内市场共发生投资事件34起，其中企业服务5起、金融4起、先进制造4起、本地生活3起、制造业2起、体育1起、智能硬件4起、医疗健康5个案例、教育1个案例、区块链1个案例、旅游1个案例、汽车交通1个案例、游戏1个案例。，物流从1开始。细

06-17
中金公司预计2020年归属母公司股东净利润同比增长60%以上

香港上市公司中金公司（8.HK）近日发布公告称，公司预计实现净利润归属于上市公司股东的利润为680亿元至75亿元，同比增长61.08%至78.18%。听，中小企业反馈平台。倾听用户需求，倾听创业者声音，解决中小企业痛点。点击立即参与调查并获得礼物。

06-18
苹果全新自研芯片：最高40核CPU

苹果发布了自研处理器，包括M1、M1 Max和M1 Pro，并用于iPad Pro、Macbook和iMac。根据年度更新进度来看，毫无疑问，苹果今年将会更新M系列芯片。据此前消息，从今年开始，苹果将对专为工作站打造的Mac Pro从原来的英特尔处理器进行升级。它将被自研的M系列处理器所取代，

06-06
福建莆田百亿产业基金旗下基金启动第二批子基金评选

福建莆田百亿产业基金旗下基金启动第二批子基金评选。兴莆田产业基金是莆田市委、市政府领导下设立的首个产业母基金。基金成立半年多来，经过层层筛选和专业尽职调查决策，首批四只市场化、专业化、投资策略不同的子基金已在莆田市设立并进入投资时期。星浦产业基金投资取

06-17
精客在线获青松基金新一轮数千万元融资

据投资界（ID：pedaily）4月22日消息，新高考赛道领军品牌精客在线，近期完成千万级Pre-A轮融资。人民币融资，本轮融资由青松基金投资，多鲸资本担任独家保荐人。此次融资将用于OMO产品研发、市场拓展、团队扩张等。据了解，这是京客在线四个月内的第二轮融资。此前已获

06-17
核系统科技已完成数千万Pre-A轮融资，蓝驰创投、新微资本联合领投

投资界9月9日消息，近日，核系统科技宣布完成千万轮融资。 Pre-A轮融资，本轮融资由蓝驰创投、新微资本联合领投。此前，芯来科技已获得晶晨、芯原、启迪之星创投的天使轮投资。芯来科技是中国领先的RISC-V处理器核IP和解决方案公司。专注于RISC-V处理器内核的研发，推出了

06-17
《深圳市南山区产业发展投资引导基金管理办法（2023年修订）》征求意见

投资界消息（ID：pedaily），8月30日，深圳市南山区国有资产监督管理局发布公告。为进一步健全和完善我区引导基金管理工作，根据政府投资基金管理相关规定，结合南山区实际情况，区国有资产监督管理局会同区国有企业汇通金控公司对原《南山区产业发展投资引导基金管理办法》

06-17