从0到1

发布于:2024-10-24 编辑:匿名 来源:网络

1了解ElasticSearch文档写入和检索的原理。 elasticsearch基本概念 节点(Node):物理概念,一个运行的elasticsearch实例,通常是机器上的一个进程,用于存储数据并参与集群索引和搜索。

可以分为以下几种: 专用主节点(Master Node):为了保证集群的稳定性,主节点和数据节点是分开的。主要职责是执行与集群相关的操作,例如创建和删除索引,以及跟踪哪些节点。

是集群的一部分,决定将哪些分片分配给相关节点。在大规模集群中,开启专用Master Node可以增强集群的稳定性。

协调节点:该节点仅处理路由请求、处理搜索、分发索引文件。它相当于一个负载均衡器。

协调器节点将请求分发到存储数据的数据节点。每个Data Node在本地执行请求,并将请求结果返回给Coordinator Node。

协调节点收集数据后,会将每个节点的数据合并为一个全局结果。数据节点:存储索引数据的节点,主要进行文档的增、删、改、聚合等操作。

数据节点对CPU、内存、IO要求较高。在优化过程中,需要监控数据节点的状态。

当资源不足时,需要向集群中添加新的节点。索引:逻辑概念。

索引是具有相同特征的文档的集合(相当于关系数据库),包括配置信息映射和倒排、正向数据文件。索引的数据文件可能分布在一台机器上。

也可以将其分布在多台机器上。类型:类型通常是索引的一个逻辑分区,允许不同类型的文档存储在一个索引下(相当于关系数据库中的一张表)。

在6.x版本中,只允许一个Index包含一种Type。这个概念将在 7.x 之后被删除。

文档:文档是可以索引的基本信息单元(相当于关系数据库中的一行数据)。文档可以用 Json 格式表示。

映射:Schema映射(相当于关系数据库的Schema)用于定义索引结构。 Field:字段是Elasticsearch中的最小单位,相当于数据库中的列,类似于Json中的key。

分片:为了支持更大的数据量,一般将索引按照一定的维度划分为多个部分。每个部分都是一个分片,分片由 Node 管理。

一个Node一般管理多个分片,但为了可靠性和可用性,相同索引的分片应尽可能分布在不同的Node上。分片有两种类型:主分片和副本分片。

分片数量只能在创建索引时指定,创建后无法更改。每个分片的大小建议小于50G,因此在设计分片时,提前预估数据量,设置合适的分片。

Replica:同一个分片(Shard)的备份数据。一个分片可能有 0 个或多个副本。

这些副本中的数据保证强一致性或最终一致性。 2.Elasticsearch集群架构 2.1.分层部署通过配置隔离Master Node和Data Node。

代码语言:javascript copy #主节点配置node.name: masternode.master: truenode.data: false #数据节点配置node.name:node1node. master: falsenode.data: true 分层部署图2.2,混合部署 Master Node也是Data Node,Master Node通过集群选举产生。选举策略discovery.zen.minimum_master_nodes = (master_eligible_nodes / 2) + 1 混合部署 图3、Elasticsearch文档写入原理 3.1、文档写入流程 文档写入流程图 假设选择Node2(DataNode)发送写入Index1的请求指数。

此时Node2可以称为协调节点(Coordinating Node); Coordinaing Node会根据算法(shard id的计算公式:shard_num = hash(_routing) % num_primary_shards,哈希函数为murmur3Hash,_routing默认为文档ID(_id))进行路由,将请求发送到对应的DataNode。假设对应的主分片为P1;请求数据写入进入P1;数据同步到R1;返回数据写入结果。

3.2.文档存储 3.2.1。文档存储结构 每个Elasticsearch shard都是一个Lucene索引(Index)。

每个Lucene包含多个段(segment)。每个段都有多个文档(Documents)和维护。

获得术语与文档ID之间关系的倒排索引(Inverted Index)数据。文档存储结构如下图所示: 文档存储结构图 3.2.2、倒排索引存储 倒排索引存储流程图 从内存缓冲区到磁盘页缓存的过程对应ElasticSearch的refresh() API,即默认每1秒触发一次。

;从磁盘页面缓存到磁盘的过程对应ElasticSearch的flush() API,默认每30分钟触发一次; translog本身从磁盘页缓存到磁盘的持久化是5s一次。 3.2.3.段合并段小文件合并过程图自动刷新过程每秒创建一个新段,每个段消耗文件句柄;小段合并成大段,然后这些大段再合并成更大的段(小于5G);打开新段进行搜索,并删除旧段。

4.Elasticsearch检索原理文档检索流程图。如果选择Node3,则Node3称为协调节点。

协调节点将查询请求广播到各个数据节点,这些数据节点的分片将处理该查询。查询请求。

每个分片进行数据查询,将符合条件的数据放入优先级队列中,并将这些数据的文档ID、节点信息以及分片信息返回给协调节点。协调节点汇总所有结果并进行全局排序。

协调节点向包含这些文档ID的分片发送get请求,对应的分片将文档数据返回给协调节点,最后协调节点将数据返回给客户端。

从0到1

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 互联网教育品牌“道远课堂”完成1000万元A轮融资,由新金创投领投

    互联网教育品牌“道远课堂”完成1000万元A轮融资,由新金创投领投

    据投资界3月29日消息,近日,互联网教育品牌“道远课堂”完成1000万元A轮融资。 元A轮融资,由新金创投领投。 本轮融资将主要用于教学产品开发。 道远课堂今年10月获得青松基金天使轮融资。   道远课堂由北京大学曾道远先生于2006年创办,主要为高中生提供高考冲刺课程。

    06-18

  • 牧鸟短租宣布完成数千万元B2轮融资,由华冠资本领投

    牧鸟短租宣布完成数千万元B2轮融资,由华冠资本领投

    据投资界5月8日消息,国内民宿预订平台牧鸟短租宣布完成获得华冠资本领投的数千万元B2轮融资。 投资方面,大辰创投、梅花创投紧随其后。 当被问及融资计划时,木鸟短租CEO黄越表示,“新一轮融资资金将主要用于继续扩建四木住房、加强线上运营服务。 面对旅游消费升级,用户

    06-17

  • 云楚新能源再获PreA+轮超亿元融资 -兰驰世家

    云楚新能源再获PreA+轮超亿元融资 -兰驰世家

    近日,“云楚新能源”正式完成PreA+轮超亿元融资。 本次融资由正海集团、深圳健和、水木清华校友基金、天域九五、水木梧桐等机构共同出资。 本轮融资将主要用于新产品研发、核心能力建设、市场开拓等,支持云存储持续提升技术、产品和行业竞争力。 兰驰创投是云储新能源PreA轮

    06-18

  • 上市公司进军P2P融资?股价炒作?占个坑?

    上市公司进军P2P融资?股价炒作?占个坑?

    在P2P公司纷纷出走的同时,上市公司却不断涌入,行业的热潮吸引了资本的关注,催生了各种新的游戏玩法。   上市公司进军P2P,融资?股价炒作?占个坑?   上市公司大规模进入P2P,标志着行业竞争已从低门槛的无序发展,演变为大规模的资本竞争,逐渐行业规范化,  最终

    06-18

  • 北京大兴经济开发区管委会关于印发《大兴区关于促进大兴经济开发区数字经济发展暂行办法》

    北京大兴经济开发区管委会关于印发《大兴区关于促进大兴经济开发区数字经济发展暂行办法》

    京兴经济管理文件[]45号  有关单位:  为抢抓数字化发展机遇按照《北京市关于加快建设全球数字经济标杆城市的实施方案》、《大兴区促进产业高质量发展的指导意见》、等文件精神,精准引进培育数字经济企业,聚焦新一代软件创新基地,打造千亿级数字经济产业集群等文件,《

    06-18

  • 创业24小时投融资版-11月18日总结

    创业24小时投融资版-11月18日总结

    11月18日投融资事件总结及详情。 今日国内市场共发生投资事件34起,其中企业服务5起、金融4起、先进制造4起、本地生活3起、制造业2起、体育1起、智能硬件4起、医疗健康5个案例、教育1个案例、区块链1个案例、旅游1个案例、汽车交通1个案例、游戏1个案例。 ,物流从1开始。 细

    06-17

  • 中金公司预计2020年归属母公司股东净利润同比增长60%以上

    中金公司预计2020年归属母公司股东净利润同比增长60%以上

    香港上市公司中金公司(8.HK)近日发布公告称,公司预计实现净利润归属于上市公司股东的利润为680亿元至75亿元,同比增长61.08%至78.18%。 听,中小企业反馈平台。 倾听用户需求,倾听创业者声音,解决中小企业痛点。 点击立即参与调查并获得礼物。

    06-18

  • 苹果全新自研芯片:最高40核CPU

    苹果全新自研芯片:最高40核CPU

    苹果发布了自研处理器,包括M1、M1 Max和M1 Pro,并用于iPad Pro、Macbook和iMac。 根据年度更新进度来看,毫无疑问,苹果今年将会更新M系列芯片。 据此前消息,从今年开始,苹果将对专为工作站打造的Mac Pro从原来的英特尔处理器进行升级。 它将被自研的M系列处理器所取代,

    06-06

  • 福建莆田百亿产业基金旗下基金启动第二批子基金评选

    福建莆田百亿产业基金旗下基金启动第二批子基金评选

    福建莆田百亿产业基金旗下基金启动第二批子基金评选。 兴莆田产业基金是莆田市委、市政府领导下设立的首个产业母基金。 基金成立半年多来,经过层层筛选和专业尽职调查决策,首批四只市场化、专业化、投资策略不同的子基金已在莆田市设立并进入投资时期。 星浦产业基金投资取

    06-17

  • 精客在线获青松基金新一轮数千万元融资

    精客在线获青松基金新一轮数千万元融资

    据投资界(ID:pedaily)4月22日消息,新高考赛道领军品牌精客在线,近期完成千万级Pre-A轮融资。 人民币融资,本轮融资由青松基金投资,多鲸资本担任独家保荐人。 此次融资将用于OMO产品研发、市场拓展、团队扩张等。 据了解,这是京客在线四个月内的第二轮融资。 此前已获

    06-17

  • 核系统科技已完成数千万Pre-A轮融资,蓝驰创投、新微资本联合领投

    核系统科技已完成数千万Pre-A轮融资,蓝驰创投、新微资本联合领投

    投资界9月9日消息,近日,核系统科技宣布完成千万轮融资。 Pre-A轮融资,本轮融资由蓝驰创投、新微资本联合领投。 此前,芯来科技已获得晶晨、芯原、启迪之星创投的天使轮投资。 芯来科技是中国领先的RISC-V处理器核IP和解决方案公司。 专注于RISC-V处理器内核的研发,推出了

    06-17

  • 《深圳市南山区产业发展投资引导基金管理办法(2023年修订)》征求意见

    《深圳市南山区产业发展投资引导基金管理办法(2023年修订)》征求意见

    投资界消息(ID:pedaily),8月30日,深圳市南山区国有资产监督管理局发布公告。 为进一步健全和完善我区引导基金管理工作,根据政府投资基金管理相关规定,结合南山区实际情况,区国有资产监督管理局会同区国有企业汇通金控公司对原《南山区产业发展投资引导基金管理办法》

    06-17