为什么需要使用ES进行搜索。 ES除了索引的优点之外,最重要的就是数据的结构。
这就是为什么 ES 效率很高,并且被使用的原因。 1、结构化数据VS非结构化数据结构化数据:也叫行数据,由关系型数据库存储和管理,是用二维表结构(可以用行和列来表示)进行逻辑表达和实现的数据,严格来说遵循数据格式和长度规范。
非结构化数据:也可以称为全文数据。它没有固定的长度或固定的格式,不适合用二维数据库表来表示。
它包括所有格式的office文档、XML、HTML、word文档、电子邮件、各种报告和图片。其他区别:结构化数据占用空间较小,约占企业数据的20%,且易于管理。
非结构化数据通常占用较多的存储空间,约占企业数据的80%,管理起来也比较困难。结构化数据 vs. 非结构化数据 2. 结构化搜索 vs. 全文搜索 结构化搜索:通常查询都有固有的结构数据,答案要么是要么不是(即使对于像正则匹配这样的结构化搜索,正则表达式匹配数据也是一定的),数据要么属于查询结果集,要么不属于。
全文检索:通常会查询全文字段/文档的所有内容。答案返回一系列可能的数据,并且该数据有一定的概率属于结果集。
至此,为什么需要使用ES进行搜索的答案就很明确了:对于非结构化文本(比如评论内容),传统的结构化搜索无法满足需求,所以会使用ES进行全文搜索。当然,ES不仅可以进行全文搜索,还可以进行部分结构化搜索,这进一步扩大了其应用范围。
对于数据量巨大的场景,一些公司会使用ES而不是传统的MySQL来管理数据。 ES基本概念介绍本次总结主要介绍ES的一些基本概念。
目的是为了方便之前没有了解ES的同学能够理解本次分享中介绍的内容。 1、ES存储模型 ES在设计存储模型时,考虑到了从关系型数据库转换时可能出现的困难,因此分别设计了Index、Type、Document、Field来对应传统关系型数据库对应的Database(如MySQL)。
、表、行、列。注意:ES存储时,没有Type的概念。
同一索引中的类型将被扁平存储。这种抽象只是为了方便用户理解而提供给用户的。
由于Type的存在会带来一些问题,因此在后续版本中会逐渐移除。ES与SQL数据库的比较 2、ES与Lucene的底层是基于Lucene开发的,以Lucene为核心,实现索引和搜索功能。
虽然我们说的是ES,但是很大一部分内容是Lucene的实现。
站长声明
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件
举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
-
投资界(ID:pedaily)8月6日获悉,爱酷正式宣布公司升级为梦饷集团。 在流量去中心化趋势下,梦饷集团致力于成为新型电商基础设施提供商,为流量个人和企业提供数字化商店与综合商品服务相结合的整体解决方案。 升级后,梦饷集团涵盖评级商店、爱坤等业务。 其中,Rating S
06-17
-
微创医疗宣布分拆公司信通医疗已确定分拆股份最终发行情况关闭公司在全球销售。 售价为每股12.20港元。 假设全球发售按照目前时间表完成,分拆公司预计将于2020年2月4日在联交所主板上市,分拆公司股份将在联交所主板上市交易。 每手分拆公司股票。
06-17
-
这次是武汉。 投资界获悉,汽车级芯片公司芯清科技本周宣布,已于今年四季度完成总额近5亿元的A+轮融资。 这也是年内实现的第三轮融资,估值超70亿,成为新独角兽。 本轮融资,泰达投资、海尔资本、上海浦东国际、武汉创新投资、同曦资本参与投资;现有股东国盛资本、越秀产业
06-17
-
近日,中国金融科学院发布《以数字化引领数实融合的内在机理与现实思考》研究报告,总结了用数字化引领从工业互联网平台建设和发展的数据来看。 真实融合的典型模式。 报告指出,数实融合不断消解数字经济与实体经济的界限。 在此过程中,工业互联网平台是不可或缺的载体。 只
06-17
-
这是36氪持续关注的公司。 “维卡维格”成立于年底,是一家专注于底层软件技术创新的公司。 该公司是多维表的先驱。 其核心产品“维格表vika.cn”是一款面向API的智能多维表,定位为新一代企业数据协作工具。 维格彪已于2020年4月发布内测版本,并??于2020年10月正式启动公测
06-18
-
如果你在办公室或者去办公室的路上,请先回家。 大多数工人看到这句话都会感到高兴。 毕竟以前,公司只是在发生一些意外的天气变化之后,才会通知你在家办公。 作为一名工人,我基本上讨厌在家工作。 通勤成本0,工作灵活自由。 但当 Twitter 员工看到这句话时,他们只是想—
06-21
-
最近浏览新闻时,一则新闻引起了我的注意:免费杀毒软件Avast宣布与Windows 11完全兼容。 最新版本Avast 21.9可以更好地保护您在Windows 11上的计算机。 当我看到这个时消息一出,我的思绪飘到了2000年,当时《永恒之蓝》风靡全球。 自此之后,我似乎再也没有听说过全球性的计
06-21
-
上海提出用5至10年时间逐步打造科技交易中心枢纽,成为各大媒体的头条新闻。 近日,上海市人民政府颁布《上海市建设具有全球影响力的科技创新中心“十四五”规划》。 《规划》提出基础研究要逐步取得突破,增强关键核心技术竞争力,加快科技成果转化。 通过5至10年的努力,逐
06-17
-
据投资界9月8日消息,弘量研究院有限公司(以下简称“弘量研究院”)宣布完成A+轮融资,领投机构由中银国际渤海兴旺下属投资机构管理,L.P.基金、阿里巴巴香港创业者基金等投资者也参与投资。 据了解,弘量研究院今年6月获得数百万美元A轮投资,投资机构为阿里巴巴香港创
06-18
-
近48小时内,国内市场共发生4起投资披露事件,其中,有1起企业服务(南墙上的法务)、汽车交通1个案例(威驰腾汽车)、本地生活1个案例(云翔宜兴)、农业1个案例(中捷四方)。 详情 企业服务公司法务服务商【南强法务】完成天使轮融资,融资金额1万元。 点击查看汽车及交通
06-18
-
投资界(ID:pedaily)1月25日消息,深圳大德激光技术有限公司(以下简称深圳大德激光) )近日宣布,已成功完成数千万元股权融资。 本次融资由星光投资独家投资,庚鑫资本作为独家投资方,为公司激光技术创新和市场拓展注入新的资金和动力。 深圳大德激光是一家领先的激光技
06-18
-
中国大陆晶圆产能近年来增长迅速,但在产能利用率方面仍落后于台湾、韩国和日本单位时间的产出。 7月13日,知名半导体咨询机构ICInsights发布年度全球晶圆月度产能报告(按地理区域)。 下图为截至今年12月全球各地区晶圆产能情况。 ICInsights 按地点而非公司总部划分产能。
06-08
最新文章
【玩转GPU】ControlNet初学者生存指南
【实战】获取小程序中用户的城市信息(附源码)
包雪雪简单介绍Vue.js:开学
Go进阶:使用Gin框架简单实现服务端渲染
线程池介绍及实际案例分享
JMeter 注释 18 - JMeter 常用配置组件介绍
基于Sentry的大数据权限解决方案
【云+社区年度征文集】GPE监控介绍及使用