
Elasticsearch索引入门与Lucene原理解析
下载需积分: 20 | 1.43MB |
更新于2024-07-09
| 5 浏览量 | 举报
收藏
"此资源是一个关于Elasticsearch索引的PPT介绍,适合用于项目培训,内容涉及索引的创建、管理以及文档的处理,还涵盖了Elasticsearch与Lucene的关系,字段类型的变化以及自定义分析器等核心概念。"
Elasticsearch (ES) 是一个流行的开源搜索引擎和分析平台,它基于分布式、RESTful架构,广泛应用于日志分析、实时数据分析等领域。索引是ES中的关键概念,类似于传统数据库中的表,用于存储和检索数据。
在ES中,**禁止自动创建index** 可以通过修改`config/elasticsearch.yml`配置文件实现,将`action.auto_create_index`设置为`false`。**创建index** 需要指定`number_of_shards`(主分片数)和`number_of_replicas`(副本数)。主分片数一旦设定,后期无法更改,而副本数可以在之后进行调整。**查看index** 和**删除index** 有相应的API操作,同样,可以通过API来**创建和管理type**,但ES在6.0版本后不再支持多类型(index内包含多个type)。
**document** 是ES中的基本数据单元,相当于数据库中的记录。在用户眼中,document可能是一条包含各种字段的数据;在Lucene(ES底层的全文检索库)眼中,document被转化为一系列的词汇项(token);而在ES眼中,document会被映射成特定的mapping,每个字段都有对应的类型和索引策略。
**字段类型** 在ES的新版本中发生了变化,`string`类型被替换为`text`和`keyword`。`text`字段默认进行分词处理,适用于全文搜索;而`keyword`字段则保持原样,适用于精确匹配。**字段索引** 分为三种概念:`index=true`表示字段被索引并可搜索,`index=false`则字段不被索引,无法搜索。`type=string`会先分词再索引,而`type=keyword`则直接整体索引。
**倒排索引** 是ES的核心机制,它使得快速查找匹配的文档成为可能。**自定义分析器** 可以通过`char_filter`(字符过滤)、`tokenizer`(分词器)和`filter`(词过滤器)来定制文本处理流程。例如,可以创建一个名为`my_analyzer`的自定义分析器,组合使用内置的`html_strip`字符过滤器、`standard`分词器和`my_stopwords`过滤器。
此外,ES还支持**动态映射**,这意味着在插入document时,如果包含了type中未定义的字段,系统可以根据字段的性质自动添加映射。动态映射的策略可以设置为`true`、`false`或`strict`,分别表示允许、禁止或严格检查新增字段。
这个PPT提供了全面的ES索引基础和实践指导,对于理解和掌握Elasticsearch的索引管理和数据处理非常有帮助。
相关推荐








qq_25020179
- 粉丝: 1
最新资源
- MIDP手机游戏设计:技术与实践
- 长沙市公交查询系统软件:功能与数据库结合的可行性分析
- 全球专利信息检索与申请工具:软件开发者的福音
- 清华大学官方推荐Java编程初学者教程
- 下载最新网页幻灯片代码,提升网站视觉体验
- VB6运行库DLL版:必备工具集 vbrun60_tools_04_12_21
- 跨浏览器兼容的无限树型菜单实现
- C#多线程闹钟系统开发详解
- 高效文件加密:多线程DES加解密软件
- Java网络编程详尽教程
- 定制化软件界面开发套餐V2.0
- C语言基础教程:入门必备要点讲解
- SQL编程精要:命令、查询与编辑技巧
- 解决Borland数据库引擎问题的BDE驱动程序安装指南
- 面向对象C++词法分析器设计与实现
- Linux 2.6.14内核SD卡驱动程序开发与测试
- 模糊控制仿真技术:智能控制器的强大应用
- 全面解析FoxAPI:探索最高效的API浏览器
- JSP+JavaBean留言管理系统的设计与实现
- 防止Listview列宽被鼠标调整的实现方法
- AJAX登录验证实例教程解析
- SharpDevelop:C#和VB.NET项目开发利器
- 《Linux基础技能及操作技巧教程》
- 深入.NET平台与C#编程的项目魔幻战士Sudeki