Elasticsearch5.X聚合操作异常:Fielddata is disabled on text fields by default. Set fielddata=true on [color] in order to load
fielddata in memory by uninverting the inverted index. Note that this can however use significant memory.
Fielddata默认情况下禁用文本字段,因为Fielddata可以消耗大量的堆空间,特别是在加载高基数text字段时。一旦fielddata被加载到堆中,它将在该段的生命周期中保持在那里。此外,加载fielddata是一个昂贵的过程,可以导致用户体验延迟命中。处理以上bug可以参考如下方式:
1、可以使用使用该my_field.keyword字段进行聚合,排序或脚本
2、启用fielddata(不建议使用)
Fielddata说明
大多数字段默认为索引,这使得他们可以搜索。但是,排序,聚合和访问脚本中的字段值需要与搜索不同的访问模式。
搜索需要回答这个问题:“哪些文件包含这个术语?” ,而排序和聚合需要回答一个不同的问题:“ 这个文档对这个文档有什么价值?” 。
大多数字段可以使用索引时间,磁盘上doc_values
的这种数据访问模式,但text
字段不支持doc_values
。
相反,text
字段使用名为“查询时内存”的数据结构 fielddata
。这种数据结构是在第一次使用字段用于聚合,排序或脚本时构建的。它是通过从磁盘读取每个段的全部倒排索引来构建的,反转术语↔︎文档关系,并将结果存储在内存中,存储在JVM堆中。