ES 当天数据按小时统计

本文介绍了一种使用Elasticsearch进行日志数据聚合分析的方法。通过构造查询条件并利用日期直方图聚合功能,实现了按小时统计指定索引中特定字段(如checkTime)的数据分布情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

//存放时间及统计数据
Map<Object, Long> tempMap = this.getTimeMap();   

String esIndex = "log_app_2021-12-16";
        //构造检索条件
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        //测试代码 我将数据写死了
searchSourceBuilder.query(QueryBuilders.queryStringQuery("console").field("name"));
        DateHistogramAggregationBuilder dateHistogramAggregationBuilder = AggregationBuilders.dateHistogram("aggs").field("checkTime").dateHistogramInterval(DateHistogramInterval.hours(1));

        searchSourceBuilder.aggregation(dateHistogramAggregationBuilder);
        Search sb = new Search.Builder(searchSourceBuilder.toString()).addIndex(esIndex).build();
        try {
            SearchResult result = jestClient.execute(sb);
            if (result != null && result.isSucceeded()) {
                TermsAggregation aggregation = result.getAggregations().getAggregation("aggs", TermsAggregation.class);
                if (aggregation != null && aggregation.getBuckets() != null) {
                    aggregation.getBuckets().forEach(entry -> {
//我用的是自己的时间进行计算的所以时区要修改一下
                                long temp = 8*60*60*1000;
                                String timestamp = (Long.parseLong(entry.getKey())-temp)+"";
                                String key = DateUtils.getYearMonthDay(new Date(Long.parseLong(timestamp)), "HH:mm");
                                tempMap.put(key, entry.getCount());
                    });
                }
            }
        }catch (Exception ex){
            ex.printStackTrace();
        }
   public static String getYearMonthDay(Date date,String formatPatten){
        try {
            formatPatten = org.springframework.util.StringUtils.isEmpty(formatPatten)? YYYY_MM_DD : formatPatten;
            return new SimpleDateFormat(formatPatten).format(date);
        }catch (Exception e){
            e.printStackTrace();
            return null;
        }
    }
   private Map<Object,Long> getTimeMap(){
        Map<Object,Long> map = new LinkedHashMap<>();
        LocalDateTime of = LocalDateTime.of(LocalDate.now(), LocalTime.MIN);
        long l = of.toInstant(ZoneOffset.of("+8")).toEpochMilli();
        while(l<=System.currentTimeMillis()){
            map.put(DateUtils.getYearMonthDay(new Date(l), "HH:mm"),0L);
            l+=60*60*1000;
        }
        return map;
    }

### Elasticsearch 时间函数与日期操作 Elasticsearch 提供了一系列的时间和日期处理功能,这些功能可以帮助用户更灵活地查询、分析以及管理时间序列数据。以下是关于 Elasticsearch 中时间和日期相关的主要功能及其用法: #### 1. **`date` 数据类型** 在 Elasticsearch 的映射定义中,可以通过 `date` 类型指定字段存储时间为标准格式。支持的标准格式包括 ISO-8601 和自定义格式[^1]。 ```json { "mappings": { "properties": { "timestamp": { "type": "date", "format": "yyyy-MM-dd HH:mm:ss||epoch_millis" } } } } ``` 通过这种方式,可以确保时间字段能够被正确解析并用于后续的查询和聚合。 --- #### 2. **`range` 查询中的时间范围** Elasticsearch 支持基于时间范围的查询,允许用户筛选特定时间段内的记录。例如,以下查询语句展示了如何检索某个时间范围内(如最近一天)的数据[^1]: ```json { "query": { "range": { "timestamp": { "gte": "now-1d/d", "lt": "now/d" } } } } ``` 这里的 `now-1d/d` 表示当前时间减去一天,并按天对齐;而 `now/d` 则表示当天的起始时刻。 --- #### 3. **动态时间计算 (`script`)** 如果需要执行更加复杂的逻辑运算,比如基于时间戳进行加减或其他算术操作,则可以借助脚本语言实现。下面的例子演示了如何利用 Painless 脚本来增加或减少时间值[^2]: ```json { "script": { "source": """ Instant instant = Instant.ofEpochMilli(doc['timestamp'].value.toInstant().toEpochMilli()); ZonedDateTime zdt = ZonedDateTime.ofInstant(instant, ZoneId.systemDefault()); // 减少一天 ZonedDateTime newDate = zdt.minusDays(1); return DateTimeFormatter.ISO_DATE_TIME.format(newDate); """, "lang": "painless" } } ``` 此方法适用于高级场景下的时间调整需求。 --- #### 4. **`function_score` 结合时间衰减** 当希望某些较新的文档获得更高的评分权重时,可采用 `function_score` 配置中的 `decay_function` 功能。它可以根据距离目标时间越近赋予更高分值[^2]。 ```json { "query": { "function_score": { "functions": [ { "gauss": { "publish_date": { "origin": "2023-07-01", "scale": "10d", "offset": "5d", "decay": 0.5 } } } ], "score_mode": "multiply" } } } ``` 在此配置下,“发布日期”接近设定原点 (即 `"2023-07-01"` ) 的文档会被优先返回。 --- #### 5. **日期直方图聚合** 对于统计目的而言,经常需要用到按照固定间隔划分时间段的功能——这正是 `date_histogram` 所擅长之处[^1]。如下所示为每小时计数案例: ```json { "aggs": { "events_over_time": { "date_histogram": { "field": "eventTime", "fixed_interval": "1h", "min_doc_count": 0, "extended_bounds": { "min": "2023-01-01T00:00:00Z", "max": "2023-01-02T00:00:00Z" } } } } } ``` 该命令将把所有匹配事件依据其发生的具体小时分布出来。 --- #### 总结 以上介绍了几种常见的 Elasticsearch 时间处理方式,涵盖了基础映射设计、复杂条件过滤直至数据分析层面的应用实例。无论是简单的区间限定还是深入定制化排序策略均能轻松达成预期效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值