进一步有进一步的欢喜
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive SQL 精进系列:PERCENTILE_APPROX 搞定分位数
百分位数作为一种常用的统计指标,能够帮助我们了解数据的分布情况。Hive SQL 提供了 `percentile_approx` 函数,用于近似计算百分位数。与精确计算百分位数的函数相比,`percentile_approx` 在处理大规模数据时具有更高的性能和更低的内存开销。原创 2025-03-15 14:23:38 · 1902 阅读 · 0 评论 -
Hive SQL 精进系列:一行变多行的 LATERAL VIEW EXPLODE
当处理复杂数据结构时,例如数组和映射类型的数据,普通的 SQL 操作可能无法满足需求。而 `LATERAL VIEW EXPLODE` 这一组合功能就成为了解决这类问题的强大工具。本文将深入探讨 `LATERAL VIEW EXPLODE` 的原理、语法、使用场景,并通过丰富的案例来更好地理解帮掌握这一工具。原创 2025-03-15 14:15:50 · 1491 阅读 · 0 评论 -
Hive SQL 精进系列:FROM_JSON 函数的应用
JSON 以其简洁、易读且易于解析的特点,被广泛应用于数据交换和存储。Hive SQL 作为大数据处理的重要工具,提供了 `from_json` 和 `get_json_object` 这两个用于处理 JSON 数据的函数。本文将详细介绍 `from_json` 函数的语法、应用场景,同时对比 `from_json` 与 `get_json_object` 的差异,以及使用时的注意事项。原创 2025-03-15 14:06:16 · 1322 阅读 · 0 评论 -
Hive SQL 精进系列:字符串拼接的三种常用方式
在Hive里,主要存在`||`操作符、`CONCAT`函数和`CONCAT_WS`函数这三种字符串拼接方式,它们各自具备独特的特点,适用于不同的应用场景。原创 2025-03-12 23:52:05 · 1279 阅读 · 0 评论 -
Hive SQL 精进系列:REGEXP_COUNT 函数的用法
`REGEXP_COUNT` 函数是一个强大的正则表达式相关函数,它能够帮助我们统计字符串中匹配特定正则表达式模式的子字符串的数量。本文将详细介绍 `REGEXP_COUNT` 函数的基本语法、应用场景、使用示例以及一些注意事项。原创 2025-03-15 13:27:49 · 1059 阅读 · 0 评论 -
Hive SQL 精进系列: JSON_TUPLE 快速提取多键值
Hive 作为大数据处理的常用工具,提供了诸多处理 JSON 数据的函数,`json_tuple`、`get_json_object` 和 `from_json` 便是其中重要的几个。`json_tuple` 能够高效地从 JSON 字符串中提取指定的键对应的值。本文将详细介绍 `json_tuple` 函数的语法、应用场景,同时与 `get_json_object`、`from_json` 进行对比,并阐述使用时的注意事项。原创 2025-03-15 14:32:54 · 1448 阅读 · 0 评论 -
Hive SQL 精进系列: IF 函数的强大功能与高级应用
`IF` 函数作为 Hive SQL 中一个基础且实用的条件函数,在日常的数据处理任务中发挥着重要作用。本文将全面介绍 Hive SQL 中 `IF` 函数的基本语法、常见应用场景以及高级用法。原创 2025-03-15 12:38:52 · 1283 阅读 · 0 评论 -
Hive SQL 精进系列:SUBSTR 函数的多样用法
`SUBSTR` 函数是 Hive SQL 中一个用于字符串截取的重要函数,在处理文本数据时发挥着关键作用。本文将全面且深入地介绍 Hive SQL 中 `SUBSTR` 函数的基本语法、常见应用场景以及一些高级用法。原创 2025-03-15 12:44:51 · 2296 阅读 · 0 评论 -
Hive SQL 精进系列:REGEXP_REPLACE 函数的用法
字符串处理是数据处理中的常见需求,Hive SQL 为此提供了多种函数,其中 `REGEXP_REPLACE` 函数凭借其基于正则表达式的替换能力,在处理复杂字符串替换任务时发挥着关键作用。本文将详细介绍 `REGEXP_REPLACE` 函数的语法、应用场景,同时对比它与 `REPLACE` 函数和 `REGEXP` 函数的差异。原创 2025-03-15 13:31:40 · 2111 阅读 · 0 评论 -
Hive SQL 精进系列: 集合函数 COLLECT_SET 与 COLLECT_LIST
在 Hive SQL 的数据处理领域,集合函数是一类强大且实用的工具。其中,`COLLECT_SET` 和 `COLLECT_LIST` 函数在处理分组数据时尤为重要。它们能够将分组内的某列值收集到一个集合中,为后续的数据聚合和分析提供便利。本文将详细介绍这两个集合函数的基本概念、语法、应用场景以及它们之间的区别。原创 2025-03-15 13:20:53 · 1116 阅读 · 0 评论 -
Hive SQL 精进系列:REGEXP 函数的用法
当处理复杂的文本数据时,常常需要对字符串进行模式匹配和筛选,Hive SQL 中的 `REGEXP` 函数就提供了这样的功能。它基于正则表达式实现字符串的模式匹配,能高效地从海量文本数据中提取所需信息。本文将详细介绍 `REGEXP` 函数的基本概念、语法、常见应用场景及高级用法。原创 2025-03-15 13:17:20 · 1726 阅读 · 0 评论 -
Hive SQL 精进系列:COALESCE 手册
在数据处理过程中,经常会遇到数据缺失的情况,这给数据分析和后续的数据应用带来诸多不便。Hive SQL中的`COALESCE`函数应运而生,它就像一位数据修复大师,专门解决数据中的空值问题,确保数据的完整性和可用性,在数据清洗、报表生成等环节发挥着关键作用。原创 2025-03-12 23:57:55 · 1431 阅读 · 0 评论 -
Hive SQL 精进系列:解锁 Hive SQL 中 KeyValue 函数的强大功能
`KeyValue` 函数作为一个独具特色的工具,在处理包含键值对信息的字符串时发挥着重要作用。它能够按照特定规则拆分字符串,精准提取出我们所需的键对应的值。本文将全方位深入剖析 `KeyValue` 函数,涵盖其语法、参数、返回值规则,以及丰富多样的应用场景,并给出相应的注意事项。原创 2025-03-15 13:48:31 · 1255 阅读 · 0 评论 -
hive常见demo
1、插入demo数据table_name="table_name_xxx"dt='20220101'sql="insert overwrite table ${table_name} partition(dt=${dt})select *from ( select 1 as uv, 1 as expo, 1 as ia_num, 1 as click_num, 1 as read_duration, 1 as qianbao_ia, 1 as qianboa_原创 2022-05-20 15:24:55 · 535 阅读 · 0 评论 -
Hive SQL 之 `LATERAL VIEW EXPLODE` 的正确打开方式
一文搞懂LATERAL VIEW EXPLODE原创 2024-12-24 23:37:15 · 2267 阅读 · 0 评论 -
Hive SQL 窗口函数 `ROW_NUMBER() ` 案例分析
本文深入探讨了 Hive SQL 中 ROW_NUMBER() 函数结合 PARTITION BY 和 ORDER BY 的强大功能,通过具体案例展示了如何在数据去重、排名计算和分页查询等场景中灵活应用这些技术。从员工薪资排名到最新交易记录的获取,再到月度销售冠军的计算。无论是初学者还是经验丰富的数据分析师,都能从中获得宝贵的技巧和灵感,提升数据分析效率。原创 2024-12-25 22:34:22 · 1236 阅读 · 0 评论 -
(三)算法工程师遇上大数据-Hive
算法工程师遇上大数据(3)-hive原创 2021-04-04 14:23:11 · 160 阅读 · 0 评论 -
hive测试技巧
1.仅采用分区进行测试,加快测试速度,单个分区测试通过,再放开全量select a.value1, a.value2from awhere dt=$dt hour=$hout>> hour=$hour将分区限制到最小2.多表join时,当关心其中两个表join结果时,可以把其他表删掉,数据插入空数据替代>> 本条过于简单>> 但却十分实用3.大表采样后落一个新的小表,用小表测试select * from (select t.* from原创 2021-03-12 10:04:21 · 330 阅读 · 0 评论 -
hive case when
hive case when写法1case when tb1.os = 'android' then 'android'when tb1.os = 'ios' then 'iPhone'else 'PC'end as os,写法2case tb1.oswhen 'android' then 'android'when 'ios' then 'iPhone'else 'PC'end as os,原创 2021-03-10 10:13:19 · 173 阅读 · 0 评论 -
hive split 函数转义问题
语法split(str string, regex string) -- 使用 regex 分割字符串 str基本用法select split('a,b,c,d', ',') from temp_cwh_test; -- 分割-- 结果为数组> ["a","b","c","d"]截取字符串中某个值select split('a,b,c,d', ',')[0] from temp_cwh_test; -- 提取第1个值> a特殊字符的处理针对特殊分割符号,需要特殊处理。原创 2021-03-09 18:16:18 · 1721 阅读 · 0 评论 -
常用hive语句集合
1.采样select * from ( select * from ( select t.* from ( select *,rand() x from origin_table where dt=20210128 ) t where t.x between 0 and 0.1 ) a)base原创 2021-02-18 15:42:32 · 158 阅读 · 0 评论 -
hive sql报错
1.hive sql 报错FAILED: ParseException line 22:0 cannot recognize input near '<EOF>' '<EOF>' '<EOF>' in subquery source2.解决select * from( select ... from table_1 where ...) table_outer嵌套的内层的表一定要有别名,也就是示例代原创 2020-11-16 17:25:58 · 1246 阅读 · 1 评论 -
Docker安装mysql实战流程
1、安装 docker2、pull mysql3、mysql登录流程1. sudo docker run -p 3306:3306 --name mysql -e MYSQL_ROOT_PASSWORD=123456 -d mysql:5.7 -p:本地端口和镜像端口映射 -name: image 名称 -e:环境变量--》mysql 登录密码 -d:mysql:5.7 image镜像2. sudo docker exec -it mysql bash3. mysql -uroot -p1原创 2020-08-11 17:19:47 · 185 阅读 · 0 评论 -
Docker安装Redis实战流程
1、前提1. docker安装完毕2. centos环境安装完毕2、安装流程docker info 检查dockerdocker search redisdocker pull redisdocker镜像拉取docker images运行dockersystemctl restart dockerdocker infodocker versiondocker run -itd --name redis -p 6379:6379 redisdocker exec -it r原创 2020-08-11 13:20:13 · 182 阅读 · 0 评论