- 博客(5)
- 收藏
- 关注
原创 【无标题】
- 统计今日发送消息最多的Top10用户。-- 统计发送人的设备操作系统分布情况。-- 统计发送人的手机型号分布情况。-- 统计发送人的网络类型分布情况。-- 统计发送消息各地区数据量。
2024-04-25 23:08:12
133
2
原创 【无标题】
数据库操作• 创建数据库• 查看数据库详细信息插入数据查询数据Hive 体验• 验证 Hive 的数据存储 Hive 的数据存储在 HDFS 的: /user/hive/warehouse 中• 验证 SQL 语句启动的 MapReduce 程序 打开 YARN 的 WEB UI 页面查看任务情况。
2024-04-24 21:25:53
153
3
原创 【无标题】
Hive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库,可以将将结构化的文件映射成一张表,并提供查询功能。1)Hive处理的数据存储在HDFS2)Hive分析数据底层的实现是MapReduce3)执行程序运行在Yarn上二.元数据:Metastore元数据包含:用Hive创建的database、table、表的字段等元信息。
2024-04-23 21:12:10
346
2
原创 Hadoop的一些相关知识
Hadoop的核心组件主要包括Hadoop分布式文件系统(。除了这些核心组件,Hadoop生态系统还包括其他组件,如Hive、Pig、HBase、Spark等,它们可以与Hadoop集成,以扩展其功能。Hadoop的一些基本命令启动 Hadoop集群输入jps查看进输出指定文件的内容;使用方法help 输出这个命令参数创建/sanguo文件夹查看文件内容,配合more统计hdfs中文件的行数查看hdfs中文件的前n行查看hdfs中文件的后n行查看hdfs目录中的前n个文件。
2024-04-22 21:43:39
304
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人