- 博客(2)
- 收藏
- 关注
原创 大数据技术之Sqoop
第1章 Sqoop简介Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为一个Apac..
2022-03-29 09:39:26
366
原创 hive的使用
一、表的创建(外部表和内部表)1、内部表与外部表的区别外部表:hive中删除外部表时,数据不会被删除,即hive不会控制外部表数据的生命周期内部表(管理表):hive中删除内部表时,数据会被删除掉,即hive会控制内部表数据的生命周期。查询表的详情desc formatted student5;删除表:drop table student;对于一个公司来说,数据非常重要,原始数据会放在外部表还是管理表中?外部表2、创建表的方式(三种)方式一:(普通创建表)(最
2022-03-29 09:13:14
1595
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人