1、Sqoop概念
Sql-To-Hadoop,sqoop主要用于关系型数据库(mysql,postgresql,oracle....)与hadoop(hive)之间数据的传递,也可以hadoop上hdfs的数据导入导出到关系型数据库中。
利用MapReduce,批处理 的方式进行数据的传输
2、Sqoop导入
导入工具从RDBMS到HDFS导入单个表,表中的每一行被视为HDFS的记录,所有的记录被存储在文本文件的文本数据或者在avro和序列文件的二进制数据
3、Sqoop导出
导出工具从HDFS导出一组文件到RDBMS中,作为输入到sqoop的文件包含记录,这被称为在表中的行。那些被读取并解析成一组记录和分隔使用用户指定的分隔符。