实战一:创建表
数据集:movies.csv
用,隔开,三列数据分别表示movie_id,movie_name,genres(电影id,电影名字,电影风格)
数据集:rating.csv
用,隔开,四列数据分别表示user_id,movie_id,rating,timestamp
1.在hive根目录下命令行输入hive
2.shell创建表
HDFS创建目录:/hive/rating_table 和 /hive/movie_table
将数据集movie.csv上传到/hive/movie_table
将数据集rating.csv上传到/hive/rating_table
在终端输入以下sql语句:
create external table movie_table
(
movieId STRING,
title STRING,
genres STRING
)
row format delimited fields terminated by ','
stored as textfile
location '/hive/movie_table';
然后在另一个终端执行:
hive -f create_rating_table;
3.查询是否已经见表
hive> show tables;
4.查看表的描述
hive> desc movie_table;
OK
movieid string
title