DataGrip:csv文件导出到hive出现中文乱码
出现原因:csv文件的编码格式不是utf-8
解决步骤:
1:转换CSV文件的编码:
将CSV文件的编码从GBK转换为UTF-8。你可以使用iconv
命令(在Linux环境下)、文本编辑器(如Notepad++、VS Code等,它们支持编码转换)或编写一个简单的Python脚本来完成这一任务。
使用iconv
的命令示例:
sudo iconv -f GBK -t UTF-8 "GBK文件路径.csv" -o "转换后的文件路径.csv";
tips:如果在你的系统中没有iconv
命令,你可以通过以下几种方法来安装它,具体取决于你的操作系统:对于Linux系统使用包管理器安装:
-
- 在大多数Linux发行版中,
iconv
通常是作为libc6-dev
或glibc-devel
等包的一部分安装的。你可以使用系统的包管理器来安装它。- 对于基于Debian的系统(如Ubuntu),你可以使用
apt-get
:sudo apt-get update
sudo apt-get install libc6-dev
- 对于基于Debian的系统(如Ubuntu),你可以使用
- 在大多数Linux发行版中,