使用OpenRefine工具时打开中文文件名乱码的解决方法

OpenRefine选择中文文件时文件名乱码的解决办法

OpenRefine中文文件名乱码

在使用OpenRefine导入中文文件时,例如如下的Excel文件数据:中文名Excel文件
当在OpenRefine中选择该文件并上传后,如下图所示:
上传中文名Excel文件
点击下一步后,会发现文件名和sheet页面的名字出现了乱码:

上传中文名字的文件后,右上角的项目名和左下部的sheet页前的文件名出现乱码
但是实际上文件内部的文字并没有乱码的出现,出现这个问题的原因是OpenRefine读取文件名的时候编码不是utf-8的原因,所以需要调整文件名解析的编码方式。
在使用OpenRefine时有两种方式——直接运行OpenRefine.exe,或者利用cmd打开命令窗口后,输入refine.bat,如下图所示:
OpenRefine软件安装后目录
无论是哪种方式打开,都有一个相应的配置文件来控制打开时的一些参数设置:与OpenRefine.exe文件对应的配置文件为OpenRefine.l4j.ini文件,与refine.bat对应的配置文件为refine.ini文件,前者利用文本类工具打开后内容如下所示:
OpenRefine.l4j.ini文件内容
只需要在其中添加一句 -Dfile.encoding=UTF-8 即可,如下图所示:
在这里插入图片描述
如果是用cmd窗口中运行refine.bat命令的方式启用OpenRefine工具,则需要在refine.ini文件中进行相应的修改,增加一句 JAVA_OPTIONS=-Dfile.encoding=UTF-8,如下图所示:
在这里插入图片描述
这样修改后,无论是直接运行exe的方式,还是通过命令行的方式,再打开OpenRefine工具后,中文的文件名就不会再出现乱码现象了,如下图所示:
打开中文文件后文件名不再乱码
最后说一句,OpenRefine的数据库相关的翻译文件放在OpenRefine\webapp\extensions\database\module\langs路径下的对应JSON文件中,如下图所示:在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值