文本文件可以有不同编码格式(ANSI,UTF8,UTF16 等等),文本编辑器可以自动识别相应的编码格式,例如下面两个文件内容完全相同,但是文件格式却不同。
如果文件是ANSI格式,那么可以使用Open方法打开文本文件,然后读取,但是对于UTF-8的文件,Open方法打开后读取到的内容是乱码。使用ADODB可以完美读取UTF-8文件。
示例代码如下。
Sub ReadUTFTxt()
Dim objStream, strData
Set objStream = CreateObject("ADODB.Stream")
objStream.Charset = "utf-8"
objStream.Open
objStream.LoadFromFile ("c:\temp\test.txt")
strData = objStream.ReadText()
arr = Split(strData, vbCrLf)
' 处理数据
objStream.Close
Set objStream = Nothing
End Sub
【代码解析】
第3行代码创建ADODB.Stream对象。
第4行代码指定字符集为UTF-8。
第5行代码使用Open方法打开流对象。
第6行代码加载文本文件。
第7行代码使用ReadText返回文件内容。
第8行代码将文本内容按照行进行拆分,并保存在数组arr中。
第9行代码关闭流对象。
第10行代码释放对象变量占用的系统资源。