C语言使用libiconv和libcharsetdetect自动识别与转换文本编码-CSDN博客

本文介绍了在C语言中处理文本编码的挑战，并推荐了可移植的转码库libiconv和编码检测库libcharsetdetect。通过libcharsetdetect检测文件编码，结合libiconv进行转码，实现自动识别和转换文本编码。提供了安装、使用示例以及完整的封装库链接。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

用C语言在编写一些文本处理程序时，文本编码就成为了很重要的部分，
但C语言本身，处理文本又十分困难，虽然有wchar_t这类标准库支持，
然后事实是各类编译器对其支持也不相同，而且缺乏一致的标准。

libiconv是GNU出品的一款非常方便的转码库，可以支持各类
常见编码类型。

语言	编码
欧洲语系	ASCII, ISO-8859-{1,2,3,4,5,7,9,10,13,14,15,16}, KOI8-R, KOI8-U, KOI8-RU, CP{1250,1251,1252,1253,1254,1257}, CP{850,866}, Mac{Roman,CentralEurope,Iceland,Croatian, Romania}, Mac{Cyrillic,Ukraine,Greek,Turkish}, Macintosh
犹太语系	ISO-8859-{6,8}, CP{1255,1256}, CP862, Mac{Hebrew,Arabic}
日文	EUC-JP, SHIFT_JIS, CP932, ISO-2022-JP, ISO-2022-JP-2, ISO-2022-JP-1
中文	EUC-CN, HZ, GBK, GB18030, EUC-TW, BIG5, CP950, BIG5-HKSCS, ISO-2022-CN, ISO-2022-CN-EXT
朝鲜文	EUC-KR, CP949, ISO-2022-KR, JOHAB
亚美尼亚语	ARMSCII-8
格鲁尼亚语	Georgian-Academy, Georgian-PS
塔吉克语	KOI8-T
泰国语	TIS-620, CP874, MacThai
老挝语	MuleLao-1, CP1133
越南语	VISCII, TCVN, CP1258
特殊平台	HP-ROMAN8, NEXTSTEP
全部Unicode	UTF-8, UTF-7 UCS-2, UCS-2BE, UCS-2LE, UCS-4, UCS-4BE, UCS-4LE UTF-16, UTF-16BE, UTF-16LE, UTF-32, UTF-32BE, UTF-32LE C99, JAVA