根据文件内容判断文件类型

本文探讨了如何判断文件类型,包括依据文件后缀、文件的magic number(前512个字节)以及通过分析文件内容。提到了C/C++使用libmagic库的方法,以及less命令中对于二进制文件的判断技巧,即前256字节内含有超过5个非ASCII码可打印字符。同时指出,正则表达式也可用于文件内容判断,但可能存在误判情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

判断文件类型,一般情况下可以根据文件后缀约定,使用相应的处理方式处理。

或者基于文件magic number(文件的前512个bytes)对文件类型进行判断,C/C++可以通过libmagic处理判断文件类型,下面是stackoverflow上使用libmagic的实现::

#include <boost/filesystem.hpp>
#include <boost/range.hpp>
#include <iostream>
#include <magic.h>

using namespace boost;
namespace fs = filesystem;

int main() {
    auto handle = ::magic_open(MAGIC_NONE|MAGIC_COMPRESS);
    ::magic_load(handle, NULL);

    for (fs::directory_entry const& x : make_iterator_range(fs::directory_iterator("."), {})) {
        auto type = ::magic_file(handle, x.path().native().c_str());
        std::cout << x.path() << "\t" << (type? type : "UNKOWN") << "\n";
    }

    ::magic_close(handle);
}

输出结果:

sehe@desktop:~/custom/boost/status$ /tmp/test 
"./Jamfile.v2"  ASCII text
"./explicit-failur
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值