基于动态切片与预训练模型的代码漏洞检测

最新推荐文章于 2025-07-29 20:47:12 发布

原创最新推荐文章于 2025-07-29 20:47:12 发布 · 757 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#语言模型 #安全 #深度学习

#+代码漏洞检测专栏收录该内容

6 篇文章

订阅专栏

全文摘要

该论文提出了一种基于动态切片与预训练模型的代码漏洞检测方法，旨在解决传统基于深度学习的漏洞检测模型存在的问题，如准确性低、可扩展性差等。该方法通过动态切片获取包含路径特征的语句块，并利用预训练模型的语义提取能力将其表示为二维张量。然后，将代码结构和语义特征编码成灰度图像中的像素值，并借助Swin Transformer的特征提取能力，实现更准确的漏洞检测。实验结果表明，该方法能够有效降低误报率和漏报率，提高漏洞检测的准确性和可靠性。

论文实验

作者进行了三个对比实验来评估基于动态切片与预训练模型的代码漏洞检测方法的有效性：

实验一：该实验研究了基于动态切片与预训练模型的代码漏洞检测方法是否适用于多种漏洞类型。作者选取了4种漏洞类型和一个混合数据集进行实验，并选定了5个常用维度进行实验。实验结果表明，本文漏洞检测方法在代码嵌入时选取适当的高度能够提高检测的准确率，选取合适的张量高度，对不同的漏洞类型，本文检测方法都具有较好的适应性，准确率都可达94%以上。
实验二：该实验比较了Swin Transformer模型和其他3个分类模型（ResNet、MobileNet、ViT）的分类性能。实验结果表明，Swin Transformer在准确率、查准率和F1分数等指标上优于其他3个模型，其F1分数达到了93%以上，而另外3个分类模型的F1得分都不足90%，这表明Swin Transformer在各项性能指标上相对于其他模型都有显著的优势。
实验三：该实验将本文方法DyNSliceVuln与目前较为先进的漏洞检测方法进行对比（SySeVR、VulDeepEcker、VulCNN）。实验结果表明，本文方法DyNSliceVuln在F1得分和准确率上皆比VulDeepEcker、SySeVR和VulCNN高，F1分数分别高出13.38%、7.8%和5.02%，与此同时，准确率也分别提高了6.07%、3.37%和1.42%。本文方法DyNSliceVuln相比于VulDeepEcker、SySeVR使用的动态切片，同时考虑了控制流与数据流信息，更重要的在于考虑了路径执行情况，DyNSliceVuln比SySeVR、VulDeepEcker、VulCNN包含更多的程序语义。同时结合本文实验2结果可见，使用SwinTransformer模型作为漏洞特征提取器和分类器，借助SwinTransformer的自注意力机制以及局部感知机制，去捕获动态切片中的重要特征，提取相关漏洞的关键信息，可实现更准确地进行漏洞检测。