面试问题记录

Nice_cool.

已于 2023-08-27 21:37:23 修改

阅读量1.5k

点赞数

CC 4.0 BY-SA版权

文章标签：深度学习人工智能论文阅读 3d 经验分享

于 2023-08-27 11:25:43 首次发布

本文链接：https://blog.csdn.net/weixin_40653140/article/details/132521465

面试问题记录

懂细节 - 手撕代码
- 手撕NMS代码
一、机器学习
- 有哪些聚类算法？
二、深度学习
- 2.1 介绍卷积的底层实现方法
- 2.2 介绍VAE原理
- 2.3 BN层在训练和推理过程中有什么不一样？
- 2.4 常用激活函数特点
- 怎么理解残差结构？为什么有效？
三、语义分割
- 语义分割有哪些损失函数？
- U-Net为什么在扩散模型中有效？
四、目标检测
- Anchor-free标签匹配方式
五、Transformer
- 5.1 Transformer在图像中是怎么训练的？
- 5.2 Transformer的计算复杂度，并如何降低？
- 5.3 Transformer的一些前沿改进
- 5.4 CNN和Transformer蒸馏的区别
六、注意力机制
- 6.1 多头注意力机制中的多头是指什么？
七、多模态
- 7.1 介绍CLIP和BLIP
- 7.2 多模态融合后，怎样知道最终结果受哪种模态影响更大？
八、生成对抗网络
- 8.1 VAE和GAN的比较
九、BEV
十、点云
其他
- （自然语言处理）LSTM和RNN有什么区别？
- 当代八股：GPT4、InstructGPT、RLHF
十、【计算机基础知识和编程题】

懂细节 - 手撕代码

手撕NMS代码

目标检测中NMS（非极大抑制）的概念理解

import numpy as np
def nms(dets,score):
    x1 = dets[:,0]
    y1 = dets[:,1]
    x2 = dets[:,2]
    y2 = dets[:,3]
    area = (x2-x1+1)*(y2-y1+1)
    scores = dets[:,4]
    idx = scores.argsort()[::-1]
    keep = []
    while idx.size > 0:
        i = idx[0]
        keep.append(i)
        xx1 = np.maximum(x1[i],x1[idx[1:]])
        xx2 = np.minimum(x2[i],x2[idx[1:]])
        yy1 = np.maximum(y1[i],y1[idx[1:]])
        yy2 = np.minimum(y2[i],y2[idx[1:]])
        w = np.maximum(xx2-xx1,0)
        h = np.maximum(yy2-yy1,0)
        overlap = w*h
        iou = overlap/(area[i]+area[idx[1:]]-overlap)
        idx_i = np.where(iou<=score_thr)[0]
        idx = idx[idx_i+1]
    return keep