
DeepSeek与AI幻觉
清华大学
新闻与传播学院新媒体研究中心
人工智能学院
双聘教授 @新媒沈阳 团队
博士后 张家铖
2025年2月

一、什么是AI幻觉
二、DeepSeek为什么会产生幻觉
三、AI幻觉评测
四、如何减缓AI幻觉
五、AI幻觉的创造力价值

案例1
Prompt:给我一些DeepSeek在金融行业的应用案例
DeepSeek:
• 某头部银行利用DeepSeek构建因果归因网络,识别
小微企业违约的隐性因素(如上下游账期错配),针
对性设计“供应链票据贴现+账期保险”组合产品,
不良率下降4.2个百分点。
• 国信证券在“金太阳APP”中部署DeepSeek-R1-
Distill-32B端侧模型,客户本地输入风险测评数据后,
模型生成个性化投资组合建议,仅将匿名化策略权
重同步至云端风控系统,数据泄露风险降低90%。

案例2

案例3
Whisper:OpenAI的自动语音识别(ASR)系统
行业应用:医疗系统中,将患者与医生的对话问诊过程音频,转写为文字病例,有超过
30000名临床医生和40个医疗系统使用
发现:100多个小时的Whisper转录样本,其中约有一半内容存在幻觉
原音频:“嗯,她的父亲再婚后不久就去世了”
转录文本:“没关系。只是太敏感了,不方便透露。她确实在65岁时去世了”
结果:2.6W多份自动转录病例中,几乎每本都存在瞎编和幻觉问题,对患者健康和医疗系
统产生严重负面影响