如何在交稿前快速识别 AI 生成的假引用和假 DOI?
陈晓 · 内容编辑 · 发布 2026-06-25
交稿前逐条溯源是识别 AI 假引用的唯一可靠方法:把 DOI 粘进 doi.org 看能否解析,在 CrossRef 或 Google Scholar 核对作者、期刊、卷期年,再打开全文确认确实支持你的论点。幻觉引用常用真作者配假标题或劫持真 DOI,只看格式查不出。
交稿前识别 AI 假引用,可靠方法只有逐条溯源:第一步把 DOI 粘进 doi.org 看是否能解析到真实页面;第二步在 CrossRef 或 Google Scholar 核对作者、期刊、卷期与年份是否一致;第三步打开全文,确认这篇文献确实支持你引用它的那句论点。注意幻觉引用常是真作者配假标题,或劫持一个真实 DOI,因此只看格式工整与否查不出来,必须每条都走完这三步。
为什么只看格式查不出假引用
大语言模型按概率预测下一个词,而不是去数据库里查文献,所以它生成的引用往往格式无可挑剔、作者和年份一应俱全,却可能根本不存在。更隐蔽的是两种混合型幻觉:一种是把某位真实学者的名字安在一篇并不存在的标题上,另一种是直接套用一个真实可解析的 DOI,但对应的标题、作者全被改写。这两种都能轻松骗过肉眼和格式检查,只有把元数据逐项比对、再打开原文,才能戳穿。
三步溯源检测清单
- 解析 DOI:把每条 DOI 粘贴进 https://doi.org/ 后访问,能跳转到一篇真实文献页面才算第一关通过;返回 404 或解析失败的直接标红待删。
- 核对元数据:在 CrossRef(search.crossref.org)或 Google Scholar 搜标题与作者,逐项比对作者姓名、期刊名、卷号、期号、页码和发表年份,任何一项对不上都视为可疑。
- 确认论点支撑:打开全文(或摘要),确认这篇文献的实际内容确实支持你引用它的那句话,而不是标题看起来相关、内容却南辕北辙。
- 无法验证即删除:三步中任何一步过不去且查不到可信替代,立刻删掉该引用,宁缺毋滥,别把待核验的引用留到投稿稿里。
不同信号的可信度对照
| 检查信号 | 能说明什么 | 不能说明什么 |
|---|
| 格式完整、作者年份齐全 | 几乎什么都说明不了 | 不能证明文献真实存在 |
| DOI 可在 doi.org 解析 | 这个 DOI 编号存在 | 不能证明它对应 AI 给的标题与作者 |
| CrossRef/Scholar 元数据一致 | 文献大概率真实存在 | 不能证明它支持你的具体论点 |
| 打开全文且内容支持论点 | 可放心引用 | —— 这是唯一应保留的标准 |
把溯源前移,而不是只在交稿前补救
更省力的做法是不让假引用进稿子。让 AI 只负责头脑风暴和关键词,真正的文献检索交给接入真实学术数据库的工具完成,从源头拿到可逐条溯源的真实引用。Scholay 的智能检索直连真实学术数据库返回带可核验元数据的论文,AI 分析帮你比对论点与文献内容,智能写作 Prism 在成文时基于检索到的真实文献组织引用,文献集则把核验通过的条目沉淀复用,避免下次重新查证。把溯源前移,交稿前的检查就从大海捞针变成抽查确认。
DOI 在 doi.org 能解析,是不是就一定是真引用?
不是。解析成功只说明这个 DOI 编号存在,AI 可能劫持了一个真实 DOI 却配上假标题假作者。必须把落地页的标题、作者、期刊与 AI 给的逐字对照,完全一致才算通过。
为什么有些假引用用了真实存在的作者名字?
这是混合型幻觉:模型把某领域真实学者的名字,安在一篇并不存在的标题上,让引用看起来更可信。所以核对时不能只认作者,要把标题、年份、期刊一起比对全文是否存在。
查重和 AIGC 检测工具能帮我查出假引用吗?
基本不能。这类工具检测的是文本重复率和生成痕迹,不核验参考文献的真实性。一条编造的引用格式工整、不重复,反而可能顺利通过,识别真假仍要靠人工逐条溯源。
换一个幻觉更少的模型,是不是就不用查了?
不能省略核验。不同模型虚构率确有高低,但幻觉是语言模型的固有特性而非可彻底修复的 bug,冷门或新兴方向尤其高发。无论用哪个模型,交稿前逐条溯源都不可替代。
时间紧,能不能只抽查一部分引用?
不建议。一旦发现一条假引用,说明这批引用的可信度整体存疑,审稿和答辩往往恰好抽到没核的那条。务必每条都走完解析、比对、确认全文三步,无法验证的立即删除。
作者:陈晓 —— 学术出版行业从业 10 年,熟悉同行评审、期刊投稿和开放获取出版流程。