一个学生忽视了一行代码,结果发现了一件很不对劲的事: 在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。 按理说系统应该报错,或者至少拒绝回答,可它没有。它依然正常作答,给出了完整的分析过程,甚至在图像理解的基准测试中拿到了很高的分数。 斯坦福大学上周发布的一篇论文就这件事进行了严肃验证,指出了这样的一个问题:当前许多多模态AI,在没有 ...