但是这个在使…
【菜科解读】
现如今,几乎每个人的手机上都有那么两三个 AI 小助手,之前我们遇到了问题习惯去搜索引擎上搜索答案,现在可能更多地习惯于“有事问 AI”。
而 AI 也几乎不会让我们失望,任何问题都能给你列举出一串看起来很有道理的答案。
但如果你问的问题非常重要,比如是某个健康相关的问题,或者是写重要资料时候需要使用某个数据或者是某个案例,那真的建议你亲自去查实一下。
因为有时候,AI 会信誓旦旦地给你一个看似合理,实则不存在的答案。
还有些小伙伴发现,在让小龙虾(Openclaw)干活的时候,它列出了详细的19小时的学习计划,然后17分钟完成了...... 它也会早早编造一份数据存放在本地,等拖到预定的时间才交付。
而在被发现之后,试图让人接受它已完成的工作。

图片截取自与小龙虾(Openclaw)对话 小龙虾敷衍中......
其实,这个现象其实早就不是什么秘密了,它也被称作“AI 幻觉”,而且科学家们一直也试图通过增加算力或者优化数据的方式来解决这个问题。
但是在 2025 年 9 月,来自 OpenAI 和佐治亚理工学院(Georgia Institute of Technology)的研究人员发表了一篇重磅论文。
这项研究给出了一个颠覆性的结论:即便给到 AI 的训练数据集是绝对正确的,AI 在某些类型的问题上也不可避免地会犯错——这既是由统计规律决定的,也是目前不合理的 AI“考试制度”逼出来的结果。
下面我们就顺着这篇文章的思路一起来看一看。
预训练阶段就会出错
这篇研究发现,AI 出现幻觉跟预训练阶段以及后训练阶段都有关系,我们先看预训练阶段的情况。
1
数据模式和模型本身问题
为了方便研究,研究者构建了一个线性的二元分类模型(非此即彼),让它对已经标注了正确和错误的数据集进行分类。
因为这些数据已经经过了人工检验,所以是不存在任何错误的。
但是用这些数据对AI模型进行预训练的时候,问题就出现了。
在有些类型的问题上(比如检查拼写错误),AI 的表现非常好,几乎从不犯错。
但是在另一些问题上,比如“数某个英文单词里某个字母出现了多少次?”,以及“某人的生日是几月几号?”AI 就有可能会出错。

研究者认为,这样的数据在做分类的时候很难用一条直线进行二元分类,一些模型用这样的数据进行预训练的时候就可能会产生错误。
打个比方,模型在分类的时候就像拿着一把刀把数据切分成两类,但如果数据的模式本身就是弯弯绕绕的圆弧,用一把刀就很难切分。
比如在这篇文章中,研究者使用这个问题“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”(DEEPSEEK 里有多少个 D?如果你知道直接说数字,不要加以评论)去询问 Deepseek V3 模型的时候,确实发现它给的答案并不准确,会回答 2 或者 3。
但是这个在使用 DEEPSEEK R1 模型的时候就没有这样的问题,这是模型本身差异导致的。

笔者用同样的问题对 DEEPSEEK V3.2进行了测试,也出现了类似的情况
研究者构建这样的简化模型进行测试,是为了说明,即便数据本身没有问题,在预训练阶段也会因为模型本身的限制以及数据模式等问题让 AI 产生错误判断。
这项研究中,研究者还进一步给出了测算,如果让 AI 直接去生成内容,产生错误的概率还会更大一些,大约比判断出错的概率高出两倍以上。
2
数据量过少也会影响
另外,在这项研究中研究者还发现,假如训练数据中某个信息过少,那么 AI 在回答的时候出错的可能性也会比较高。
比如,当你问爱因斯坦的生日是几月几号的时候,因为在大量的资料里都有这个数据,所以 AI 几乎不会出错。
但是当你问某个普通人“田小豆”的生日是几月几号的时候,这个数据出现次数特别少,AI 出错的可能性也会变高。

特别是当数据只出现了一次的时候,这时候可能会更糟糕。
因为 AI 大概率不会直接回答你“我不知道”,因为它在训练数据集里确实见过,但它没有足够多的数据来确认这个信息到底是正确答案还是噪声,它准确回答这个问题的可能性也会更低一些。
数据模式和模型本身的限制,以及极少样本的数据,都可能会让 AI 在预训练阶段就产生“幻觉”,生成错误的内容。
努力得高分的 AI
如果说预训练阶段的统计学特征让 AI 有了编造的“潜质”,人类评价AI的方式也逼着 AI 去“编造”。
为了更好地理解这一点,我们可以先从大家都很熟悉的考试入手。
人类社会中的大部分考试都是二元评分机制,即答对了得分,答错或者不回答都不得分。
所以,在考试的时候,哪怕你不知道答案,也不会交白卷,至少选择题填空题会随便蒙一个,万一蒙对了还会有“意外之喜”。
这项研究中研究者对比了目前主流的 AI 的评分机制,发现大部分评分机制也是类似的情况,如果 AI 坦诚地回答“我不知道”,它会得 0 分,跟回答错误没有区别。
与其这样,它不如随便蒙一个答案,哪怕蒙对的概率再低,数学期望也比 0 高。
为了在主流的评分机制中拿到高分,“AI 考生们”也和人类一样,学会了实在不行就乱蒙一个的本领。
对此,这项研究的研究者们也给出了一个合理的解决方案——在现有的 AI 评分机制中,引入一个“惩罚编造,奖励诚实”的机制。
比如,假如 AI 回答正确,获得 1 分,如果回答错误得 0 分,甚至扣分。
如果回答“我不知道”,则可以不扣分,或者获得一个微小的分数奖励。
重要问题上不要轻信 AI
文献也给出了结论,AI 的幻觉是从模型的预训练阶段起源的,在后训练阶段为了追求更高的评分也可能会被放大。
虽然科学家们也采用了很多的方法减少 AI 幻觉,但至少在现阶段看来,AI 幻觉还是无法避免的。
假如你需要让 AI 帮你解答一个重要的问题,比如在做公众演讲的时候用一个数据,建议亲自核实一下。
否则被人发现这些数据根本不存在,那可就尴尬了。
而假如在问 AI 问题的时候,它对你说“我不知道”,你也应该感到庆幸,至少 AI 并没有打算胡编乱造一个答案蒙骗你。
参考文献
[1]Kalai, A. T., Nachum, O., Vempala, S. S., & Zhang, E. (2025). Why language models hallucinate. arXiv preprint arXiv:2509.04664.
来源:科普中国
过去一年,小米遭受了铺天盖地的争议,汽车安全事故、营销争议、交付纠纷等如潮水般涌来。
无奈之下,创始人雷军连开两场直播回应,并表示:“骂小米确实有流量,但是一定要客观,不要故意抹黑和断章取义,这样做是违法行为。
” 当时,有人听进去了,也有人依旧追着不放。
但雷军没有自乱阵脚。
2025年,他带领着小米干了4500亿,狠狠打脸了那些恶意的质疑。
小米发布2025年财报 创历史新高 3月24日,小米集团发布2025年全年财报。
财报数据显示,小米2025年总营收4573亿元,同比增长25.0%;
经调整净利润392亿元,同比大增43.8%。
业绩创下历史新高,展现出强劲的增长韧性,发展迅猛。
图源:小米公司 毫无疑问,小米的这一份成绩单足够亮眼,雷军本人也亲自发微博表示祝贺,难掩喜悦之情。
图源:微博 具体到不同业务上来看,小米汽车给了市场极大的惊喜。
财报数据显示,小米的汽车业务收入首超千亿,新SU7订单持续稳健增长。
具体而言,全年新车交付411082台,同比增长200.4%,小米SU7位列2025年国内20万以上轿车销量冠军,小米YU7连续7个月位列国内中大型SUV销量第一。
图源:小米公司 很明显,汽车业务取得了极大的突破,也意味着长期烧钱的阶段结束,实现自我造血的正循环,小米汽车得到了市场和用户的认可。
此前,雷军还定下了小米汽车2026年全年交付目标,为55万辆。
基于以上财报的数据,小米想要实现2026年的目标应该不难。
图源:微博 况且,现在新一代SU7订单强劲,开售34分钟锁单超15000台,开售3天锁单超30000台,订单量狂增。
新一代小米SU7的大卖,离不开雷军的亲民服务与代言人的官宣。
前几天,小米汽车官宣了两位代言人,一位是亚洲跑得最快的人苏炳添,一位是极具质感的演员兼导演的舒淇。
图源:微博 细看两位代言人的名字,都带有“SU”音,舒淇的谐音更是和“SU7”一致,正如雷军所言“莫名就有缘分”。
在两位代言人的助力下,相信能帮助小米汽车高端化和国际化。
因为苏炳添和舒淇两人在国际上有一定的知名度,而且他们自身的气质和小米汽车也很适配。
此外,雷军也带着代言人苏炳添,来到交付现场,亲切的为车主开车门,并且合影。
服务这一块,雷军是真的做得很到位。
图源:微博 回过头来看其他业务,小米智能手机的表现相对稳定。
财报显数据显示,智能手机出货量连续5年稳居全球前三,在全球58个国家和地区出货量排名前三,70个国家和地区排名前五。
图源:小米公司 IoT 业务再创历史新高。
财报数据显示,IoT收入1232亿元,同比增长18.3%,境内境外收入均创历史新高,AIoT平台设备连接数突破10.79亿台。
图源:小米公司 互联网业务则是小米的利润的“压舱石”。
财报数据显示,互联网服务收入374亿元,同比增长9.7%,毛利率高达76.5%。
图源:小米公司 此外,在AI浪潮席卷全球的当下,小米也在加速AI战略的落地。
持续的高研发投入,将为小米在AI时代的生态竞争中构筑护城河。
财报数据显示,小米全年研发投入331亿元,同比增长37.8%,研发人员总数25457人,创历史新高,过去五年累计投入达到1055亿元。
自研大模型Xiaomi MiMo-V2-Pro正式发布,Artificial Analysis大模型智能指数全球总榜第八、国内第二,未来三年AI领域投入将达到600亿元。
图源:小米公司 小米的这份财报,整体来看,汽车业务从“预投期”进入“盈利期”,成为新的增长引擎,或支撑小米的长期增长,更打破了新势力造车长期亏损的魔咒;
手机业务摆脱规模依赖,寻求高端化突破;
AI 与 IoT 生态深度协同,“人车家” 全生态壁垒成型,技术落地节奏加快。
小米已经用成绩证明了自己的实力,虽然未来还存在很多不确定的因素。
但就当下来说,小米已经做好准备,能更从容的走向未来。
雷军直面质疑 小米跨步向前 一路走来,小米在得到巨大关注度和追捧的同时,也面临着很多的质疑声和批评。
过去,雷军认为“好产品会自己说话,清者自清”。
但现在,雷军表示:今后将更主动、更直接地回应外界关切,把话语权牢牢掌握在自己手中。
图源:微博 为此,雷军在直播间里直接拆了一辆小米汽车,也特地开直播回应网上大大小小的疑问,亦或是更加频繁的在社会平台上和网友互动。
在解疑的同时,也让大众更清楚、明白的知道小米正在做什么,又在为什么而努力。
“雷军是小米最好的代言人”,网友的这句话并不假。
雷军能靠自身“爽文男主”“霸总开车门”等个人魅力为小米带来关注度,也能在小米面临质疑时,第一时间站出来为小米解释。
作为小米的创始人,雷军确实做到了亲力亲为;
作为小米的代言人,雷军良好形象给小米带来的加持作用还在继续。
今年以来,雷军就三次登上《新闻联播》,这本身就意味着某种层面的认可,不仅仅是关乎雷军本人,更关乎小米这个企业本身,都得到了国家层面的背书。
而这种背书,一定程度上也反击了小米所面临的质疑。
图源:微博 雷军参加这种国家级别的活动,背后其实透露出了小米未来发展的动向。
比如,雷军出席中英企业家委员会会议、中德经济顾问委员会座谈会,和一众外国企业代表交谈,事关中外贸易。
其中,雷军就透露:“小米进入英国市场已有几年时间,去年一年大概有10亿人民币的收入。
”且雷军还计划加大投入,预计在四年之内在英国开150家店面。
小米的出海动作和国家的发展战略是一致。
图源:微博 此外,雷军还作为人大代表在人大小组会上发言,明确提到要“发展新质生产力,坚定不移走高质量的发展道路”。
图源:微博 所谓的新质生产力,特征有“高科技、高效能、高质量”,这和小米当下的业务布局高度同频。
小米科技生态的核心理念是:围绕人的生活与工作需求,提供丰富的智能终端和服务,实现人与万物的紧密连接。
图源:小米 在智能手机、家居、电动汽车上,小米已经取得了一定的成绩。
接下来,小米未来三年要在AI领域投入将达到600亿元。
无疑,小米也想紧紧抓住AI时代的这张船票。
小米为此付诸努力,招揽被外界称作“天才少女”的95后科学家罗福莉,还有前特斯拉Optimus灵巧手团队成员卢泽宇,储备人才;
据不完全统计,小米已在机器人及相关领域投入入约150亿元,投资企业近50家。
三月初,雷军还在社交平台分享,小米机器人正式上岗汽车工厂“实习”。
图源:微博 当下,小米有清晰的规划、有明确的目标,还有雷军这位主心骨人物的带领,我们有理由相信小米的未来会有更多的可能性。
虽然过程中少不了质疑和争议,但这是小米的必经之路。
一切,才刚刚开始。
随着市政污水数字化管理推进,要求实现“管网全覆盖、数据全联网、运维全远程”,传统S7-200 SMART的通讯局限成为制约升级的关键: · S7-200 SMART本体无以太网接口,仅靠RS485口进行通讯,无法直接接入市政污水大数据平台;
· 传统PPI/Modbus RTU通讯速率较低,在多因子监测场景下,数据刷新延迟超过10秒,无法满足市政监测“实时监控”需求;
· 部分偏远监测点采用DTU 4G传输,不仅流量成本高,且在地下管网、偏远区域信号薄弱,数据断传现象频发,影响监测准确性;
· 现场调试繁琐,运维人员需携带笔记本电脑,逐个监测点通过串口连接PLC,调试效率低,且人工成本居高不下。
如何在不更换现有S7-200 SMART PLC、不影响设备正常运行的前提下,实现以太网高速通讯,打通市政污水监测的“数据孤岛”,成为市政环保部门及运维企业的核心需求。
捷米特(JMT)ETH-S7200-JM01以太网通讯处理器,凭借“即插即用、透明传输、双网口分流”的优势,成功解决上述痛点,应用于多个市政污水监测项目。
二、项目概况:市政污水管网终端监测系统改造 · 用户:山东某市政环保运维公司 · 监测因子:pH值、溶解氧(DO)、浊度、污水流量、悬浮物(SS) · 控制核心:西门子S7-200 SMART CPU222 AC/DC/Relay(6ES7 212-1BD23-0XB8) · 通讯桥梁:捷米特ETH-S7200-JM01以太网通讯处理器 · 上位平台:市政污水大数据监测平台+组态王KingView 7.5 · 现场交互:步科Kinco MT4403T触摸屏 · 网络拓扑:工业百兆交换机(中兴ZXR10 2950-24T)光纤市政中控中心大数据监测平台 三、方案设计:双网口独立运行,兼顾本地与远程 ETH-S7200-JM01模块内置两个独立RJ45以太网端口,集成工业级交换芯片,可分别连接上位机大数据平台与现场触摸屏,实现“远程数据上传”与“本地操作控制”双独立运行,无需额外配置交换机,简化布线,降低施工成本。
具体方案如下: · Port 1(NET1):连接工业百兆交换机,IP地址设置为192.168.5.100/24,启用Modbus TCP Server模式,端口号502,供市政污水大数据平台及组态王软件轮询数据;
· Port 2(NET2):直接连接步科Kinco MT4403T触摸屏,IP地址设置为192.168.6.1/24,采用西门子S7 TCP通讯协议,通过Kinco HMIware组态软件完成配置;
· X1 9P母口:插入S7-200 SMART CPU222的Port 0端口,支持PPI协议187.5 kbps自动波特率识别,无需手动设置;
· X2 9P公口:接入原有触摸屏PPI通讯电缆,实现透明桥接,原有触摸屏程序无需修改,直接复用,降低升级成本。
四、实施步骤:12小时完成改造,不影响污水处理 1. 开箱检查:核对装箱清单,确认ETH-S7200-JM01模块1、3m工业网线2、导轨卡扣1、Mini-USB配置线1、产品合格证及《快速配置手册》齐全,模块外观无破损、接口无松动。
2. 硬件安装: 1. 污水处理设备断电后,拔出CPU222 Port 0端口的PPI插头,插入ETH-S7200-JM01模块的X1口,拧紧固定螺丝;
2. 将原有步科触摸屏PPI通讯电缆插入模块X2口,确保通讯可靠;
3. 将模块卡入控制柜35mm DIN导轨,模块24VDC电源取自CPU222的传感器电源(功耗<100mA),无需额外配置独立电源;
4. 通电自检:Pwr指示灯常亮,Link1、Link2指示灯快速闪烁,PPI指示灯每1秒闪烁1次,说明硬件连接正常,设备就绪。
3. 网络参数配置: 1. 用Mini-USB配置线连接模块与电脑,安装并打开JMT Ethernet Config V3.7配置软件;
2. 点击“搜索设备”,软件自动识别模块,读取默认IP地址192.168.1.188;
3. 切换至“端口1”页签,填写市政局域网IP、网关及DNS地址,保存配置;
4. 切换至“端口2”页签,勾选“S7 TCP Slave”选项,自动生成TSAP地址02.00;
5. 点击“下载配置”,5秒后模块自动重启,配置生效。
4. PLC侧无需修改程序:ETH-S7200-JM01采用“透明传输”机制,CPU222仍使用原有Port 0自由口指令,无需调用任何通讯块,也无需进行寄存器映射,原有控制逻辑、监测流程保持不变,不影响污水处理正常运行。
5. 上位机配置: 1. 在组态王KingView 7.5软件中,选择“Modbus TCP”驱动,添加设备IP地址192.168.5.100,站号设为1;
2. 根据HJ212-2025环保标准因子编码,创建寄存器映射表:pH值40001(VW1000)、溶解氧40002(VW1002)、浊度40003(VW1004)、流量40004(VW1006);
3. 设置轮询周期30秒,断线重连次数4次,启用数据补传功能,确保监测数据不丢失、不遗漏。
6. 触摸屏升级: 1. 将原步科Kinco MT4403T的PPI通讯项目另存为“以太网版本”;
2. 在Kinco HMIware组态软件的设备向导中,选择“S7-200 SMART TCP/IP”,填入模块Port 2的IP地址192.168.6.1及TSAP 02.00;
3. 原有画面、变量、报警提示、趋势曲线全部复用,仅替换通讯驱动,30分钟即可完成配置。
7. 联合调试: 1. 上位机下发校时指令,PLC时钟与市政大数据平台同步成功,误差1秒;
2. 现场模拟pH=7.50、溶解氧=5.0mg/L,Modbus寄存器40001显示0x0750、40002显示0x0005,上位平台实时曲线正常,数据上传延迟<50ms;
3. 断开工业交换机电源,观察触摸屏独立运行,数据显示正常,操作控制无异常;
4. 恢复交换机供电,模块自动重连,历史数据自动续传,无丢包、错包现象,满足市政监测要求。
五、运行效果:三大价值赋能市政污水监测 1. 数据合规,满足监管要求:HJ212-2025要求市政污水监测数据分钟级上传,ETH-S7200-JM01实际测试Modbus TCP单轮询时间<50ms,上位平台30秒内可完成全部监测因子采集,数据上传及时、准确,成功通过市政环保部门的专项检查。
2. 运维提效,降低成本: 1. 远程运维:工程师在市政中控室通过VPN即可远程下载、修改PLC程序,无需前往偏远监测点,出差频次减少90%,每年节省人工及差旅费近2万元;
2. 故障快速定位:触摸屏本地报警与上位机短信报警联动,故障响应时间从原来的4小时缩短至30分钟,有效减少设备停机时间,保障污水处理连续运行;
3. 备件通用:模块兼容S7-200 SMART全系列CPU,运维公司无需为不同监测点的PLC储备专用通讯模块,库存SKU减少50%,降低库存成本。
3. 扩展灵活,适配未来升级:后续计划新增污水COD、氨氮监测因子,只需在原有模块寄存器表中追加地址,无需重新布线、修改PLC程序;
若未来将S7-200 SMART升级为S7-200 SMART SMART,该模块可直接兼容,有效保护前期投资,降低升级成本。
六、经验小结 本案例成功展示了捷米特ETH-S7200-JM01PPI以太网模块在工业领域的应用价值。
通过将西门子S7-200 SMART PLC的PPI通讯转换为以太网通讯,有效解决了传统串口通讯的局限性,提升了系统的可扩展性和远程管理能力 (其他内容配置过程及其他相关咨询可联系杨工。
)