首页 > 解谜 > 大案纪实

1996年陕西安康余延军连环杀人案纪实

大案纪实 2026-04-25 菜科探索 +
简介:1996年2月28日,陕西安康的一个小村庄被一层阴霾笼罩。

村民们发现一名年轻女子惨死在村外的田埂边,女子衣衫不整,身上有多处刀伤,现场惨不忍睹。

警方迅速赶到现场

【菜科解读】

1996年2月28日,陕西安康的一个小村庄被一层阴霾笼罩。

村民们发现一名年轻女子惨死在村外的田埂边,女子衣衫不整,身上有多处刀伤,现场惨不忍睹。

警方迅速赶到现场展开调查,初步判断这是一起恶性杀人案。

然而,由于当时技术条件有限,现场留下的线索十分有限,案件侦破工作陷入了困境。

这起案件就像一颗投入平静湖面的石子,在当地引起了轩然大波,村民们人心惶惶,夜晚都不敢轻易出门。

而谁也没有想到,这仅仅是一个恶魔疯狂杀戮的开端。

疯狂作案:多地频发血腥惨案

在接下来的几个月里,余延军如同一个幽灵,在陕西安康及其周边地区频繁作案。

3月10日,在安康的另一个乡镇,又一名女子在回家途中遭遇不测,被残忍杀害并遭受性侵害。

4月15日,在距离安康不远的汉阴县,一名女学生在放学路上失踪,几天后,她的尸体在一个偏僻的山沟里被发现,死状同样凄惨。

随着时间推移,案件不断发生,受害者人数逐渐增加。

余延军的作案手法极其残忍,他大多选择单身女性作为目标,在偏僻的地方下手,先用暴力手段控制受害人,然后实施性侵害,最后将其杀害。

他的作案地点涵盖了村庄、乡镇的偏僻小道以及野外山林等地,让警方防不胜防。

截至1996年6月,已经有十二名无辜女性惨遭他的毒手,这些受害者年龄最小的仅14岁,最大的也不过30多岁,她们的生命就这样被无情地剥夺。

人物揭秘:余延军的罪恶人生

余延军,这个让整个陕西安康地区闻风丧胆的名字,其实有着一段不堪回首的过往。

他出生在一个贫困的家庭,从小缺乏良好的教育和家庭关爱。

年少时,他就经常惹是生非,与一些不良少年混在一起,逐渐走上了违法犯罪的道路。

他曾多次因盗窃、抢劫等罪名被判刑入狱,但监狱的改造并没有让他改过自新,反而让他的内心变得更加扭曲和变态。

出狱后,余延军没有寻找正当的工作来维持生计,而是继续过着游手好闲、不劳而获的生活。

由于长期没有经济来源,他对社会产生了强烈的仇恨和报复心理。

他将目标锁定在单身女性身上,认为她们容易下手,通过实施杀人、强奸等暴力犯罪行为来发泄自己内心的欲望和不满,以此来满足自己扭曲的心理需求。

真相大白:警方全力侦破擒凶

面对如此严重的连环杀人案,陕西省公安厅高度重视,成立了专案组,抽调了大量精干警力全力侦破此案。

警方对每一起案件进行了详细的梳理和分析,寻找案件之间的关联和线索。

他们走访了大量的目击者和群众,收集了众多的物证和痕迹。

经过不懈的努力,警方终于在一起案件的现场发现了一个关键的指纹线索。

通过技术比对和排查,警方将目标锁定在了余延军身上。

随后,警方展开了全面的抓捕行动。

1996年7月,经过多日的蹲守和追踪,警方在安康市的一个小旅馆内将余延军成功抓获。

面对警方的审讯,余延军起初还百般抵赖,但在大量的证据面前,他不得不承认了自己的罪行。

正义审判:恶魔终受法律制裁

1997年,余延军连环杀人案在陕西省安康市中级人民法院公开审理。

法庭上,检察官详细陈述了余延军的犯罪事实和罪行,出示了大量的证据,包括现场勘查记录、物证、证人证言等。

余延军的犯罪手段极其残忍,情节特别恶劣,后果极其严重,给社会造成了极大的危害。

经过法庭的审理和辩论,最终法院依法判处余延军死刑,剥夺政治权利终身。

听到判决结果的那一刻,旁听席上响起了热烈的掌声,受害者的家属们泪流满面,他们终于等到了正义的审判。

1997年年底,余延军被依法执行死刑,结束了他罪恶的一生。

牡丹江贾文革团伙系列杀人案纪实:地窖中的42条人命

1990年代初,中国东北正处于经济转型阵痛期。

作为老工业基地的黑龙江,国企改革浪潮下,大量工人下岗,社会矛盾暗流涌动。

讷河市,这座以甜菜与马铃薯闻名的农业小城,却因一起骇人听闻的连环杀人案成为全国焦点。

案件主犯贾文革,一个表面斯文、实则心狠手辣的恶魔,带领团伙在一年多时间里疯狂作案,将42条人命埋入地窖,制造了新中国成立以来黑龙江省最惨烈的刑事案件。

人物图谱:从工人到恶魔的蜕变

贾文革(1963-1992),讷河市本地人,中俄混血,面容英俊却心如蛇蝎。

其父母原指望他成为“有文化、能改革”的人才,但他初中辍学后进入讷河农业机械厂当工人,却因与多名女工暧昧被开除。

失业后,贾文革游手好闲,逐渐萌生通过抢劫杀人的“生财之道”。

徐丽霞,讷河市女工,本为受害者却沦为帮凶。

1990年,她因与丈夫争吵离家出走,在火车站被贾文革诱骗至家中强奸后杀害。

未料徐丽霞苏醒后从地窖爬出,贾文革以“若报案就杀你全家”威胁,迫使其成为团伙核心成员,负责勾引男性受害者。

团伙成员:除贾文革与徐丽霞外,还包括李春梅、吴凤枝、孙文力、李秀华等人。

李春梅与吴凤枝负责协助强奸、抢劫;

孙文力(县里工作人员)与李秀华(农民)提供销赃渠道;

贾文革前妻李彦珍后期也加入犯罪。

罪恶轨迹:从个体谋杀到团伙屠戮

1990年7月:首案发端

贾文革在讷河街头锁定一名衣着光鲜的失足妇女,以甜言蜜语诱骗至家中。

嫖娼后,他掐死受害者,抢走财物,并将尸体抛入自家地窖。

此次作案成功后,贾文革发现失足妇女因社会关系薄弱,失踪后鲜有人报案,遂将此类人群定为首要目标。

1990年7月-12月:讷河屠场

短短五个月内,贾文革以相同手法杀害20名女性,其中19具尸体藏于地窖,1具埋于城建苗圃。

地窖内尸体层层堆叠,部分被肢解喂狗,部分内脏被烹食。

为扩大“猎物”范围,贾文革开始物色男性受害者,但因男性警惕性高,作案难度陡增。

1991年:徐丽霞“蜕变”与团伙扩张

1991年,贾文革在火车站偶遇与丈夫吵架的徐丽霞。

将其诱骗至家中强奸后,贾文革本欲灭口,却因徐丽霞苏醒求饶而改变主意。

他逼迫徐丽霞勾引男性受害者,并当面杀害一名男子以示威胁。

徐丽霞从此成为团伙“钓鱼者”,凭借清秀外表引诱商人、推销员等男性至贾文革住处,由团伙成员注射过量安眠药或直接杀害。

1991年7月:跨省流窜作案

随着讷河失踪人口激增,警方调查压力增大,贾文革决定南下“钓大鱼”。

他带领徐丽霞、李秀华流窜至长春、沈阳、杭州、福州等地,在火车站、集市以“介绍生意”“提供工作”为名诱骗受害者。

在浙江杭州,团伙成员因形迹可疑被当地民警盘查,徐丽霞精神崩溃,向民警黄国华坦白罪行,案件终告破。

案件侦破:地窖里的罪恶真相

1991年11月:讷河警方行动

根据徐丽霞供述,讷河警方在贾文革出租屋内发现两个地窖。

第一个地窖内堆满19具高度腐烂的尸体,第二个地窖内则有22具尸体,部分已白骨化。

此外,警方在城建苗圃挖出第41具尸体,另有一名受害者尸体未被找到。

经核实,贾文革团伙共作案64起,杀害42人(女性24人,男性18人)。

痕检专家崔道植的贡献

“七一勋章”获得者、痕检专家崔道植带领团队在恶劣环境下连续工作20余天。

他们筛遍炕灰、垃圾堆,从三根麻纤维中锁定线索,为查明受害者身份和案发经过提供关键证据。

崔道植的“火眼金睛”成为案件侦破的重要支撑。

司法审判与社会震荡

1991年11月26日:公开审理

齐齐哈尔市中级人民法院开庭审理此案。

法庭上,贾文革面无表情,徐丽霞则痛哭流涕,承认自己从受害者沦为施害者的扭曲历程。

公诉人指控贾文革团伙犯下杀人、抢劫、强奸、盗窃四项罪名,证据确凿。

1992年1月24日:正义审判

法院认定贾文革为主犯,判处死刑;

徐丽霞因有重大立功表现(协助破案),从轻判处死刑;

其余团伙成员分别被判处死刑或无期徒刑。

当日,贾文革等人在讷河市被执行枪决。

英伟达力荐,小团队两个月开源一款「光速级」智能体推理引擎

机器之心编辑部 智能体时代的核心是算力。

尤其是在 Coding Agent 爆发之后,算力问题变得前所未有地尖锐。

Claude Code、Codex、Cursor 等产品正在把 AI 从「问答工具」变成「持续运行的软件协作者」,单次会话轻松突破 50K tokens,系统负载转向了更极端、更复杂的智能体负载。

最近有关算力的大新闻层出不穷。

今天的最新消息:马斯克的 SpaceX 与 Anthropic 宣布达成了重磅协议,超过 22 万块英伟达 GPU 将为 Anthropic 所用。

而 Anthropic 对与 SpaceX 合作开发未来的太空算力体系「表示有兴趣」。

在如此庞大的算力需求下,除了开源还有节流。

也是今天的最新消息:OpenAI 发布了多路径可靠连接 (MRC),可帮助大型 AI 训练集群更快、更可靠地运行,并减少 GPU 时间的浪费。

我们知道,即便只是单 GPU 吞吐率上的微小提升,一旦应用到生产级集群中,也能够在服务持续增长需求的同时,节约相当可观的算力。

来自 LightSeek Foundation 的一个小团队,在两个月时间内打造了一个全新的,号称「光速」的大模型推理引擎 TokenSpeed。

这一引擎拥有 TensorRT LLM 级别的性能,vLLM 级别的易用性。

并且拥有 NVIDIA Blackwell 上最快的 MLA 注意力内核。

一经发布,TokenSpeed 就受到了英伟达发推文力荐。

目前,该引擎已经开源。

让我们参阅其技术博客,来深入了解「光速」引擎的技术细节。

博客标题:TokenSpeed: A Speed-of-Light LLM Inference Engine for Agentic Workloads 博客链接:https://lightseek.org/blog/lightseek-tokenspeed.html Github 链接:https://github.com/lightseekorg/tokenspeed TokenSpeed 技术简介 TokenSpeed 从第一性原理出发,专门为智能体推理场景设计。

它为智能体负载提供接近「光速级」的推理能力,核心包括:基于编译器的并行建模机制、高性能调度器、安全的 KV 资源复用约束、支持异构加速器的可插拔分层 kernel 系统,以及用于低开销 CPU 侧请求入口的 SMG 集成。

建模层采用本地 SPMD(Single Program, Multiple Data,单程序多数据)设计,在性能与易用性之间取得平衡。

TokenSpeed 允许开发者在模块边界指定 I/O placement 注解。

随后,一个轻量级静态编译器会在模型构建过程中自动生成所需的 collective operation,从而无需手动实现通信逻辑。

TokenSpeed 调度器将控制平面(control plane)与执行平面(execution plane)解耦。

控制平面使用 C++ 实现,并被构建为一个有限状态机(FSM),结合类型系统,在编译期而非运行期强制执行安全资源管理,包括 KV cache 状态转移与使用。

请求生命周期、KV cache 资源以及重叠执行时序,都通过显式 FSM 状态迁移与所有权语义进行表示,因此系统正确性并非依赖约定,而是由一个可验证的控制系统来保证。

执行平面则使用 Python 实现,以保持开发效率,使研究人员与工程师能够更快进行功能迭代,并降低整体认知负载。

TokenSpeed 的 kernel 层将 kernel 从核心引擎中解耦,并将其视为一级模块化子系统。

它提供了可移植的公共 API、集中的注册与选择机制、组织良好的实现结构、面向异构加速器的可扩展插件机制、经过整理的依赖体系,以及统一的快速迭代基础设施。

与此同时,团队还针对 NVIDIA Blackwell 架构进行了大量性能优化。

例如,他们构建了当前智能体负载场景下速度最快的 MLA(Multi-head Latent Attention,多头潜在注意力)kernel 之一。

在 decode kernel 中,由于部分场景下「num_heads」较小,团队通过对「q_seqlen」与「num_heads」进行分组,以更充分利用 Tensor Core 的计算能力。

而 binary prefill kernel 则包含了经过精细调优的 softmax 实现。

目前,TokenSpeed MLA 已被 vLLM 采用。

TokenSpeed 性能预览 Coding Agents(编码智能体)带来了异常严苛的推理工作负载,上下文通常会超过 50K tokens,对话也经常跨越数十轮。

大多数公开基准测试并不能充分捕捉这种行为。

研发团队与 EvalScope 团队一起,基于 SWE-smith 轨迹对 TokenSpeed 进行评估,这些轨迹密切反映了生产环境中 Coding Agents 的流量情况。

由于生成速度对 Agent 的用户体验至关重要,因此,团队的目标是在维持单用户 TPS(每秒 token 数)下限的同时,最大化单 GPU 的 TPM(每分钟 token 数)—— 通常是 70 TPS,有时是 200 TPS 或更高。

此外,研发团队针对 TensorRT-LLM(目前 NVIDIA Blackwell 平台上的最高水平)对这一设计进行了基准测试,并在认为针对 Agentic workloads 存在更好权衡的地方,采取了与之不同的设计方案。

下图展示了在不同部署配置下(无 PD 解耦),TokenSpeed 与 TensorRT-LLM 的 Kimi K2.5 性能帕累托曲线(Pareto curves)。

每条曲线都以 TPS/User(横轴)作为延迟指标,以 TPM/GPU(纵轴)作为吞吐指标,并通过扫描并发数绘制而成。

对于 Coding Agents(高于 70 TPS/User),最佳配置是 Attention TP4 + MoE TP4。

在这一配置下,TokenSpeed 在整个帕累托前沿上均优于 TensorRT-LLM:在最低延迟场景下(batch size 1)大约快 9%,在 100 TPS/User 附近吞吐量大约高 11%。

团队表示,他们的核心优化之一是 TokenSpeed MLA。

下图对比了 TokenSpeed MLA 与 TensorRT-LLM 的 MLA,后者是目前 NVIDIA Blackwell 上的 SoTA。

可以看出来,优化后的二进制版本预填充内核(prefill kernel),使用 NVIDIA 内部旋钮来微调 softmax 实现,在 Coding Agents 的五种典型预填充工作负载(带长前缀 KV cache 的 prefill)中,都超过了 TensorRT-LLM 的 MLA。

解码内核则将查询序列轴折叠进头轴,以更好地填充 BMM1 的 M tile,从而提升 Tensor Core 利用率。

结合其他优化,在带有 speculative decoding 的典型解码工作负载中(batch size 为 4、8、16,且带长前缀 KV cache),这使得相对于 TensorRT-LLM 来说,延迟几乎降低了一半。

最后,研发团队也表示,该项目于 2026 年 3 月中旬启动开发,虽然目前展示了惊人的性能,但仍有大量底层代码(如 PD 分离、KV 存储等)正在合并和完善中,接下来将继续推进。

从上述性能表现来看,不难看出,TokenSpeed 的出现旨在通过更现代化的架构设计,打破传统推理框架在易用性与极致性能之间的平衡点,为大规模 Agent 部署提供了一个高性能、开源的底座。

而英伟达的力荐,也说明推理引擎正在成为 Agent 时代基础设施竞争的一个新焦点。

更多信息,请参阅原博客! 参考链接: https://x.com/lightseekorg/status/2052048105412141376 https://x.com/NVIDIAAI/status/2052061195381911806

“4只皮皮虾1035元”最新进展:当事人称已接到最新回复“市监局说价格没问题”

网友质疑“4只皮皮虾1035元”最新进展。

5月7日上午,记者联系上该网友,其回复称目前已经接到三亚市场监督管理局说价格没问题。

据极目新闻:5月5日,有网友反映,其在三亚一家海鲜店宵夜时,仅4只皮皮虾就花费1035元,价格过高,店家存在宰客行为。

网友发帖 该网友发布的图片显示,其于5月4日晚间前往三亚某海鲜店用餐,点了中号红花蟹、大号泰国濑尿虾、椰子饭及部分酒水饮品,4人共计消费1815元。

账单显示,大号泰国濑尿虾的单价为每千克1512元;

另一张点菜单则标注“大泰虾”4只,单价756元。

该网友在帖子中明确表示,已拨打12345政务服务热线进行投诉。

评论区多名网友称价格过高,并表示在其他地方吃没有这么贵。

账单 6日凌晨,三亚市市场监督管理局微信公众号发布情况通报回应此事:“5月5日,我们关注到有网友反映我市一海鲜店存在价格过高的问题,我局立即联合相关部门介入调查,目前三亚放心游平台已启动先行赔付机制。

一旦查实存在违法违规行为,我们将依法从严处理,绝不姑息。

” ▌来源:大象新闻、极目新闻 ▌编辑:韩明霞 校对:汤琪

1996年陕西安康余延军连环杀人案纪实

点击下载文档

格式为doc格式