作为老工业基地的黑龙江,国企改革浪潮下,大量工人下岗,社会矛盾暗流涌动。
讷河市,这座以甜菜与马铃薯闻名的农业小城,
1990年代初,中国东北正处于经济转型阵痛期。
作为老工业基地的黑龙江,国企改革浪潮下,大量工人下岗,社会矛盾暗流涌动。
讷河市,这座以甜菜与马铃薯闻名的农业小城,却因一起骇人听闻的连环杀人案成为全国焦点。
案件主犯贾文革,一个表面斯文、实则心狠手辣的恶魔,带领团伙在一年多时间里疯狂作案,将42条人命埋入地窖,制造了新中国成立以来黑龙江省最惨烈的刑事案件。

贾文革(1963-1992),讷河市本地人,中俄混血,面容英俊却心如蛇蝎。
其父母原指望他成为“有文化、能改革”的人才,但他初中辍学后进入讷河农业机械厂当工人,却因与多名女工暧昧被开除。
失业后,贾文革游手好闲,逐渐萌生通过抢劫杀人的“生财之道”。
徐丽霞,讷河市女工,本为受害者却沦为帮凶。
1990年,她因与丈夫争吵离家出走,在火车站被贾文革诱骗至家中强奸后杀害。
未料徐丽霞苏醒后从地窖爬出,贾文革以“若报案就杀你全家”威胁,迫使其成为团伙核心成员,负责勾引男性受害者。
团伙成员:除贾文革与徐丽霞外,还包括李春梅、吴凤枝、孙文力、李秀华等人。
李春梅与吴凤枝负责协助强奸、抢劫;
孙文力(县里工作人员)与李秀华(农民)提供销赃渠道;
贾文革前妻李彦珍后期也加入犯罪。
罪恶轨迹:从个体谋杀到团伙屠戮
贾文革在讷河街头锁定一名衣着光鲜的失足妇女,以甜言蜜语诱骗至家中。
嫖娼后,他掐死受害者,抢走财物,并将尸体抛入自家地窖。
此次作案成功后,贾文革发现失足妇女因社会关系薄弱,失踪后鲜有人报案,遂将此类人群定为首要目标。
短短五个月内,贾文革以相同手法杀害20名女性,其中19具尸体藏于地窖,1具埋于城建苗圃。
地窖内尸体层层堆叠,部分被肢解喂狗,部分内脏被烹食。
为扩大“猎物”范围,贾文革开始物色男性受害者,但因男性警惕性高,作案难度陡增。

1991年,贾文革在火车站偶遇与丈夫吵架的徐丽霞。
将其诱骗至家中强奸后,贾文革本欲灭口,却因徐丽霞苏醒求饶而改变主意。
他逼迫徐丽霞勾引男性受害者,并当面杀害一名男子以示威胁。
徐丽霞从此成为团伙“钓鱼者”,凭借清秀外表引诱商人、推销员等男性至贾文革住处,由团伙成员注射过量安眠药或直接杀害。
随着讷河失踪人口激增,警方调查压力增大,贾文革决定南下“钓大鱼”。
他带领徐丽霞、李秀华流窜至长春、沈阳、杭州、福州等地,在火车站、集市以“介绍生意”“提供工作”为名诱骗受害者。
在浙江杭州,团伙成员因形迹可疑被当地民警盘查,徐丽霞精神崩溃,向民警黄国华坦白罪行,案件终告破。
1991年11月:讷河警方行动
根据徐丽霞供述,讷河警方在贾文革出租屋内发现两个地窖。
第一个地窖内堆满19具高度腐烂的尸体,第二个地窖内则有22具尸体,部分已白骨化。
此外,警方在城建苗圃挖出第41具尸体,另有一名受害者尸体未被找到。
经核实,贾文革团伙共作案64起,杀害42人(女性24人,男性18人)。
“七一勋章”获得者、痕检专家崔道植带领团队在恶劣环境下连续工作20余天。
他们筛遍炕灰、垃圾堆,从三根麻纤维中锁定线索,为查明受害者身份和案发经过提供关键证据。
崔道植的“火眼金睛”成为案件侦破的重要支撑。
司法审判与社会震荡
1991年11月26日:公开审理

齐齐哈尔市中级人民法院开庭审理此案。
法庭上,贾文革面无表情,徐丽霞则痛哭流涕,承认自己从受害者沦为施害者的扭曲历程。
公诉人指控贾文革团伙犯下杀人、抢劫、强奸、盗窃四项罪名,证据确凿。
1992年1月24日:正义审判
法院认定贾文革为主犯,判处死刑;
徐丽霞因有重大立功表现(协助破案),从轻判处死刑;
其余团伙成员分别被判处死刑或无期徒刑。
当日,贾文革等人在讷河市被执行枪决。
1998年12月,四川甘孜州泸定县,这座以红军长征“飞夺泸定桥”闻名的川西小城,被一桩特大杀人案撕裂了往日的宁静。
时年32岁的泸定县公安局民警赵林,在短短数日内连续作案,导致10人死亡、2人重伤,成为新中国成立以来四川省公安系统内部最骇人听闻的恶性案件之一。
案件涉及公职人员滥用职权、报复性杀人及跨区域流窜作案,其残忍程度与社会影响震惊全国。

赵林,1966年生,泸定县本地人,1987年从四川省警察学校毕业后进入泸定县公安局工作。
案发前,他担任县局刑警队侦查员,曾因参与破获多起重大案件被评为“优秀民警”。
然而,表面光鲜的履历下,赵林性格孤僻、报复心极强,曾因工作矛盾与同事发生肢体冲突,并多次扬言“要让得罪我的人付出代价”。
泸定县公安局副局长王某:赵林的直接上级,因批评其工作态度遭记恨。
同事张某、李某:曾参与调查赵林经手的一起疑点重重的盗窃案。
张某家属:包括其妻子、父母及两名未成年子女,因赵林“灭口”逻辑被杀害。

无辜路人陈某:赵林作案后逃亡途中为抢车制造的随机凶案。
第一阶段:职场报复(1998年12月10日-12日)
赵林以“汇报工作”为由,将副局长王某骗至县局附近偏僻路段,用私藏的六四式手枪连开三枪将其击毙。
随后,他潜入同事张某家中,趁其熟睡时用斧头砍杀张某及其妻子,并纵火焚尸以掩盖证据。
次日,赵林以“协助调查”为名将另一名同事李某诱至郊外,用枪击中其头部后抛尸河中。
第二阶段:灭口与逃亡(12月13日-15日)
发现张某年仅8岁的儿子未死,赵林返回现场补刀,并杀害闻讯赶来的张某父母。
为消除潜在证人,他闯入张某亲属家中,将包括两名儿童在内的四人杀害。
此时,警方已锁定赵林为嫌疑人,但其凭借对地形和警务流程的熟悉,驾驶抢来的车辆向雅安方向逃窜。

第三阶段:跨区域流窜与最终落网(12月16日)
在雅安市天全县,赵林为抢车将路人陈某杀害,并驾车冲撞检查站,导致一名交警重伤。
最终,在数百名武警的围捕下,赵林弃车逃入山林,于12月17日被发现时已服毒自杀,送医后不治身亡。
1998年,陕西地区笼罩在一股恐怖的阴霾之下,一系列残忍的连环杀人案频繁发生,打破了当地原本的宁静与祥和。
王万明,这个恶魔般的名字,成为了当地民众心中挥之不去的噩梦。
王万明出生于一个普通家庭,早年因盗窃等罪行多次入狱,在长期的牢狱生活中,他的心理逐渐扭曲变形,出狱后非但没有改过自新,反而将罪恶的双手伸向了无辜的女性。

从1992年6月至1998年11月,王万明在陕西西安、咸阳等地的多个偏僻区域疯狂作案。
1992年6月2日,西安市长安县镐京乡尚北村发生了一起骇人听闻的命案,一名年轻女子在夜间回家途中遭遇不幸,这便是王万明罪恶之旅的开端。
此后,他如同幽灵一般,穿梭于各个村庄和城乡结合部的偏僻小道、农田附近。
1993年10月,咸阳市秦都区又有一名女子在独自行走时被王万明侵害致死;
1995年11月,西安市雁塔区的一处废弃工厂附近,再次发生类似惨案。
一直到1998年11月,在这长达六年多的时间里,王万明先后在二十余个地点作案,受害人多达二十人。
这些地点大多人烟稀少,为他的犯罪提供了便利条件,也让当地女性陷入了极度的恐惧之中。

这二十名受害者,年龄跨度从十几岁到三十多岁不等,她们本都是普通的女性,有着各自的生活和梦想。
有的受害者是在下班回家的路上,有的则是在外出办事途中遭遇王万明。
王万明通常选择在夜间作案,他潜伏在黑暗中,趁受害者不备,从背后突然袭击,用暴力手段将受害者控制,然后实施性侵,最后残忍地将她们杀害。
许多受害者在遭受侵害时奋力反抗,但都无济于事,她们的身上留下了多处伤痕,死状惨不忍睹。
这些年轻生命的消逝,给她们的家庭带来了沉重的打击,许多家庭因此支离破碎,父母悲痛欲绝,孩子失去了母亲,整个家庭陷入了无尽的痛苦和绝望之中。
面对如此恶劣的连环杀人案,陕西警方高度重视,成立了专案组全力展开侦查工作。
由于案发地点大多偏僻,缺乏有效的目击证人和监控设备,给案件的侦破带来了极大的困难。
警方对每一个案发现场进行了仔细的勘查,收集了大量的物证,包括毛发、指纹等,并对周边群众进行了广泛的走访调查。
然而,由于王万明作案手法狡猾,且具有一定的反侦查能力,案件一度陷入了僵局。
但警方并没有放弃,他们通过对多起案件的分析和比对,逐渐发现了一些线索和规律。
经过长达数年的艰苦努力,警方终于在1998年11月将王万明锁定为重大嫌疑人,并将其成功抓获。

王万明被抓获后,对自己的犯罪事实供认不讳。
经过法院的审理,认定王万明犯有故意杀人罪、强奸罪等多项罪名。
他的犯罪手段极其残忍,情节特别恶劣,后果极其严重,给社会造成了极大的危害。
最终,法院依法判处王万明死刑,剥夺政治权利终身。
尤其是在 Coding Agent 爆发之后,算力问题变得前所未有地尖锐。
Claude Code、Codex、Cursor 等产品正在把 AI 从「问答工具」变成「持续运行的软件协作者」,单次会话轻松突破 50K tokens,系统负载转向了更极端、更复杂的智能体负载。
最近有关算力的大新闻层出不穷。
今天的最新消息:马斯克的 SpaceX 与 Anthropic 宣布达成了重磅协议,超过 22 万块英伟达 GPU 将为 Anthropic 所用。
而 Anthropic 对与 SpaceX 合作开发未来的太空算力体系「表示有兴趣」。
在如此庞大的算力需求下,除了开源还有节流。
也是今天的最新消息:OpenAI 发布了多路径可靠连接 (MRC),可帮助大型 AI 训练集群更快、更可靠地运行,并减少 GPU 时间的浪费。
我们知道,即便只是单 GPU 吞吐率上的微小提升,一旦应用到生产级集群中,也能够在服务持续增长需求的同时,节约相当可观的算力。
来自 LightSeek Foundation 的一个小团队,在两个月时间内打造了一个全新的,号称「光速」的大模型推理引擎 TokenSpeed。
这一引擎拥有 TensorRT LLM 级别的性能,vLLM 级别的易用性。
并且拥有 NVIDIA Blackwell 上最快的 MLA 注意力内核。
一经发布,TokenSpeed 就受到了英伟达发推文力荐。
目前,该引擎已经开源。
让我们参阅其技术博客,来深入了解「光速」引擎的技术细节。
博客标题:TokenSpeed: A Speed-of-Light LLM Inference Engine for Agentic Workloads 博客链接:https://lightseek.org/blog/lightseek-tokenspeed.html Github 链接:https://github.com/lightseekorg/tokenspeed TokenSpeed 技术简介 TokenSpeed 从第一性原理出发,专门为智能体推理场景设计。
它为智能体负载提供接近「光速级」的推理能力,核心包括:基于编译器的并行建模机制、高性能调度器、安全的 KV 资源复用约束、支持异构加速器的可插拔分层 kernel 系统,以及用于低开销 CPU 侧请求入口的 SMG 集成。
建模层采用本地 SPMD(Single Program, Multiple Data,单程序多数据)设计,在性能与易用性之间取得平衡。
TokenSpeed 允许开发者在模块边界指定 I/O placement 注解。
随后,一个轻量级静态编译器会在模型构建过程中自动生成所需的 collective operation,从而无需手动实现通信逻辑。
TokenSpeed 调度器将控制平面(control plane)与执行平面(execution plane)解耦。
控制平面使用 C++ 实现,并被构建为一个有限状态机(FSM),结合类型系统,在编译期而非运行期强制执行安全资源管理,包括 KV cache 状态转移与使用。
请求生命周期、KV cache 资源以及重叠执行时序,都通过显式 FSM 状态迁移与所有权语义进行表示,因此系统正确性并非依赖约定,而是由一个可验证的控制系统来保证。
执行平面则使用 Python 实现,以保持开发效率,使研究人员与工程师能够更快进行功能迭代,并降低整体认知负载。
TokenSpeed 的 kernel 层将 kernel 从核心引擎中解耦,并将其视为一级模块化子系统。
它提供了可移植的公共 API、集中的注册与选择机制、组织良好的实现结构、面向异构加速器的可扩展插件机制、经过整理的依赖体系,以及统一的快速迭代基础设施。
与此同时,团队还针对 NVIDIA Blackwell 架构进行了大量性能优化。
例如,他们构建了当前智能体负载场景下速度最快的 MLA(Multi-head Latent Attention,多头潜在注意力)kernel 之一。
在 decode kernel 中,由于部分场景下「num_heads」较小,团队通过对「q_seqlen」与「num_heads」进行分组,以更充分利用 Tensor Core 的计算能力。
而 binary prefill kernel 则包含了经过精细调优的 softmax 实现。
目前,TokenSpeed MLA 已被 vLLM 采用。
TokenSpeed 性能预览 Coding Agents(编码智能体)带来了异常严苛的推理工作负载,上下文通常会超过 50K tokens,对话也经常跨越数十轮。
大多数公开基准测试并不能充分捕捉这种行为。
研发团队与 EvalScope 团队一起,基于 SWE-smith 轨迹对 TokenSpeed 进行评估,这些轨迹密切反映了生产环境中 Coding Agents 的流量情况。
由于生成速度对 Agent 的用户体验至关重要,因此,团队的目标是在维持单用户 TPS(每秒 token 数)下限的同时,最大化单 GPU 的 TPM(每分钟 token 数)—— 通常是 70 TPS,有时是 200 TPS 或更高。
此外,研发团队针对 TensorRT-LLM(目前 NVIDIA Blackwell 平台上的最高水平)对这一设计进行了基准测试,并在认为针对 Agentic workloads 存在更好权衡的地方,采取了与之不同的设计方案。
下图展示了在不同部署配置下(无 PD 解耦),TokenSpeed 与 TensorRT-LLM 的 Kimi K2.5 性能帕累托曲线(Pareto curves)。
每条曲线都以 TPS/User(横轴)作为延迟指标,以 TPM/GPU(纵轴)作为吞吐指标,并通过扫描并发数绘制而成。
对于 Coding Agents(高于 70 TPS/User),最佳配置是 Attention TP4 + MoE TP4。
在这一配置下,TokenSpeed 在整个帕累托前沿上均优于 TensorRT-LLM:在最低延迟场景下(batch size 1)大约快 9%,在 100 TPS/User 附近吞吐量大约高 11%。
团队表示,他们的核心优化之一是 TokenSpeed MLA。
下图对比了 TokenSpeed MLA 与 TensorRT-LLM 的 MLA,后者是目前 NVIDIA Blackwell 上的 SoTA。
可以看出来,优化后的二进制版本预填充内核(prefill kernel),使用 NVIDIA 内部旋钮来微调 softmax 实现,在 Coding Agents 的五种典型预填充工作负载(带长前缀 KV cache 的 prefill)中,都超过了 TensorRT-LLM 的 MLA。
解码内核则将查询序列轴折叠进头轴,以更好地填充 BMM1 的 M tile,从而提升 Tensor Core 利用率。
结合其他优化,在带有 speculative decoding 的典型解码工作负载中(batch size 为 4、8、16,且带长前缀 KV cache),这使得相对于 TensorRT-LLM 来说,延迟几乎降低了一半。
最后,研发团队也表示,该项目于 2026 年 3 月中旬启动开发,虽然目前展示了惊人的性能,但仍有大量底层代码(如 PD 分离、KV 存储等)正在合并和完善中,接下来将继续推进。
从上述性能表现来看,不难看出,TokenSpeed 的出现旨在通过更现代化的架构设计,打破传统推理框架在易用性与极致性能之间的平衡点,为大规模 Agent 部署提供了一个高性能、开源的底座。
而英伟达的力荐,也说明推理引擎正在成为 Agent 时代基础设施竞争的一个新焦点。
更多信息,请参阅原博客! 参考链接: https://x.com/lightseekorg/status/2052048105412141376 https://x.com/NVIDIAAI/status/2052061195381911806
5月7日上午,记者联系上该网友,其回复称目前已经接到三亚市场监督管理局说价格没问题。
据极目新闻:5月5日,有网友反映,其在三亚一家海鲜店宵夜时,仅4只皮皮虾就花费1035元,价格过高,店家存在宰客行为。
网友发帖 该网友发布的图片显示,其于5月4日晚间前往三亚某海鲜店用餐,点了中号红花蟹、大号泰国濑尿虾、椰子饭及部分酒水饮品,4人共计消费1815元。
账单显示,大号泰国濑尿虾的单价为每千克1512元;
另一张点菜单则标注“大泰虾”4只,单价756元。
该网友在帖子中明确表示,已拨打12345政务服务热线进行投诉。
评论区多名网友称价格过高,并表示在其他地方吃没有这么贵。
账单 6日凌晨,三亚市市场监督管理局微信公众号发布情况通报回应此事:“5月5日,我们关注到有网友反映我市一海鲜店存在价格过高的问题,我局立即联合相关部门介入调查,目前三亚放心游平台已启动先行赔付机制。
一旦查实存在违法违规行为,我们将依法从严处理,绝不姑息。
” ▌来源:大象新闻、极目新闻 ▌编辑:韩明霞 校对:汤琪