在流行文化中,我们已经习惯了外星人说英语,或者在一个看似神奇的通用翻译器的帮助下立即被理解。
在现实生活

在流行文化中,我们已经习惯了外星人说英语,或者在一个看似神奇的通用翻译器的帮助下立即被理解。

在现实生活中,可能没那么容易。
考虑潜在的问题。
首先,我们遇到的任何潜在的外星人都不会说人类的语言。
第二个是缺乏关于外星人文化或社会学的知识——即使我们能翻译,我们也可能不明白这与他们的文化标准有什么关系。
Eamonn Kerins是来自英国曼彻斯特大学Jodrell Bank天体物理中心的天体物理学家,他认为外星人自己可能会认识到这些局限性,并选择通过尽可能简单地传递信息来为我们做一些繁重的工作。
人们可能希望想要建立联系的外星人可能会试图让他们的信号尽可能普遍理解,Kerins在Zoom采访中说。
也许这是一些像数学序列一样基本的东西,并且已经传达了一个信息,也许他们希望首先传递的信息是,我们在这里,你并不孤单。
事实上,几十年来,SETI一直在考虑接收可识别的数学信息的可能性——圆周率,一系列素数 如卡尔·萨根的小说《接触》中的情况——但这不是我们可能接收的唯一可能的信息。
其他信号的设计可能更复杂,试图传达更复杂的概念,这就是我们遇到第三个问题的地方:外星语言可能比人类交流复杂几个数量级。
这就是我们需要人工智能帮助的地方,但要理解如何帮助,首先我们必须深入研究语言结构背后的细节。
信息论当我们谈论一个复杂的信号或信息时,我们并不意味着外星人一定会谈论复杂的事情。
相反,它指的是他们的信息结构,他们的语言背后的复杂性。
语言学家称之为信息论,它是由20世纪40年代在新泽西州贝尔实验室工作的密码学家和数学家克劳德·香农提出的,并由哈佛大学的语言学家乔治·齐夫加以扩展。
信息论是一种提取任何给定通信的信息内容的方法。
香农意识到,任何类型的信息传递——无论是人类语言,还是吸引捕食者吃树叶上的毛虫的植物化学散发物,或者是通过光缆传输的数据——都可以分解为离散的单元或比特。
这些就像交流的量子,如字母表的字母或海豚的口哨声。
在语言中,这些位不能以任何顺序排列。
还有语法,它描述了语法规则,这些规则规定了比特如何排序。
比如:英语中,单词开头的一个‘q’后面总是跟着一个‘u’,然后这个‘u’后面可以跟着有限的几个字母,以此类推。
现在假设有一个缺口——qu——k。
从语法上我们知道,只有几种字母组合可以填补这个空白——AC 嘎嘎、ar 夸克、IC quick和ir quirk。
但是,如果这个单词是句子的一部分——‘鸭子去了——k ’,那么通过上下文我们知道丢失的字母是‘AC’。
通过了解规则或语法,我们可以填补空白。
仍然允许我们完成句子单词的缺失量被称为香农熵,由于其复杂性,人类语言在地球上任何已知的自然交流形式中具有最高的香农熵。
同时,Zipf能够量化香农信息论的这些基本原则。
在任何交流中,一些小单位,这些基本的比特,会比其他的出现得更频繁。
例如,在人类语言中,字母e、o、t和r出现的频率远远高于q或z。

当首先用最常见的单位 在x轴上,它们在y轴上的出现率绘制图表时,所有人类语言都会产生一个梯度为–1的斜率。
在另一个极端,婴儿的随机牙牙学语会在图上造成一条水平线,所有的声音都是同样可能的。
交流越复杂——例如,当婴儿长到蹒跚学步并开始说话时——斜率就越趋向于-1的梯度。
例如,现在传输圆周率的数字时,斜率为–1。
因此,一些研究人员认为SETI应该专门寻找斜率为-1的信号,而不是寻找技术签名,即技术生成的信号,这些信号可以标记其他高级地外文明,不管它们是否看起来是人工的,并且仔细筛选射电望远镜收集的每一个数据片段的机器学习算法可以配置为分析每个潜在信号,以确定信号是否符合Zipf定律。
除此之外,外星交流可能比人类语言具有更高的香农熵,如果它高得多,可能会使他们的语言对人类来说太难掌握。
但对人工智能来说可能不是。
人工智能已经在接受测试,试图理解来自非人类物种的交流。
如果它能通过这个测试,也许人工智能将在未来准备好处理任何外星信息。
ChatGPT等人工智能系统已经擅长理解和产生自然的人类语言。
图片鸣谢:uux.cn/iStock/Getty Images解读海豚交流丹尼斯·赫金是佛罗里达州朱庇特野生海豚项目的研究主任,她是世界上试图理解海豚之间交流的最权威的专家之一。
Herzing四十年来一直与海豚一起游泳,研究它们的交流,现在他将人工智能引入其中。
我们有两种方式来看待海豚的交流,它们都使用人工智能,Herzing告诉Space.com。
一种方法是听组成海豚自身交流的各种口哨声和叫声的录音。
特别是,正如Shannon和Zipf所描述的那样,机器学习算法能够提取海豚聊天的片段,并在声谱图 一种按频率组织的声音图上将其分解为离散的单元,然后用字母标记每个独特的单元。
这些变得类似于单词或字母,Herzing正在研究它们组合的不同方式,或者换句话说,它们的有序度和结构。
现在我们已经确定了24个小单元的声音在声谱图中重新组合,Herzing说。
"所以你可能有向上的哨声' A ',然后是向下的哨声' B ',等等,这就为一系列的声音创造了一个符号代码。
"然后,机器学习算法能够深度分析录音,搜索符号代码重复的实例。
我们正在寻找有趣的重复序列,Herzing说。
然后算法在序列中寻找替换和删除,所以你可能有相同的符号代码,但一个小哨子是不同的。
这是一个非常重要的学习算法。
这种微小的差异可能是因为它包含了海豚的标志性哨声 每只海豚都有自己独特的标志性哨声,一种类似人类名字的标识符,或者是因为上下文不同。
这完全符合香农的信息论,Herzing也对Zipf定律感兴趣,并对海豚的交流如何复制该-1斜率感兴趣。
我们正在寻找类似语言的结构,因为每种语言都有遵循规则的结构和语法,Herzing说。
我们正在专门寻找重组数据的可能性——我们的小声音单元是单独存在,还是与另一种声音重组?Herzing的团队一直在寻找二元词——两个单位频繁出现在一起的情况,这可能意味着一个特定的短语。
最近,他们还一直在寻找三元组——其中三个单元按顺序有规律地出现——这意味着更大的复杂性。
语言学家几十年来一直在研究海豚的交流,这项研究可能是与外星人交流的一个很好的类比。

图片鸣谢:uux.cn/iStock/Getty Images寻找意义这正是人工智能开始分析SETI信号中嵌入的真实信息的方式。
如果外星人的交流在结构和句法上比人类语言更复杂,那么这就告诉了我们一些关于他们的事情;
也许他们的物种比我们的更古老,这给了他们足够的时间来进化他们的交流。
然而,我们仍然不知道他们在信息中对我们说的上下文。
这是目前理解海豚交流的挑战之一。
Herzing有海豚豆荚的视频片段,每当AI检测到符号代码的重复发声时,就可以看到它们在做什么,这允许Herzing尝试并推断声音的背景。
但如果你处理的是无线电信号,你怎么才能弄清楚信息的上下文呢?Herzing问道,他也对SETI感兴趣。
观察动物的声音类似于观察外星信号,可能是为了建立分类和分析 信号的工具。
但是对于解读部分呢?天哪,我不知道。
一旦我们收到外星人的信号,我们可能会想对他们说些什么。
理解上下文的困难在这里也再次出现。
正如斯波克在电影《星际迷航4:回家的旅程》中讨论回应外星人探测器时说的,我们可以复制声音,但不能复制意义。
我们会胡言乱语。
Herzing试图通过与海豚共同商定如何称呼事物来规避这个语境问题。
这是CHAT 鲸类听觉和遥测的本质,这是研究人员使用AI尝试与海豚交流的第二种方式。
在它的第一个版本中,CHAT是一个绑在用户胸部的大型设备,通过水听器 水下麦克风接收声音,然后通过扬声器发出声音。
现代版是智能手机大小,戴在手腕上。
这个想法不是用海豚语交谈,而是在海豚想玩的某些玩具的预编程声音上与海豚达成一致。
例如,如果他们想玩呼啦圈,他们会按约定吹口哨叫呼啦圈。
如果戴着聊天设备的潜水员想让海豚带给他们一个铁环,水下扬声器可以吹口哨发出铁环人工智能的工作是从海豚发出的所有其他声音中识别出商定的哨声,这些声音来自水下的各种音频干扰源,如气泡和船只螺旋桨。
Herzing观察到海豚使用了约定的口哨声,但是在大多数不同的情况下。
Herzing说,问题是花足够的时间与任何一只特定的海豚相处,让它们完全学会一致同意的声音。
对于外星人,他们的信息将会传播许多光年;
任何双向交流都可能需要几十年、几个世纪、几千年,如果有可能的话。
所以无论我们有什么关于外星人的信息都会被浓缩到他们的原始传输中。
如果像Kerins猜测的那样,他们发送一些数学上的东西只是作为一个信号,告诉我们他们在那里,我们并不孤单,那么我们就不必担心破译它。
然而,如果他们确实发送了一个更复杂的信息,那么正如Herzing在海豚身上发现的那样,数据集的大小是至关重要的,所以让我们希望外星人将他们的信息打包,给我们和AI一个最好的机会,至少评估一些信息。
清华大学宣布成立人工智能医院,医院建设将分阶段进行;
北京协和医院部署基于深度学习的人工智能诊断系统……"AI+医疗"应用遍地开花,价值日益凸显:从提升诊疗效率到赋能日常健康管理,人工智能正在重塑医疗服务模式,为健康中国建设注入强劲动力。
春季是传统的体检季,可很多人拿到体检报告却犯了难。
一项5000名网友参与的调研显示,80%的受访者表示体检报告没有得到详细讲解,也不知道检后该怎么做;
75%的受访者没有按体检报告的建议进行复查。
5月6日,AI健康应用蚂蚁阿福启动“健康中国体检关怀行动”。
用户打开阿福App拍照或上传体检报告,即可获得实时、免费、专业的解读。
记者体验发现,打开App首页,点击+号或者“报告解读”按钮,对着体检报告拍照或者上传PDF文件,就能获取报告解读,该AI解读体检报告会以“红绿灯”形式清晰告知检查结果关注优先级,并给到针对性的健康行动清单。
解读完成后,用户可自主选择是否将体检报告存入阿福的健康档案,方便随时查看和管理,未来也能让AI提供更精准、个性化的健康问答服务。
对普通人来说,这相当于身边多了一位私人健康顾问。
随着“健康中国”战略深入推进,预防性健康管理成为大众关切的重点,体检更是提升全民健康水平的重要抓手。
AI解读体检报告,降低了报告解读门槛,有助于让体检真正成为用户健康管理的起点。
相关产品负责人表示,AI正在成为用户获取健康服务的重要入口。
阿福的体检报告解读功能最适合三类人群使用:忙碌的打工族、照顾全家的家庭顶梁柱以及高度关注健康的老年人。
通过AI解读体检报告,可以帮用户更早识别健康风险,主动管好自己和家人的健康。
北京佑安医院感染综合科主任医师李侗曾表示:“很多人不知道,其实看懂体检报告和体检本身同样重要。
AI技术帮1亿人把体检报告变成‘健康说明书’,非常实用,它让普通人也能了解自己的身体状况,使体检真正成为管理健康的起点。
这正是科技该有的温度,也将有效助力‘健康中国’战略加速推进。
”
刘烈宏表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能;
有媒体称,这也从官方角度上为Token给出了翻译:“词元”。
“日均词元调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段。
”刘烈宏表示,人工智能应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力在显著增强,现在备受关注的Token出海,就是产业竞争力增强的一个标志。
作为大模型处理信息的最小信息单元,Token具有智能时代可计量、可定价、可交易的特征。
刘烈宏表示,围绕Token的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业可能变现的重要路径。
中国日均Token调用量的大幅增长也表明,随着中国数据要素市场化配置改革的纵深推进,人工智能高质量数据的供给体系正在形成,“数据供给—价值释放”的良性循环已初现端倪。
换句话说,AI时代,Token经济,或者说“词元经济”正在崛起。
黄仁勋在最新的采访中,为Token经济的前景给出了颇为乐观的预期。
他认为,计算机现在已经开始转变为可以创收的“工厂”,这些工厂生产出来的商品即为人们愿意消费的Token,对不同受众来说都极具吸引力、极具价值。
由此,Token开始出现分层。
据日前媒体报道显示,在Meta、OpenAI等科技公司内部,已出现内部员工Token消耗量排行榜。
同时,“Token预算”成为程序员的一项职业福利,就像牙科保险或免费午餐一样;
而一些人为了让自己的工作尽可能实现自动化,每月甚至会消耗价值数千美元的额度。
据悉,国家数据局将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划,以场景需求为牵引,加快推进先行先试的工作,打造技术可行、实用便捷、质量保障的AI-Ready(AI就绪度)高质量数据集,实现高质量数据集供给的量质提升。
来源:新华社、财联社|版权归属原作者,如有侵权请联系