4o!速度提升200%?支持实时音视频交互

作者:小菜 更新时间:2024-05-15 点击数:
简介:5月14日上午消息,赶在Google I/O开发者大会公布 AI 产品前夕,OpenAI又来抢风头了。

北京时间5月14日凌晨,OpenAI在一则简

【菜科解读】

5月14日上午消息,赶在Google I/O开发者大会公布 AI 产品前夕,OpenAI又来抢风头了。

北京时间5月14日凌晨,OpenAI在一则简短的视频介绍中发布了可实时进行音频、视觉和文本推理的新一代AI模型GPT-4o,并将推出PC桌面版ChatGPT。

据介绍,GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思。

在API使用方面,相比去年11月发布的GPT-4-turbo,GPT-4o价格下降50%,速度提升200%,未来几周内GPT-4o语音和视频输入功能也将随之推出。

OpenAI发布全能模型GPT-4o!速度提升200% 支持实时音视频交互

此外,OpenAI还宣布,GPT4-o与ChatGPT Plus会员版所有的能力,包括视觉、联网、记忆、执行代码、GPT Store等,将对所有用户免费开放!

发布会上,OpenAI联合创始人兼总裁格雷格布罗克曼(Greg Brockman)还将旧版本只具备对话功能的ChatGPT,与基于GPT-4o发布的具备视觉能力的新版ChatGPT进行了5分钟的对话。

OpenAI发布全能模型GPT-4o!速度提升200% 支持实时音视频交互

对话中,新版本ChatGPT不仅能通过视觉AI能力理解摄像头中发生的事情,同时还能够将理解的内容通过语音与旧版本ChatGPT交互,进行更加丰富有趣的互动。

同时还支持中途打断和对话插入,且具备上下文记忆能力。

对于此次发布,OpenAI CEO萨姆奥尔特曼(Sam Altman)发实时推文表示,“新的GPT-4o模型是OpenAI有史以来最好的模型,它很智能,速度很快,是原生多模态,并且可供所有ChatGPT用户使用,无论是免费版本还是付费GPT-4版。

“这对我们的使命很重要,我们希望将出色的AI工具交到每个人手中。

”萨姆奥尔特曼表示。

对于此次发布会,此前外媒传言OpenAI会发布会新的智能搜索能力,但随后出现反转——称“散布发布搜索产品系抓捕公司内部泄密者”。

此次发布会,OpenAI没有带来新的AI搜索产品,而是在虚晃一枪后发布了升级后的GPT-4o。

但除了新模型的性能提升外,OpenAI此次发布,在有了更多产品性能改进之时,也出现了一些问题。

OpeanAI发布会后,便有业内专家表示,“GPT-4o的多模态能力只是看起来很好,实际上OpenAI并未展示对于视觉多模态来说真正算是突破的功能。

此外,在实时音频交互方面,目前国内诸如豆包、文心一言等产品也已具备类似通话功能。

ai人工智能工具

快影AI是北京快手科技有限公司推出的一款综合性的智能视频编辑应用,该应用结合了视频剪辑与人工智能创作双重功能。

除了提供全面的视频编辑工具,如分割、裁剪、调整速度、添加字幕等,它还巧妙地融入了AI技术,涵盖了AI绘画、AI文本生成图像、AI文案库以及AI动漫视频制作等功能,从而帮助用户便捷地创作出高质量的视频作品。

如何注册快影AI?首先,您可以通过访问快影官方网站或者在手机应用商店(例如苹果App Store或安卓系统的Google Play)内搜索并下载安装快影应用。

接着,在快影APP界面点击“注册”或“登录”按钮,您可以选择使用手机号码注册,也可以通过微信、QQ等第三方账号快速完成注册流程。

快影AI使用指南:1. 基础视频剪辑:- 创建新项目:启动APP后,选择创建新项目,并导入待剪辑的视频素材。

- 编辑操作:运用分割、裁切、拼接等多种功能对视频进行基本编辑。

此外,还可添加转场效果、调整视频播放速率(正常、曲线或自定义变速),并设定封面及结尾。

- 音效与字幕:利用内置的音效库和音乐库为视频配上背景音乐或音效;同时,通过语音识别功能快速生成字幕。

2. 人工智能创作功能:- AI动漫视频:上传真人视频,挑选相应的动漫风格(如卡通、中国风、日系动漫等),快影AI将会自动制作出具有动漫效果的作品,助您塑造独特的虚拟形象。

- AI文生图:输入文字描述并选定图片风格,由AI智能生成对应的图片。

- AI绘画:上传原始图片,选择相应的风格模式,AI会为您创作出新的图像效果,同时还可添加关键词描述。

- AI文案库:提供适用于视频、图片说明以及文案修订的功能,帮助用户迅速生成优质文案。

3. 素材与模板资源:- 大量模板:快影拥有海量模板供用户选用,涵盖多样化的风格,只需一键即可轻松剪辑出热门短视频。

- 素材库:内置丰富多样的贴纸、滤镜、视觉特效和热门梗等素材,紧随潮流趋势,有助于增强视频的互联网感觉。

4. 创作中心:- 数据与灵感:快影的创作中心针对快手账号运营难题提供解决方案,为创作者推荐创意灵感,挖掘粉丝喜好,助力账号吸引更多关注者。

5. 导出与分享:- 完成编辑后,请点击导出按钮,选择所需的视频画质(如高清、超高清等),将其保存至本地设备。

- 导出后,您可以直接将作品分享至快手、抖音等社交媒体平台。

特别提示:部分快影的高级功能需要购买VIP会员才能解锁,会员权益包括专享素材、进阶功能、解锁更多模板、特权音效、免广告、云存储空间等。

若需使用AI功能,建议确保网络连接稳定,以便高效生成和下载由AI所生成的内容。

ChatGPT会抢谁的饭碗 ChatGPT会涉及哪些行业

专业的在线重装系统软件 全新设计 / 全新代码编写 / 全新支持所有机型 全新支持Window 11 安装 ChatGPT会抢谁的饭碗?ChatGPT 是一个自然语言处理的 AI 技术,它可以用于各种文本相关的任务,比如问答、翻译、摘要、对话等。

因此,ChatGPT 可能会影响那些与文本相关的行业和工作,包括但不限于以下几个方面。

工具/原料:系统版本:win10品牌型号:联想yoga13软件版本:ChatGPT2023ChatGPT会涉及哪些行业:首先,需要明确的是,短时间内可能完全无法替代以下行业,但是可以在短时间内影响以下行业。

1、文本编辑和撰写ChatGPT 可以根据输入的主题和要求,生成相关的文章或段落,具有较高的可读性和连贯性。

如果 ChatGPT 的质量得到更进一步的提高,那么它完全有可能会取代一些文本编辑和撰写的工作,特别是一些基础性的文章和报告。

这并不意味着 ChatGPT 能够完全取代人类的写作能力,因为创意和创新依然是人类所独有的,ChatGPT很难在短时间内学会这项技能。

2、翻译服务和外语教育ChatGPT%20在语言翻译方面也有不错的表现,可以较为准确地将一种语言翻译成另一种语言,如果未来能够实现更加自然的语言交流,那么%20ChatGPT%20就有可能会取代部分翻译服务和外语教育的工作。

特别是对于一些简单的常用语言的翻译,可能会被%20ChatGPT%20所替代。

3、客服和在线咨询ChatGPT%20的问答能力非常强大,可以根据输入的问题快速给出相应的答案,这使得它在客服和在线咨询方面具有较高的潜力。

未来%20ChatGPT%20可能会根据用户的需求和问题,提供更为精准和智能化的服务,从而替代一些机器人客服和在线咨询的工作。

4、医学和法律行业ChatGPT 在文本理解和推理方面的能力也较强,可以处理一些医学和法律相关的文本任务,比如病例分析、法律文件的起草和审查等。

如果 ChatGPT 的准确率可以进一步提高,那么它或许会成为医学和法律领域中的一个有力工具,从而帮助医生和律师更加高效地完成一些繁琐的文本处理任务。

5、新闻和媒体行业ChatGPT 可以根据输入的主题和要求,生成相关的新闻报道或文章,如果未来 ChatGPT 的质量能够进一步提高,它可能会在新闻和媒体行业中发挥作用。

不过在这个行业中,仍然需要有人类的编辑和策划,从而保证新闻和文章的可靠性和客观性。

总结:除了以上列举的几个方面,ChatGPT 还可能会对其他行业和工作产生影响,比如教育、金融等。

尽管 ChatGPT 具有许多优势和应用前景,但它也存在着一些限制和问题,这些问题需要我们认真考虑和解决。

加入收藏
               

4o!速度提升200%?支持实时音视频交互

点击下载文档

格式为doc格式

  • 账号登录
社交账号登录