人人都可以免费拥有一个《她》!GPT-4o发布:视频语音交互丝滑 还有记忆和情感!

发布时间:2024-05-17 07:41:21 阅读量:173

2013年,一部讲述人类和AI爱情的科幻电影《Her》感动了无数人。剧中,拥有迷人声线、和男主西奥多思想高度契合的“AI女友” 萨曼莎也俘获了千万观众的心。

谁不想拥有一个既无所不知,又善解人意、还幽默风趣的“她”呢?

如今,11年前的梦想照进了现实——本地时间5月13日上午,OpenAI召开GPT-4o发布会。“o”代表“omni”,是全面和全能的意思。因为该模型在文本功能的基础上,能够进行逼真的语音对话,还具备跨文字、图片、视频的交互沟通,妥妥的一个现实版的“她”!

OpenAI 首席技术官 米拉·穆拉蒂(Mira Murati)对GPT-4o进行了功能介绍:



GPT-4o 可以图、文、视频间直接沟通,无需中间转换。它可以查看用户上传的屏幕截图、照片、文档或图表,并就此和用户进行针对性的对话交流;

GPT-4o在和用户交谈的过程中,可以做到“实时响应”,即便讲话被打断也无妨。其回应音频的速度平均为320毫秒,与人类在对话中的响应时间相似;

GPT-4o现在还将具有记忆功能,这意味着它可以从之前与用户的对话中学习,并且可以进行实时翻译;

而且它的声音再也不是千篇一律的“机械音”,可以做到根据对方情绪进行语气变化,甚至是唱歌

GPT-4o可以通过Api调用,速度更快,价格却便宜50%;

ChatGPT 可以充当实时翻译。天还能够通过自动翻译和响应多种语言并进行对话。据 OpenAI 称,现在支持 50 多种语言;

今年还将推出一个新的 ChatGPT 桌面应用程序

图片


而在现场演示环节,GPT-4o不仅展现了它的实时翻译、表情识别、通过摄像头识别画面写代码分析图表等功能,还用类似斯嘉丽的声音调侃OpenAI高管,进行有趣的互动。


那一刻的情景,令无数影迷想起了《Her》,也让很多人的脸上都露出了“西奥多式的微笑”。

而OpenAI的高管也承认,他们正是从这部电影中获得灵感,才有了这个新产品。

OpenAI的CEO山姆·奥尔特曼 (Sam Altman) 在发布会后的博客文章中写道:

感觉就像电影中的人工智能AI ......对我来说,与电脑交谈从来没有真正自然过,现在它做到了。”

 “事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。

难得的是,OpenAI宣布,GPT-4o面向公众免费开放——只是付费用户将能获得更多的体验机会。

换句话说,每个人都可以拥有一个定制版的“她”!

另外,根据彭博社的报道,苹果公司已经就与 OpenAI 达成协议,将在 iPhone 的操作系统iOS 18中集成ChatGPT功能。

如果真的如此,那么iPhone 用户将可以像与真人对话一样,向 ChatGPT 提问并获得回答。那场景,想想就很期待!