遥遥领先？GPT-4 多模态模式即将发布!

Original 陈建涵 AI小岛 2024-04-15

这个世界太疯狂了，前几天我们刚说完“ Windows 11：全面整合AI，与MacOS竞争加剧 ”、“ Google Bard Extension vs ChatGPT Plus：哪个更高级 ”以及“ DALL·E 3即将发布：未来的创意革命已经到来！”，这不，OpenAI的GPT-4多模态版本终于要发布了。

而在这其中，ChatGPT不仅是一个聊天助手，它更是一个多模态交互的巨头，拥有无限的应用潜力和商业价值。从语音到图像，再到商业合作，一切都只是冰山一角。

语音交互与应用场景

你现在可以通过语音与ChatGPT进行对话。无论是在外出时，还是在家里，你都可以通过语音与它进行互动。

只需进入移动应用的设置，开启新功能，然后选择你喜欢的声音。

如何开启

打开移动应用，进入设置 → 新功能，选择开启语音对话。

声音选择

提供五种不同的声音选项，由专业的声音演员录制。

技术支持

使用了全新的文本识别语音模型和开源的语音识别系统Whisper。

应用场景与安全性

1. 家庭教育: 用语音功能给孩子讲一个睡前故事。
2. 旅行指导: 在旅行时，通过语音询问附近的旅游景点或餐厅。
3. 日常辩论: 在家庭聚餐时，用语音功能解决一些小争议。
4. 医疗咨询: 通过语音功能，可以更方便地与医生进行远程咨询。

为了防止恶意使用，所有的语音数据都会进行加密处理。

图像交互与应用场景

你可以向ChatGPT发送一张或多张图片，它会根据图片内容给出相应的建议或信息。

如何使用

点击照片按钮，选择或拍摄一张图片。

多图交互

可以发送多张图片，并使用绘图工具进行标注。

技术支持

使用了多模态的GPT-3.5和GPT-4模型。

应用场景与安全性

1. 家务助手: 拍摄冰箱里的食物，ChatGPT会推荐晚餐菜单。
2. 工作辅助: 上传复杂的工作图表或数据，进行分析。
3. 教育辅导: 孩子的数学问题可以通过拍照和圈选问题集来解决。

在推出这些新功能之前，已经进行了大量的风险评估和测试。

想象一下，你正在旅行，看到一个美丽的地标，但不知道它的历史背景。现在，你只需拍张照片，ChatGPT就能给你详细介绍。或者在家里，不知道晚餐吃什么，拍摄冰箱里的食材，ChatGPT会给你提供食谱。

这些新功能将在接下来的两周内逐步推出给Plus和Enterprise用户。语音功能将在iOS和Android平台上推出，而图像功能将在所有平台上推出。

AI小岛Tips

ChatGPT是一个不断发展的产品，建议用户定期查看更新日志。

你最期待哪个新功能？语音还是图像？

结束语

GPT-4的多模态模式不仅具有巨大的应用潜力，还可能在商业领域产生深远的影响。

如果你觉得这篇文章有用，不妨点个赞，让更多人看到！

AI小岛涵哥出品

【微信号】sanhan2016

个人转载内容至朋友圈和群聊天，无需申请版权许可。

都看到这里了，你不关注一下嘛👇 👇 👇

你的点赞，是我持续更新的动力。

继续滑动看下一个

AI小岛

向上滑动看下一个

一把短刀，怎么就让他连捅18人？！

这次我怀疑邱成桐已经“学阀化”了

13岁工作的常务副县长，接连缺席官方活动

内塔尼亚胡喊话伊朗人民：我们是一伙的，哈梅内伊政权才是敌人

向杨大市长道歉

遥遥领先？GPT-4 多模态模式即将发布!

您可能也对以下帖子感兴趣

一把短刀，怎么就让他连捅18人？！

这次我怀疑邱成桐已经“学阀化”了

13岁工作的常务副县长，接连缺席官方活动

内塔尼亚胡喊话伊朗人民：我们是一伙的，哈梅内伊政权才是敌人

向杨大市长道歉

生成图片，分享到微信朋友圈

遥遥领先？GPT-4 多模态模式即将发布!

您可能也对以下帖子感兴趣