遥遥领先?GPT-4 多模态模式即将发布!
这个世界太疯狂了,前几天我们刚说完“ Windows 11:全面整合AI,与MacOS竞争加剧 ”、“ Google Bard Extension vs ChatGPT Plus:哪个更高级 ”以及“ DALL·E 3即将发布:未来的创意革命已经到来!”,这不,OpenAI的GPT-4多模态版本终于要发布了。
而在这其中,ChatGPT不仅是一个聊天助手,它更是一个多模态交互的巨头,拥有无限的应用潜力和商业价值。从语音到图像,再到商业合作,一切都只是冰山一角。
语音交互与应用场景
你现在可以通过语音与ChatGPT进行对话。无论是在外出时,还是在家里,你都可以通过语音与它进行互动。
只需进入移动应用的设置,开启新功能,然后选择你喜欢的声音。
如何开启
打开移动应用,进入设置 → 新功能,选择开启语音对话。
声音选择
提供五种不同的声音选项,由专业的声音演员录制。
技术支持
使用了全新的文本识别语音模型和开源的语音识别系统Whisper。
应用场景与安全性
1. 家庭教育: 用语音功能给孩子讲一个睡前故事。
2. 旅行指导: 在旅行时,通过语音询问附近的旅游景点或餐厅。
3. 日常辩论: 在家庭聚餐时,用语音功能解决一些小争议。
4. 医疗咨询: 通过语音功能,可以更方便地与医生进行远程咨询。
为了防止恶意使用,所有的语音数据都会进行加密处理。
图像交互与应用场景
你可以向ChatGPT发送一张或多张图片,它会根据图片内容给出相应的建议或信息。
如何使用
点击照片按钮,选择或拍摄一张图片。
多图交互
可以发送多张图片,并使用绘图工具进行标注。
技术支持
使用了多模态的GPT-3.5和GPT-4模型。
应用场景与安全性
1. 家务助手: 拍摄冰箱里的食物,ChatGPT会推荐晚餐菜单。
2. 工作辅助: 上传复杂的工作图表或数据,进行分析。
3. 教育辅导: 孩子的数学问题可以通过拍照和圈选问题集来解决。
在推出这些新功能之前,已经进行了大量的风险评估和测试。
想象一下,你正在旅行,看到一个美丽的地标,但不知道它的历史背景。现在,你只需拍张照片,ChatGPT就能给你详细介绍。或者在家里,不知道晚餐吃什么,拍摄冰箱里的食材,ChatGPT会给你提供食谱。
这些新功能将在接下来的两周内逐步推出给Plus和Enterprise用户。语音功能将在iOS和Android平台上推出,而图像功能将在所有平台上推出。
【微信号】sanhan2016
个人转载内容至朋友圈和群聊天,无需申请版权许可。