美国时间周一,OpenAI宣布聊天机器人ChatGPT新增语音功能。这使得OpenAI在智能语音助手领域与谷歌、苹果、亚马逊等科技巨头展开竞争。
ChatGPT可以用五个角色回答用户的问题,听起来比Alexa和Siri等语音助手更有人情味。OpenAI表示,增加语音功能是吸引更多用户使用ChatGPT并与其互动的重要方式。
Peter,OpenAI消费产品副总裁
邓)在接受采访时说:这是我们面临的挑战,最困难的任务之一就是简化这项令人惊叹的技术。
就在OpenAI宣布推出ChatGPT语音功能的同一天,亚马逊宣布向人工智能初创公司Anthropic投资高达40亿美元的协议。这是自微软今年早些时候投资OpenAI以来,人工智能领域最大的一笔交易,表明科技巨头正押注于热门的人工智能初创企业。
谷歌、亚马逊和OpenAI等公司上周发布了几款人工智能产品,以击败竞争对手。整合到现有扬声器中是公司让用户使用聊天机器人并为其付费的关键方式之一。
亚马逊近日宣布,Alexa家庭音箱将加入聊天机器人“对话”功能,这种音箱已经进入了数百万美国家庭。另一方面,谷歌表示,正在考虑将聊天机器人Bard技术应用于其语音助手。
目前,人们可以在ChatGPT的移动应用程序上大声提问,但聊天机器人以文本形式回答问题。现在,作为问题的一部分,人们还可以将图片上传到聊天机器人上,比如展示冰箱里的配料图片,并让聊天机器人给出食谱建议。
语音和图像功能的加入,使ChatGPT成为一款真正的“多模式”机型,可以“看到”和“听到”世界,并用语音和图像做出回应。多式联运模式是行业竞争的下一个阶段,许多公司都在竞相开发更强大的模式。
多年来,语音助手已经出现在汽车、智能手机、电视和智能音箱中,数百万人每天都在使用它们。但在大多数情况下,语音助手只能进行简单的互动,比如开灯或预报天气。聊天机器人背后的“大语言模型”技术使语音助手有可能进行更长、更自然的对话,并回答更复杂的问题。
投资者和分析师指责亚马逊对聊天机器人和图像生成器等生成性人工智能领域的竞争反应迟缓。人类的投资将使亚马逊能够接触到这家初创公司的研究人员和技术。人类是由前OpenAI员工创立的,此前曾获得谷歌的投资。
吉姆·黑尔(吉姆,市场研究公司Gartner副总裁)
Hare)表示,亚马逊已经向市场证明,它在产生式人工智能领域是一个积极的参与者,并正在努力改变人们对它落后的印象。
OpenAI在去年11月推出了ChatGPT,引发了聊天机器人的热潮。微软与OpenAI联手使用后一种技术,而谷歌则推出了自己的聊天机器人Bard。
人工智能研究人员警告说,人们可能会过度拟人化聊天机器人,因为它们的答案往往看起来像人类的反应。这可能会导致用户错误地信任机器人的智能或能力。然而,聊天机器人仍然经常捏造信息,并将其伪装成真实的答案,这被人工智能研究人员称为“幻觉”。
ChatGPT的新角色名为Sky、Ember、Breeze、Juniper和Cove,每个角色都有不同的语气和口音。“天空”听起来有点像斯嘉丽
约翰逊),她为电影《她》中的主人公爱上的人工智能配音。OpenAI高级管理人员彼得·邓表示,配音角色并不是为了让人听起来像某个特定的人。
在一次演示中,彼得·邓展示了机器人如何理解混乱的开放式语音问题。他说,这些新功能使对话更容易、更自由,而不必考虑如何准确地表达问题。“有了这个功能,你就可以和ChatGPT聊天了,”邓说。“我的孩子现在在ChatGPT上索要睡前故事。”
OpenAI政策研究员桑德赫尼
Agarwal)在接受采访时表示,他们已经测试了语音和视频功能,并增加了安全措施,以确保机器人对敏感话题做出适当的反应。例如,如果用户询问与心理健康相关的问题,ChatGPT建议他们咨询专业人士。然而,阿加瓦尔表示,还有更多的工作要做,远未完成。