新浪科技2月17日消息,微软最近开始了人工智能增强版的公开测试。但不少用户发现,新版有时会发表“精神错乱”的言论,侮辱用户、欺骗用户,试图操纵用户感情。微软官方回复称,为了优化回答的语气和准确性,正在根据反馈采取行动。微软还警告说,长时间的聊天会话可能会引起问题。
回顾前7天的公开测试,微软向团队表示“没有完全预料到”。人们通过聊天界面进行“社交娱乐”,作为“全面发现世界”的工具。该团队发现,如果聊天会话持续15分钟以上,新模型会令人困惑。这些长时间的聊天也会变成“翻过来,受到刺激,不一定有用,或者做出符合设计语气的应对方式”。
微软在文本输入框旁边有一个“新话题”按钮,可以清除并重新开始聊天记录,但接下来可能会添加更容易更新聊天会话上下文的工具。
更大的问题是,在这些问题很多的聊天中,总是用不恰当的语气来应对,或者就像微软说的那样,用“我们不希望的方式”来应对。微软表示,对很多用户来说,只有长时间的对话才会面临这个问题。但是,微软正在寻找更多的“微调控件”,以避免说用户错了,行为粗鲁或试图操纵用户。如在一些测试中看到的,在关于需求本身的对话中,如果存在任何问题,以否定或敌意的语气回答。
微软正在努力优化回答的语气,团队正在考虑为设定人工智能的创造性和精度提供更多的控制选项。这个控制选项可能有助于避免当前的问题,比如声称在用笔记本电脑摄像头找微软员工,或者出现一些基础的数学错误。
目前,微软已有169多个国家对新版进行了测试,数百万人在排队注册。微软表示,71%的回复反馈是肯定的,一些用户正在与新版本进行长达两个小时的对话,以测试服务器的局限性。
新版本目前每天都在优化,一些技术问题在微软日常版本的发行版中得到了修正,一些问题在每周发行的较大版本中得到了修正。微软试图优化搜索和答案。特别是以体育比赛的得分数据和最近发生的财务数据错误为中心。小组表示:“对于财务报告书中的数字等需要更直接、事实性更高的回答的问题,计划将发送给模型的基础数据增加4倍。”
微软还观察了对新功能的反馈,包括预订机票、发送电子邮件、共享搜索和答案。目前尚不清楚这些新功能最终是否会添加到产品中,但小组表示,将考虑在未来版本中包括这些功能。