小爱同学怎么设置对话_小爱同学怎么自定义回答


近日,IT之家在12月3日的报道中提到,小爱同学官方发布了详细信息,深入解析了其连续对话功能的运作原理,并强调这一功能并非仅仅是减少了唤醒次数。

小爱同学官方表示,自然连续对话功能建立在全双工技术的基石之上。全双工是通信传输领域的一个术语,它指的是双向同步的信息传输。在语音交互中,全双工技术使小爱同学具备了“边说边听”的能力,即在处理用户指令的同时也能进行对话。从用户的角度来看,这意味着他们可以在任何时候打断小爱同学的讲话。

虽然全双工技术是关键,但要实现在手机上的连续对话,还需要克服一系列技术难题。这包括连续说话声的检测和语音识别、回声消除以及无关人声的识别与拒识等。

在回声消除方面,手机需要消除自身发出的声音。这需要硬件支持和系统底层的优化。相关团队通过不断的调试和优化,成功突破了技术难关,并在新款主流机型上取得了良好的效果。

对于无关人声的拒识,系统需要识别周围的人是否正在与小爱同学交流。如果不是,则不作出响应。这一挑战主要源于我们致力于更好地满足用户与小爱同学的交互需求,因此在开放领域实现了全双工技术,这在业界被认为是一个较大的挑战。拒识任务的定义并不明确,需要结合产品体验和技术现状来界定问题范围。我们采用了一种端到端的数据驱动方法,结合语音和语义特征进行联合建模,取得了显著的效果。在实际测试中,当用户在较为嘈杂的环境中使用小爱同学时,系统能够过滤掉大部分无关人员的说话声,减少对用户的干扰。

关于小爱同学连续对话功能的实现目的,小爱团队负责人博士表示,这不仅仅是单次唤醒或效率提升的简单体现,更是一种能力的进化。通过连续对话,小爱同学能够在人与人之间的交互中处理更复杂的任务,如语音点餐、语音问诊、语音教学等,这些都是在连续对话中产生的更为复杂的任务。