测试噪音的仪器叫什么


声音的世界,AI亦能深情诠释。当言语难以触及的细微之处,声音模仿成为最真切的表达。无论是模拟引擎的轰鸣,还是邻家猫咪的轻吟,皆是生活中生动的声音语言。

人们常常用声音模仿来传达难以用语言描述的声音,这是一种自然而然的表达方式。为了探索这一领域,MIT计算机科学与人工智能实验室的研究人员投入大量精力,开发出一种独特的AI系统,无需训练,便能生成类似人类的声音模仿。

这个系统的核心是一个模拟人类声道的模型,能够精准再现声带如何通过、舌头和嘴唇发出声音。通过结合认知科学原理,研究人员利用AI算法控制这个声道模型,使其能够根据人类的表达方式,生成相应的声音模仿。

这一创新模型不仅可以将现实世界的声音转化为类似人类的模仿声,如树叶的沙沙声、蛇的嘶嘶声等,还可以反向操作,通过人类的声音模仿推测真实世界中的声音。它的工作方式类似于计算机视觉系统,能够根据草图还原高清图像。

展望未来,这一模型的应用前景广阔。从更直观的声音设计界面,到更具拟人化的虚拟现实角色,甚至助力学生学习新语言的方法,都有可能成为现实。这一技术的潜力,让人不禁想象一个充满声音的世界,AI在其中扮演着至关重要的角色。

研究团队的成员们致力于开发三个层次的模型版本,以便更好地模拟人类的声音模仿。从基线模型的初步尝试,到沟通型模型的改进,再到引入推理层的优化,每一步都是向人类声音模仿的精准度迈进。

为了评估模型的表现,研究团队进行了一项行为实验,测试人类评审对AI生成声音模仿的看法。令人欣喜的是,在某些情况下,人类更偏好AI生成的声音模仿。尤其是在模仿某些特定声音时,如摩托艇的轰鸣声,AI模型的偏好率非常高。

研究人员正在积极探索该模型在其他领域的潜在应用,如语言发展、婴儿学语甚至鸟类模仿行为等。虽然当前模型仍有改进空间,如处理某些辅音和模拟复杂语音模式时的困难,但这不妨碍其展现巨大的应用前景。

语言中的拟声词揭示了声音模仿的奥秘,而这项研究是探索这一奥秘的重要一步。它展示了人类声道的物理限制和社交交流压力如何共同影响声音模仿的分布。这一模型的开发得到了重要资助,并在SIGGRAPH Asia会议上发布。