01版:导读

16版:光影记录

新研究借助人工智能“解码”狗叫声

(2024年06月26日) 来源:潍坊晚报
放大   缩小   默认
  在近期于意大利都灵召开的国际计算语言学、语言资源与评估联合国际会议上,美国密歇根大学等机构的研究人员表示,他们正开发能识别狗叫声是表达嬉戏还是攻击性的人工智能模型,并展示了如何利用人工智能技术提升人们对动物间交流的理解。
  研究人员选择了一个名为Wav2Vec2的语音表示模型,先利用74只不同品种、年龄和性别的狗,在各种情境下录制的叫声数据来改良这个模型,然后来研究狗叫声的细微差别。研究发现,Wav2Vec2的准确率高达70%,表现优于其他专门使用狗叫声数据训练的模型。
  密歇根大学计算机科学与工程学院教授、人工智能实验室主任拉达·米哈尔恰说:“这是首次将针对人类语音优化的技术用于帮助解码动物间的交流。研究结果表明,从人类语音中衍生出的声音和模式,可以作为分析和理解其他声音(如动物的发声)的声学模式的基础。我们的研究为利用现有的语音处理技术来理解狗叫声的细微差别打开了一扇新的窗口。”