基于自注意力路由胶囊网络的多音事件检测

2022年10月15日·

Haitao Li

杨树国

Corresponding

· 0 分钟阅读时长

PDF DOI

摘要

声音事件检测是目前计算机听觉领域中的重要问题，而多声音事件检测是其中一个极具挑战性的研究热点。基于最新提出的非迭代的自注意力路由方法和胶囊网络，本文提出了一种基于自注意力路由的多路径胶囊网络模型，将其用于多声音事件检测。由于自注意力路由方法是非迭代且高度并行的，大大加快了模型的训练速度；多路径基础胶囊层使用不同大小的非对称卷积核，不仅使模型能获得不同分辨率的信息，还能极大地保留时间信息，从而提高了模型的性能。本工作在2017年声音场景与事件检测分类挑战赛(Detection and Classification of Acoustic Scenes and Events, DCASE 2017)挑战任务4数据集上对所提出的模型和方法进行了对比实验及性能评估。其中，音频标注子任务的F分数达到了59.5%,音频事件检测的错误率降低到0.72,检测效果有较大的提升。结果表明：本方法具有事件检测准确率高、速度快、泛化能力强等优点。

类型

期刊文章

出版物

青岛科技大学学报(自然科学版)

最近更新于 2026年3月9日

Dcase 2017挑战多声音事件检测胶囊网络其他

Authors

Haitao Li

Authors

杨树国

正教授

教授，博士生导师，哈尔滨工业大学博士后。数据科学与信息技术研究中心主任，人工智能海洋技术场景化应用山东省工程研究中心主任，青岛市人工智能海洋技术创新中心主任，青岛科技大学数学与交叉研究院院长。美国佐治亚理工学院高级访问学者、香港中文大学高级访问学者、北京交通大学高级访问学者；山东省数学会常务理事、山东省应用统计学会常务理事、人工智能海洋学专业委员会常务委员。近年来，主持或参与国家自然科学基金、国防科工委、电子工业部、省自然基金、省重点科研计划、省高校科研计划、省优秀中青年科学家基金、青岛市科技发展计划项目等各级各类科研项目40多项。

← A Discussion on Nonlocality: From Fractional Derivative Model to Peridynamic Model 2022年11月1日

Reconstruction of Monthly Surface Nutrient Concentrations in the Yellow and Bohai Seas from 2003–2019 Using Machine Learning 2022年10月9日 →

No results found

基于自注意力路由胶囊网络的多音事件检测