基于深度胶囊网络融合模型的多声音事件检测

2025年10月15日·
Qingzhou Jiang
杨树国
杨树国
,
Wenwu Wang
· 0 分钟阅读时长
DOI
摘要
传统的胶囊网络架构是基于动态路由机制实现的,需要大量迭代和向量计算来更新权值系数,并且胶囊之间不存在信息共享,导致信息冗余。针对这一缺陷,本工作提出了一种基于融合深度胶囊网络的多声音事件检测模型,在门控卷积和3D卷积下通过动态路由减少了特征重叠导致的信息冗余,并且对原始特征进行编码,将其用于特征信息补充,提高了训练次数模型的速度和准确性。本工作使用DCASE2017(Detection and Classification of Acoustic Scenes and Events 2017) Challenge Task 4数据集对模型进行评估,最终F1分数达到59.6%,声音事件检测错误率低至0.71。结果表明,所提出的方法可以显著提高训练速度和精度。
类型
出版物
青岛科技大学学报(自然科学版)
publications
杨树国
Authors
正教授
教授,博士生导师,哈尔滨工业大学博士后。数据科学与信息技术研究中心主任,人工智能海洋技术场景化应用山东省工程研究中心主任,青岛市人工智能海洋技术创新中心主任,青岛科技大学数学与交叉研究院院长。美国佐治亚理工学院高级访问学者、香港中文大学高级访问学者、北京交通大学高级访问学者;山东省数学会常务理事、山东省应用统计学会常务理事、人工智能海洋学专业委员会常务委员。近年来,主持或参与国家自然科学基金、国防科工委、电子工业部、省自然基金、省重点科研计划、省高校科研计划、省优秀中青年科学家基金、青岛市科技发展计划项目等各级各类科研项目40多项。
Authors