基于深度胶囊网络融合模型的多声音事件检测

2025年10月15日·

Qingzhou Jiang

杨树国

Corresponding

Wenwu Wang

· 0 分钟阅读时长

PDF DOI

摘要

传统的胶囊网络架构是基于动态路由机制实现的，需要大量迭代和向量计算来更新权值系数，并且胶囊之间不存在信息共享，导致信息冗余。针对这一缺陷，本工作提出了一种基于融合深度胶囊网络的多声音事件检测模型，在门控卷积和3D卷积下通过动态路由减少了特征重叠导致的信息冗余，并且对原始特征进行编码，将其用于特征信息补充，提高了训练次数模型的速度和准确性。本工作使用DCASE2017(Detection and Classification of Acoustic Scenes and Events 2017) Challenge Task 4数据集对模型进行评估，最终F1分数达到59.6%，声音事件检测错误率低至0.71。结果表明，所提出的方法可以显著提高训练速度和精度。

类型

期刊文章

出版物

青岛科技大学学报(自然科学版)

最近更新于 2026年3月9日

Dcase 2017挑战赛多声音事件检测胶囊网络融合网络其他

Authors

Qingzhou Jiang

Authors

杨树国

正教授

教授，博士生导师，哈尔滨工业大学博士后。数据科学与信息技术研究中心主任，人工智能海洋技术场景化应用山东省工程研究中心主任，青岛市人工智能海洋技术创新中心主任，青岛科技大学数学与交叉研究院院长。美国佐治亚理工学院高级访问学者、香港中文大学高级访问学者、北京交通大学高级访问学者；山东省数学会常务理事、山东省应用统计学会常务理事、人工智能海洋学专业委员会常务委员。近年来，主持或参与国家自然科学基金、国防科工委、电子工业部、省自然基金、省重点科研计划、省高校科研计划、省优秀中青年科学家基金、青岛市科技发展计划项目等各级各类科研项目40多项。

Authors

Wenwu Wang

← A coordinate transformation-based physics-informed neural networks for hyperbolic conservation laws 2025年10月15日

A Transfer Learning–CNN Framework for Marine Atmospheric Pollutant Inversion Using Multi-Source Data Fusion 2025年10月8日 →

No results found

基于深度胶囊网络融合模型的多声音事件检测