Des chercheurs proposent un nouveau cadre de séparation aveugle des sources pour le mixage sonore

microphone

Crédit : Pixabay/CC0 Domaine public

La séparation de source aveugle (BSS) vise à estimer les signaux de source à partir de mélanges observés sans information préalable sur la source ou le système de mélange.

Dans le cas de temps de réverbération longs, la matrice de covariance spatiale de rang complet (SCM) a été introduite, ce qui montre des performances de séparation améliorées. Cependant, le SCM de rang complet manque encore de signification physique.

Récemment, des chercheurs de l’Institut d’acoustique de l’Académie chinoise des sciences (IACAS) ont proposé un cadre BSS basé sur la fonction de transfert de convolution dans le domaine fréquentiel, qui fournit une nouvelle idée pour résoudre le problème BSS dans des environnements hautement réverbérants.

L’étude a été publiée en ligne dans Transactions IEEE/ACM sur le traitement audio, vocal et linguistique le janv. 25.

Sans utiliser l’hypothèse de bande étroite, ils ont approché le mélange convolutif dans le domaine temporel en utilisant un mélange convolutif en fréquence, et ont proposé un cadre de factorisation matricielle non négative (MNMF) multicanal basé sur la fonction de transfert de convolution pour le BSS dans des environnements hautement réverbérants.

Le SCM de rang complet peut être dérivé sur la base du cadre CTF proposé et des variances de source variant lentement dans le temps, ce qui explique clairement pourquoi le modèle spatial de rang complet fonctionne bien dans la pratique.

Sur la base du cadre CTF, les chercheurs ont proposé un algorithme MNMF basé sur CTF pour le BSS surdéterminé. Les expériences ont montré que l’algorithme proposé atteint une performance de séparation plus élevée dans les environnements réverbérants.


Estimation de la qualité des espaces sonores à partir de la parole observée


Plus d’information:
Taihui Wang et al, Factorisation matricielle non négative multicanal basée sur la fonction de transfert convolutif pour la séparation de source aveugle surdéterminée, Transactions IEEE/ACM sur le traitement audio, vocal et linguistique (2022). DOI : 10.1109 / TASLP.2022.3145304

Fourni par l’Académie chinoise des sciences

Citation: Des chercheurs proposent un nouveau cadre de séparation aveugle des sources pour le mixage sonore (2022, 22 mars) récupéré le 22 mars 2022 sur https://techxplore.com/news/2022-03-source-framework.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.