Artykuły udostępnione publicznie: - Dongchao YangWięcej informacji
Niedostępny w żadnym miejscu: 1
Featurecut: An adaptive data augmentation for automated audio captioning
Z Ye, Y Wang, H Wang, D Yang, Y Zou
2022 Asia-Pacific Signal and Information Processing Association Annual …, 2022
Upoważnienia: National Natural Science Foundation of China
Dostępne w jakimś miejscu: 9
Make-an-audio: Text-to-audio generation with prompt-enhanced diffusion models
R Huang*, J Huang*, D Yang*, Y Ren, L Liu, M Li, Z Ye, J Liu, X Yin, ...
ICML 2023, 2023
Upoważnienia: National Natural Science Foundation of China
Improving Text-Audio Retrieval by Text-aware Attention Pooling and Prior Matrix Revised Loss
Y Xin, D Yang, Y Zou
ICASSP2023, 2023
Upoważnienia: National Natural Science Foundation of China
Audio Pyramid Transformer with Domain Adaption for Weakly Supervised Sound Event Detection and Audio Classification
Y Xin, D Yang, Y Zou
Proc. Interspeech 2022, 1546-1550, 2022
Upoważnienia: National Natural Science Foundation of China
DPM-TSE: A Diffusion Probabilistic Model for Target Sound Extraction
J Hai, H Wang, D Yang, K Thakkar, D Chong, N Dehak, M Elhilali
ICASSP2024, 2023
Upoważnienia: US Department of Defense, US National Institutes of Health
Improving Weakly Supervised Sound Event Detection with Causal Intervention
Y Xin, D Yang, F Cui, Y Wang, Y Zou
ICASSP2023, 2023
Upoważnienia: National Natural Science Foundation of China
Nadiffuse: Noise-aware diffusion-based model for speech enhancement
W Wang, D Yang, Q Ye, B Cao, Y Zou
Asia Pacific Signal and Information Processing Association, 2023, 2023
Upoważnienia: National Natural Science Foundation of China
Background-aware modeling for weakly supervised sound event detection
Y Xin, D Yang, Y Zou
Proc. ISCA Annu. Conf. Int. Speech Commun. Assoc, 1199-1203, 2023
Upoważnienia: National Natural Science Foundation of China
Consistent and Relevant: Rethink the Query Embedding in General Sound Separation
Y Wang, H Chen, D Yang, J Yu, C Weng, Z Wu, H Meng
ICASSP2024, 2023
Upoważnienia: National Natural Science Foundation of China
3cmlf: Three-stage curriculum-based mutual learning framework for audio-text retrieval
YW Chao, D Yang, R Gu, Y Zou
2022 Asia-Pacific Signal and Information Processing Association Annual …, 2022
Upoważnienia: National Natural Science Foundation of China
Informacje na temat publikacji i finansowania automatycznie określa program komputerowy