Yuchen Hu

Cytowane przez

	Wszystkie	Od 2020
Cytowania	633	633
h-indeks	15	15
i10-indeks	24	24

340

170

255

202220232024202521 179 336 97

Dostęp publiczny

Wyświetl wszystko

10 artykułów

0 artykułów

dostępne

niedostępne

Objęte finansowaniem

Współautorzy

Chen ChenNanyang Technological UniversityZweryfikowany adres z ntu.edu.sg
Eng-Siong ChngNanyang Technological UniversityZweryfikowany adres z ntu.edu.sg
Qiushi ZhuUniversity of Science and Technology of ChinaZweryfikowany adres z mail.ustc.edu.cn
Ruizhe LiLecturer (Assistant Professor) in Computing Science, University of AberdeenZweryfikowany adres z abdn.ac.uk
Chao-Han Huck YangSr. Research Scientist, NVIDIA ResearchZweryfikowany adres z nvidia.com
Nana HouZOOM | Ph.D. at Nanyang Technological University, SingaporeZweryfikowany adres z e.ntu.edu.sg
Pin-Yu ChenPrincipal Research Scientist, IBM Research AI; MIT-IBM Watson AI Lab; RPI-IBM AIRCZweryfikowany adres z ibm.com
sabato marco siniscalchiUnipa, NTNU, GaTechZweryfikowany adres z unipa.it
Yu GuTencent AI LabZweryfikowany adres z mail.ustc.edu.cn
Zhehuai ChenNVIDIAZweryfikowany adres z nvidia.com
Helin WangPhD Candidate, Johns Hopkins UniversityZweryfikowany adres z jh.edu
Dong ZhangFudan UniversityZweryfikowany adres z m.fudan.edu.cn
Wen WuUniversity of CambridgeZweryfikowany adres z cam.ac.uk
Yu TsaoResearch Fellow (Professor), Deputy Director, CITI, Academia SinicaZweryfikowany adres z citi.sinica.edu.tw
Shinji WatanabeCarnegie Mellon UniversityZweryfikowany adres z cmu.edu
Boris GinsburgNVIDIAZweryfikowany adres z nvidia.com
Dong Yu (俞栋)Distinguished Scientist @ Tencent AI Lab, ACM/IEEE/ISCA FellowZweryfikowany adres z global.tencent.com
Lei XieNorthwestern Polytechnical UniversityZweryfikowany adres z nwpu.edu.cn

Obserwuj

Yuchen Hu

Nanyang Technological University

Zweryfikowany adres z e.ntu.edu.sg - Strona główna

Large Language Model Speech Processing Multimodal


Tytuł Sortuj wg cytatów Sortuj wg roku Sortuj wg tytułu	Cytowane przez Cytowane przez	Rok
Hyporadise: An open baseline for generative speech recognition with large language models C Chen, Y Hu, CHH Yang, SM Siniscalchi, PY Chen, ES Chng NeurIPS 2023, 2023	56	2023
Interactive Feature Fusion for End-to-End Noise-Robust Speech Recognition Y Hu, N Hou, C Chen, ES Chng ICASSP 2022, 2022	55	2022
Noise-Robust Speech Recognition with 10 Minutes Unparalleled In-domain Data C Chen, N Hou, Y Hu, S Shirol, ES Chng ICASSP 2022, 2022	48	2022
Robust Data2vec: Noise-robust Speech Representation Learning for ASR by Combining Regression and Improved Contrastive Learning QS Zhu, L Zhou, J Zhang, SJ Liu, YC Hu, LR Dai ICASSP 2023, 2023	35	2023
Leveraging Modality-specific Representations for Audio-visual Speech Recognition via Reinforcement Learning C Chen, Y Hu, Q Zhang, H Zou, B Zhu, ES Chng AAAI 2023, 2023	31	2023
Interactive audio-text representation for automated audio captioning with contrastive learning C Chen, N Hou, Y Hu, H Zou, X Qi, ES Chng Interspeech 2022, 2022	30	2022
Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition Y Hu, C Chen, R Li, Q Zhu, ES Chng ICASSP 2023, 2023	28	2023
Large Language Models are Efficient Learners of Noise-Robust Speech Recognition Y Hu, C Chen, CHH Yang, R Li, C Zhang, PY Chen, ES Chng ICLR 2024, 2024	26	2024
It's Never Too Late: Fusing Acoustic Information into Large Language Models for Automatic Speech Recognition C Chen, R Li, Y Hu, SM Siniscalchi, PY Chen, E Chng, CHH Yang ICLR 2024, 2024	25	2024
Metric-oriented Speech Enhancement using Diffusion Probabilistic Model C Chen, Y Hu, W Weng, ES Chng ICASSP 2023, 2023	22	2023
Dual-path style learning for end-to-end noise-robust speech recognition Y Hu, N Hou, C Chen, ES Chng Interspeech 2023, 2023	21	2023
Self-Critical Sequence Training for Automatic Speech Recognition C Chen, Y Hu, N Hou, X Qi, H Zou, ES Chng ICASSP 2022, 2022	20	2022
UniS-MMC: Multimodal Classification via Unimodality-supervised Multimodal Contrastive Learning H Zou, M Shen, C Chen, Y Hu, D Rajan, ES Chng ACL 2023, 2023	18	2023
Unifying Speech Enhancement and Separation with Gradient Modulation for End-to-End Noise-Robust Speech Separation Y Hu, C Chen, H Zou, X Zhong, ES Chng ICASSP 2023, 2023	17	2023
GenTranslate: Large Language Models are Generative Multilingual Speech and Machine Translators Y Hu, C Chen, CHH Yang, R Li, D Zhang, Z Chen, ES Chng ACL 2024, 2024	16	2024
A Neural State-Space Model Approach to Efficient Speech Separation C Chen, CHH Yang, K Li, Y Hu, PJ Ku, ES Chng Interspeech 2023, 2023	15	2023
The USTC-NELSLIP Systems for Simultaneous Speech Translation Task at IWSLT 2021 D Liu, M Du, X Li, Y Hu, L Dai IWSLT 2021, 2021	15	2021
Wav2code: Restore Clean Speech Representations via Codebook Lookup for Noise-Robust ASR Y Hu, C Chen, Q Zhu, ES Chng IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2023	13	2023
Noise-aware Speech Enhancement using Diffusion Probabilistic Model Y Hu, C Chen, R Li, Q Zhu, ES Chng Interspeech 2024, 2023	12	2023
Unsupervised Noise Adaptation using Data Simulation C Chen, Y Hu, H Zou, L Sun, ES Chng ICASSP 2023, 2023	12	2023

Nie można teraz wykonać tej operacji. Spróbuj ponownie później.

Prace 1–20

Cytowania rocznie

Powielone cytowania

Scalone cytowania

Dodaj współautorówWspółautorzy

Obserwuj

Cytowane przez

Współautorzy