Wangyou Zhang

Citata da

	Tutte	Dal 2019
Citazioni	1943	1943
Indice H	16	16
i10-index	19	19

520

260

130

390

20192020202120222023202413 160 387 405 514 455

Accesso pubblico

Visualizza tutto

21 articoli

0 articoli

Disponibili

Non disponibili

In base ai mandati di finanziamento

Coautori

Shinji WatanabeCarnegie Mellon UniversityEmail verificata su cmu.edu
Yanmin QianProfessor, Shanghai Jiao Tong UniversityEmail verificata su sjtu.edu.cn
Xuankai ChangApple - ex Carnegie Mellon UniversityEmail verificata su apple.com
Chenda LiShanghai Jiao Tong UniversityEmail verificata su sjtu.edu.cn
Jing ShiInstitute of Automation Chinese Academy of SciencesEmail verificata su ia.ac.cn
Christoph BoeddekerPaderborn UniversityEmail verificata su mail.upb.de
Samuele CornellCarnegie Mellon University, Language Technologies InstituteEmail verificata su andrew.cmu.edu
Aswin Shanmugam SubramanianMicrosoftEmail verificata su microsoft.com
Jee-weon JungApple, Carnegie Mellon UniversityEmail verificata su ieee.org
Robin ScheiblerGoogle DeepmindEmail verificata su google.com
Kohei SaijoWaseda UniversityEmail verificata su pcl.cs.waseda.ac.jp
William ChenCarnegie Mellon UniversityEmail verificata su cmu.edu
Yoshiki MasuyamaTokyo Metropolitan UniversityEmail verificata su ed.tmu.ac.jp
Wei WangShanghai Jiao Tong UniversityEmail verificata su sjtu.edu.cn
Zhengyang Chen (陈正阳)Shanghai Jiao Tong UniversityEmail verificata su sjtu.edu.cn

Segui

Wangyou Zhang

Ph.D. candidate, Department of Computer Science and Engineering, Shanghai Jiao Tong University

Email verificata su sjtu.edu.cn - Home page

Speech Separation and Enhancement Robust Speech Recognition Speech Representation Learning


Titolo Ordina per citazioni Ordina per anno Ordina per titolo	Citata da Citata da	Anno
A comparative study on Transformer vs RNN in speech applications S Karita, N Chen, T Hayashi, T Hori, H Inaguma, Z Jiang, M Someki, ... 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU …, 2019	859	2019
Recent Developments on ESPnet Toolkit Boosted by Conformer P Guo, F Boyer, X Chang, T Hayashi, Y Higuchi, H Inaguma, N Kamo, C Li, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	298	2021
MIMO-SPEECH: End-to-End Multi-Channel Multi-Speaker Speech Recognition X Chang, W Zhang, Y Qian, JL Roux, S Watanabe 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU …, 2019	124	2019
End-To-End Multi-Speaker Speech Recognition With Transformer X Chang, W Zhang, Y Qian, J Le Roux, S Watanabe ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and …, 2020	112	2020
ESPnet-SE: End-to-End Speech Enhancement and Separation Toolkit Designed for ASR Integration C Li, J Shi, W Zhang, AS Subramanian, X Chang, N Kamo, M Hira, ... IEEE Spoken Language Technology Workshop (SLT), 785–792, 2021	88	2021
The 2020 ESPnet update: new features, broadened applications, performance improvements, and future plans S Watanabe, F Boyer, X Chang, P Guo, T Hayashi, Y Higuchi, T Hori, ... 2021 IEEE Data Science and Learning Workshop (DSLW), 1-6, 2021	56	2021
Improving End-to-End Single-Channel Multi-Talker Speech Recognition W Zhang, X Chang, Y Qian, S Watanabe IEEE/ACM Transactions on Audio, Speech, and Language Processing 28, 1385-1394, 2020	40	2020
End-to-End Dereverberation, Beamforming, and Speech Recognition with Improved Numerical Stability and Advanced Frontend W Zhang, C Boeddeker, S Watanabe, T Nakatani, M Delcroix, K Kinoshita, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	36	2021
Reproducing Whisper-Style Training Using An Open-Source Toolkit And Publicly Available Data Y Peng, J Tian, B Yan, D Berrebbi, X Chang, X Li, J Shi, S Arora, W Chen, ... 2023 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), 1-8, 2023	33	2023
End-to-End Far-Field Speech Recognition with Unified Dereverberation and Beamforming W Zhang, AS Subramanian, X Chang, S Watanabe, Y Qian Proc. Interspeech 2020, 324-328, 2020	31	2020
Robust DOA Estimation Based on Convolutional Neural Network and Time-Frequency Masking W Zhang, Y Zhou, Y Qian Proc. Interspeech 2019, 2703-2707, 2019	30	2019
Towards Low-Distortion Multi-Channel Speech Enhancement: The ESPnet-SE Submission to the L3DAS22 Challenge YJ Lu, S Cornell, X Chang, W Zhang, C Li, Z Ni, ZQ Wang, S Watanabe ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and …, 2022	28	2022
Convolutive Transfer Function Invariant SDR Training Criteria for Multi-Channel Reverberant Speech Separation C Boeddeker, W Zhang, T Nakatani, K Kinoshita, T Ochiai, M Delcroix, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	28	2021
ESPnet-SE++: Speech Enhancement for Robust Speech Recognition, Translation, and Understanding YJ Lu, X Chang, C Li, W Zhang, S Cornell, Z Ni, Y Masuyama, B Yan, ... Proc. Interspeech 2022, 5458-5462, 2022	27	2022
Closing the Gap Between Time-Domain Multi-Channel Speech Enhancement on Real and Simulation Conditions W Zhang, J Shi, C Li, S Watanabe, Y Qian 2021 IEEE Workshop on Applications of Signal Processing to Audio and …, 2021	25	2021
End-to-End Dereverberation, Beamforming, and Speech Recognition in a Cocktail Party W Zhang, X Chang, C Boeddeker, T Nakatani, S Watanabe, Y Qian IEEE/ACM Transactions on Audio, Speech, and Language Processing 30, 3173-3188, 2022	18	2022
ESPnet-SPK: full pipeline speaker embedding toolkit with reproducible recipes, self-supervised front-ends, and off-the-shelf models J Jung, W Zhang, J Shi, Z Aldeneh, T Higuchi, BJ Theobald, AH Abdelaziz, ... Proc. Interspeech 2024, 4278-4282, 2024	14	2024
Toward Universal Speech Enhancement For Diverse Input Conditions W Zhang, K Saijo, ZQ Wang, S Watanabe, Y Qian 2023 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), 1-6, 2023	14	2023
Joint prediction and denoising for large-scale multilingual self-supervised learning W Chen, J Shi, B Yan, D Berrebbi, W Zhang, Y Peng, X Chang, S Maiti, ... arXiv preprint arXiv:2309.15317, 2023	10	2023
Weakly-Supervised Speech Pre-training: A Case Study on Target Speech Recognition W Zhang, Y Qian Proc. Interspeech 2023, 3517-3521, 2023	7	2023

Il sistema al momento non può eseguire l'operazione. Riprova più tardi.

Articoli 1–20

Citazioni per anno

Citazioni duplicate

Citazioni unite

Aggiungi coautoriCoautori

Segui

Citata da

Coautori