Wangyou Zhang

Zitiert von

	Alle	Seit 2019
Zitate	1944	1944
h-index	16	16
i10-index	19	19

520

260

130

390

20192020202120222023202413 160 387 405 514 456

Öffentlicher Zugriff

Alle anzeigen

21 Artikel

0 Artikel

verfügbar

nicht verfügbar

Basierend auf Fördermandaten

Koautoren

Shinji WatanabeCarnegie Mellon UniversityBestätigte E-Mail-Adresse bei cmu.edu
Yanmin QianProfessor, Shanghai Jiao Tong UniversityBestätigte E-Mail-Adresse bei sjtu.edu.cn
Xuankai ChangApple - ex Carnegie Mellon UniversityBestätigte E-Mail-Adresse bei apple.com
Chenda LiShanghai Jiao Tong UniversityBestätigte E-Mail-Adresse bei sjtu.edu.cn
Jing ShiInstitute of Automation Chinese Academy of SciencesBestätigte E-Mail-Adresse bei ia.ac.cn
Christoph BoeddekerPaderborn UniversityBestätigte E-Mail-Adresse bei mail.upb.de
Samuele CornellCarnegie Mellon University, Language Technologies InstituteBestätigte E-Mail-Adresse bei andrew.cmu.edu
Aswin Shanmugam SubramanianMicrosoftBestätigte E-Mail-Adresse bei microsoft.com
Jee-weon JungApple, Carnegie Mellon UniversityBestätigte E-Mail-Adresse bei ieee.org
Robin ScheiblerGoogle DeepmindBestätigte E-Mail-Adresse bei google.com
Kohei SaijoWaseda UniversityBestätigte E-Mail-Adresse bei pcl.cs.waseda.ac.jp
William ChenCarnegie Mellon UniversityBestätigte E-Mail-Adresse bei cmu.edu
Yoshiki MasuyamaTokyo Metropolitan UniversityBestätigte E-Mail-Adresse bei ed.tmu.ac.jp
Wei WangShanghai Jiao Tong UniversityBestätigte E-Mail-Adresse bei sjtu.edu.cn
Zhengyang Chen (陈正阳)Shanghai Jiao Tong UniversityBestätigte E-Mail-Adresse bei sjtu.edu.cn

Folgen

Wangyou Zhang

Ph.D. candidate, Department of Computer Science and Engineering, Shanghai Jiao Tong University

Bestätigte E-Mail-Adresse bei sjtu.edu.cn - Startseite

Speech Separation and Enhancement Robust Speech Recognition Speech Representation Learning


Titel Nach Zitationen sortieren Nach Jahr sortieren Nach Titel sortieren	Zitiert von Zitiert von	Jahr
A comparative study on Transformer vs RNN in speech applications S Karita, N Chen, T Hayashi, T Hori, H Inaguma, Z Jiang, M Someki, ... 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU …, 2019	860	2019
Recent Developments on ESPnet Toolkit Boosted by Conformer P Guo, F Boyer, X Chang, T Hayashi, Y Higuchi, H Inaguma, N Kamo, C Li, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	298	2021
MIMO-SPEECH: End-to-End Multi-Channel Multi-Speaker Speech Recognition X Chang, W Zhang, Y Qian, JL Roux, S Watanabe 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU …, 2019	124	2019
End-To-End Multi-Speaker Speech Recognition With Transformer X Chang, W Zhang, Y Qian, J Le Roux, S Watanabe ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and …, 2020	112	2020
ESPnet-SE: End-to-End Speech Enhancement and Separation Toolkit Designed for ASR Integration C Li, J Shi, W Zhang, AS Subramanian, X Chang, N Kamo, M Hira, ... IEEE Spoken Language Technology Workshop (SLT), 785–792, 2021	88	2021
The 2020 ESPnet update: new features, broadened applications, performance improvements, and future plans S Watanabe, F Boyer, X Chang, P Guo, T Hayashi, Y Higuchi, T Hori, ... 2021 IEEE Data Science and Learning Workshop (DSLW), 1-6, 2021	56	2021
Improving End-to-End Single-Channel Multi-Talker Speech Recognition W Zhang, X Chang, Y Qian, S Watanabe IEEE/ACM Transactions on Audio, Speech, and Language Processing 28, 1385-1394, 2020	40	2020
End-to-End Dereverberation, Beamforming, and Speech Recognition with Improved Numerical Stability and Advanced Frontend W Zhang, C Boeddeker, S Watanabe, T Nakatani, M Delcroix, K Kinoshita, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	36	2021
Reproducing Whisper-Style Training Using An Open-Source Toolkit And Publicly Available Data Y Peng, J Tian, B Yan, D Berrebbi, X Chang, X Li, J Shi, S Arora, W Chen, ... 2023 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), 1-8, 2023	33	2023
End-to-End Far-Field Speech Recognition with Unified Dereverberation and Beamforming W Zhang, AS Subramanian, X Chang, S Watanabe, Y Qian Proc. Interspeech 2020, 324-328, 2020	31	2020
Robust DOA Estimation Based on Convolutional Neural Network and Time-Frequency Masking W Zhang, Y Zhou, Y Qian Proc. Interspeech 2019, 2703-2707, 2019	30	2019
Towards Low-Distortion Multi-Channel Speech Enhancement: The ESPnet-SE Submission to the L3DAS22 Challenge YJ Lu, S Cornell, X Chang, W Zhang, C Li, Z Ni, ZQ Wang, S Watanabe ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and …, 2022	28	2022
Convolutive Transfer Function Invariant SDR Training Criteria for Multi-Channel Reverberant Speech Separation C Boeddeker, W Zhang, T Nakatani, K Kinoshita, T Ochiai, M Delcroix, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	28	2021
ESPnet-SE++: Speech Enhancement for Robust Speech Recognition, Translation, and Understanding YJ Lu, X Chang, C Li, W Zhang, S Cornell, Z Ni, Y Masuyama, B Yan, ... Proc. Interspeech 2022, 5458-5462, 2022	27	2022
Closing the Gap Between Time-Domain Multi-Channel Speech Enhancement on Real and Simulation Conditions W Zhang, J Shi, C Li, S Watanabe, Y Qian 2021 IEEE Workshop on Applications of Signal Processing to Audio and …, 2021	25	2021
End-to-End Dereverberation, Beamforming, and Speech Recognition in a Cocktail Party W Zhang, X Chang, C Boeddeker, T Nakatani, S Watanabe, Y Qian IEEE/ACM Transactions on Audio, Speech, and Language Processing 30, 3173-3188, 2022	18	2022
ESPnet-SPK: full pipeline speaker embedding toolkit with reproducible recipes, self-supervised front-ends, and off-the-shelf models J Jung, W Zhang, J Shi, Z Aldeneh, T Higuchi, BJ Theobald, AH Abdelaziz, ... Proc. Interspeech 2024, 4278-4282, 2024	14	2024
Toward Universal Speech Enhancement For Diverse Input Conditions W Zhang, K Saijo, ZQ Wang, S Watanabe, Y Qian 2023 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), 1-6, 2023	14	2023
Joint prediction and denoising for large-scale multilingual self-supervised learning W Chen, J Shi, B Yan, D Berrebbi, W Zhang, Y Peng, X Chang, S Maiti, ... arXiv preprint arXiv:2309.15317, 2023	10	2023
Weakly-Supervised Speech Pre-training: A Case Study on Target Speech Recognition W Zhang, Y Qian Proc. Interspeech 2023, 3517-3521, 2023	7	2023

Das System kann den Vorgang jetzt nicht ausführen. Versuchen Sie es später erneut.

Artikel 1–20

Zitate pro Jahr

Doppelte Zitate

Zusammengeführte Zitate

Koautor hinzufügenKoautoren

Folgen

Zitiert von

Koautoren