Takuya Yoshioka

Citata da

	Tutte	Dal 2019
Citazioni	11536	8728
Indice H	47	41
i10-index	136	100

2600

1300

650

1950

2008200920102011201220132014201520162017201820192020202120222023202455 55 82 83 125 201 235 280 400 562 633 713 781 1137 1540 2026 2506

Accesso pubblico

Visualizza tutto

5 articoli

2 articoli

Disponibili

Non disponibili

In base ai mandati di finanziamento

Coautori

Tomohiro NakataniNTT Communication Science LaboratoriesEmail verificata su ieee.org
Keisuke KinoshitaResearch Scientist at GoogleEmail verificata su ieee.org
Marc DelcroixNTT Communication Science LaboratoriesEmail verificata su ieee.org
Shoko ArakiNTT Communication Science LaboratoriesEmail verificata su ieee.org
Masakiyo FujimotoSenior researcher, National Institute of Information and Communications TechnologyEmail verificata su nict.go.jp
Nobutaka ItoUniversity of Tokyo, Japan (formerly NTT)Email verificata su ieee.org
Armin SehrOTH RegensburgEmail verificata su oth-regensburg.de
Roland MaasSr. Science Manager at AmazonEmail verificata su amazon.com
Shinji WatanabeCarnegie Mellon UniversityEmail verificata su cmu.edu
Takaaki HoriAppleEmail verificata su apple.com
Hiroshi G OkunoProfessor Emeritus, Kyoto University, Adjunct Researcher, Waseda UniversityEmail verificata su nue.org
Takuya HiguchiAppleEmail verificata su apple.com
Atsushi NakamuraGraduate School of Natural Sciences, Nagoya City UniversityEmail verificata su ieee.org
Yotaro KuboGoogle SpeechEmail verificata su ieee.org
Chengzhu Yu （俞承柱）AmazonEmail verificata su amazon.com
Mehrez SoudenSr. Manager, Apple Inc.Email verificata su gatech.edu
Hirokazu KameokaSenior Distinguished Researcher at NTT, Adjunct Associate Professor at NIIEmail verificata su hco.ntt.co.jp
Mark GalesCambridge UniversityEmail verificata su eng.cam.ac.uk

Segui

Takuya Yoshioka

AssemblyAI

Email verificata su assemblyai.com - Home page

speech recognition speech enhancement speaker diarization machine learning


Titolo Ordina per citazioni Ordina per anno Ordina per titolo	Citata da Citata da	Anno
Wavlm: Large-scale self-supervised pre-training for full stack speech processing S Chen, C Wang, Z Chen, Y Wu, S Liu, Z Chen, J Li, N Kanda, T Yoshioka, ... IEEE Journal of Selected Topics in Signal Processing 16 (6), 1505-1518, 2022	1623	2022
Dual-path rnn: efficient long sequence modeling for time-domain single-channel speech separation Y Luo, Z Chen, T Yoshioka ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and …, 2020	833	2020
Speech dereverberation based on variance-normalized delayed linear prediction T Nakatani, T Yoshioka, K Kinoshita, M Miyoshi, BH Juang IEEE Transactions on Audio, Speech, and Language Processing 18 (7), 1717-1731, 2010	506	2010
The REVERB challenge: A common evaluation framework for dereverberation and recognition of reverberant speech K Kinoshita, M Delcroix, T Yoshioka, T Nakatani, E Habets, ... 2013 IEEE Workshop on Applications of Signal Processing to Audio and …, 2013	473	2013
A summary of the REVERB challenge: state-of-the-art and remaining challenges in reverberant speech processing research K Kinoshita, M Delcroix, S Gannot, EA P. Habets, R Haeb-Umbach, ... EURASIP Journal on Advances in Signal Processing 2016, 1-19, 2016	422	2016
CHiME-6 challenge: Tackling multispeaker speech recognition for unsegmented recordings S Watanabe, M Mandel, J Barker, E Vincent, A Arora, X Chang, ... arXiv preprint arXiv:2004.09249, 2020	342	2020
Making machines understand us in reverberant rooms: Robustness against reverberation for automatic speech recognition T Yoshioka, A Sehr, M Delcroix, K Kinoshita, R Maas, T Nakatani, ... IEEE Signal Processing Magazine 29 (6), 114-126, 2012	338	2012
Generalization of multi-channel linear prediction methods for blind MIMO impulse response shortening T Yoshioka, T Nakatani IEEE Transactions on Audio, Speech, and Language Processing 20 (10), 2707-2720, 2012	318	2012
The NTT CHiME-3 system: Advances in speech enhancement and recognition for mobile multi-microphone devices T Yoshioka, N Ito, M Delcroix, A Ogawa, K Kinoshita, M Fujimoto, C Yu, ... 2015 IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU …, 2015	269	2015
Robust MVDR beamforming using time-frequency masks for online/offline ASR in noise T Higuchi, N Ito, T Yoshioka, T Nakatani 2016 IEEE International Conference on Acoustics, Speech and Signal …, 2016	266	2016
Continuous speech separation: Dataset and analysis Z Chen, T Yoshioka, L Lu, T Zhou, Z Meng, Y Luo, J Wu, X Xiao, J Li ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and …, 2020	223	2020
Icassp 2023 deep noise suppression challenge H Dubey, A Aazami, V Gopal, B Naderi, S Braun, R Cutler, A Ju, ... IEEE Open Journal of Signal Processing, 2024	222	2024
Blind separation and dereverberation of speech mixtures by joint optimization T Yoshioka, T Nakatani, M Miyoshi, HG Okuno IEEE Transactions on Audio, Speech, and Language Processing 19 (1), 69-84, 2010	197	2010
Blind speech dereverberation with multi-channel linear prediction based on short time Fourier transform representation T Nakatani, T Yoshioka, K Kinoshita, M Miyoshi, BH Juang 2008 IEEE International Conference on Acoustics, Speech and Signal …, 2008	194	2008
End-to-end microphone permutation and number invariant multi-channel speech separation Y Luo, Z Chen, N Mesgarani, T Yoshioka ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and …, 2020	189	2020
Multi-channel overlapped speech recognition with location guided speech extraction network Z Chen, X Xiao, T Yoshioka, H Erdogan, J Li, Y Gong 2018 IEEE Spoken Language Technology Workshop (SLT), 558-565, 2018	154	2018
Continuous speech separation with conformer S Chen, Y Wu, Z Chen, J Wu, J Li, T Yoshioka, C Wang, S Liu, M Zhou ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	143	2021
Multi-microphone neural speech separation for far-field multi-talker speech recognition T Yoshioka, H Erdogan, Z Chen, F Alleva 2018 IEEE International Conference on Acoustics, Speech and Signal …, 2018	134	2018
Online MVDR beamformer based on complex Gaussian mixture model with spatial prior for noise robust ASR T Higuchi, N Ito, S Araki, T Yoshioka, M Delcroix, T Nakatani IEEE/ACM Transactions on Audio, Speech, and Language Processing 25 (4), 780-793, 2017	128	2017
Linear prediction-based dereverberation with advanced speech enhancement and recognition technologies for the REVERB challenge M Delcroix, T Yoshioka, A Ogawa, Y Kubo, M Fujimoto, N Ito, K Kinoshita, ... Reverb workshop, 2014	128	2014

Il sistema al momento non può eseguire l'operazione. Riprova più tardi.

Articoli 1–20

Citazioni per anno

Citazioni duplicate

Citazioni unite

Aggiungi coautoriCoautori

Segui

Citata da

Coautori