Sheng Shen

Zitiert von

	Alle	Seit 2019
Zitate	9009	8986
h-index	31	31
i10-index	39	39

4900

2450

1225

3675

20192020202120222023202441 154 346 858 2647 4882

Öffentlicher Zugriff

Alle anzeigen

7 Artikel

0 Artikel

verfügbar

nicht verfügbar

Basierend auf Fördermandaten

Koautoren

Kurt KeutzerProfessor of the Graduate School, EECS, University of California, BerkeleyBestätigte E-Mail-Adresse bei berkeley.edu
Zhewei YaoSnowflakeBestätigte E-Mail-Adresse bei snowflake.com
Michael MahoneyProfessor of Statistics, UC BerkeleyBestätigte E-Mail-Adresse bei stat.berkeley.edu
Trevor DarrellProfessor of Computer Science, U.C. BerkeleyBestätigte E-Mail-Adresse bei eecs.berkeley.edu
Amir GholamiResearch Scientist, University of California, BerkeleyBestätigte E-Mail-Adresse bei eecs.berkeley.edu
Chunyuan LiMicrosoft Research, RedmondBestätigte E-Mail-Adresse bei microsoft.com
Joseph E. GonzalezProfessor of Computer Science, UC BerkeleyBestätigte E-Mail-Adresse bei berkeley.edu
Xuanzhe LiuBoya Distinguished Professor of Computer Science, Peking University, ACM Distinguished ScientistBestätigte E-Mail-Adresse bei pku.edu.cn
Qiaozhu MeiProfessor, University of MichiganBestätigte E-Mail-Adresse bei umich.edu
Iz BeltagyAllen Institute for Artificial IntelligenceBestätigte E-Mail-Adresse bei beltagy.net
Le HouGoogleBestätigte E-Mail-Adresse bei google.com
Denny ZhouResearch Scientist, Google DeepMindBestätigte E-Mail-Adresse bei google.com
Douwe KielaContextual AI, Stanford UniversityBestätigte E-Mail-Adresse bei stanford.edu
Yaliang LiAlibaba GroupBestätigte E-Mail-Adresse bei alibaba-inc.com
Dan KleinUC Berkeley

Folgen

Sheng Shen

UC Berkeley

Bestätigte E-Mail-Adresse bei berkeley.edu - Startseite

Machine Learning Natural Language Processing


Titel Nach Zitationen sortieren Nach Jahr sortieren Nach Titel sortieren	Zitiert von Zitiert von	Jahr
Multitask prompted training enables zero-shot task generalization V Sanh, A Webson, C Raffel, SH Bach, L Sutawika, Z Alyafeai, A Chaffin, ... ICLR 2022, 2021	1675	2021
Bloom: A 176b-parameter open-access multilingual language model T Le Scao, A Fan, C Akiki, E Pavlick, S Ilić, D Hesslow, R Castagné, ...	1604	2023
The llama 3 herd of models A Dubey, A Jauhri, A Pandey, A Kadian, A Al-Dahle, A Letman, A Mathur, ... arXiv preprint arXiv:2407.21783, 2024	1109	2024
Crosslingual generalization through multitask finetuning N Muennighoff, T Wang, L Sutawika, A Roberts, S Biderman, TL Scao, ... ACL 2023, 2022	610	2022
Q-bert: Hessian based ultra low precision quantization of bert S Shen, Z Dong, J Ye, L Ma, Z Yao, A Gholami, MW Mahoney, K Keutzer AAAI 2020, 2019	590	2019
How Much Can CLIP Benefit Vision-and-Language Tasks? S Shen, LH Li, H Tan, M Bansal, A Rohrbach, KW Chang, Z Yao, ... ICLR 2022, 2021	423	2021
Agentbench: Evaluating llms as agents X Liu, H Yu, H Zhang, Y Xu, X Lei, H Lai, Y Gu, H Ding, K Men, K Yang, ... arXiv preprint arXiv:2308.03688, 2023	322*	2023
Train Large, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers Z Li, E Wallace, S Shen, K Lin, K Keutzer, D Klein, JE Gonzalez ICML 2020, 2020	311	2020
ADAHESSIAN: An Adaptive Second Order Optimizer for Machine Learning Z Yao, A Gholami, S Shen, K Keutzer, MW Mahoney AAAI 2021, 2020	273	2020
Llava-next: Improved reasoning, ocr, and world knowledge H Liu, C Li, Y Li, B Li, Y Zhang, S Shen, YJ Lee	201	2024
Aligning large multimodal models with factually augmented rlhf Z Sun, S Shen, S Cao*, H Liu, C Li, Y Shen, C Gan, LY Gui, YX Wang, ... arXiv preprint arXiv:2309.14525, 2023	175	2023
Learned token pruning for transformers S Kim, S Shen, D Thorsley, A Gholami, W Kwon, J Hassoun, K Keutzer KDD 2022, 2021	138	2021
Poisoning Language Models During Instruction Tuning A Wan, E Wallace, S Shen, D Klein ICML 2023, 2023	137	2023
SqueezeLLM: Dense-and-Sparse Quantization S Kim, C Hooper, A Gholami*, Z Dong, X Li, S Shen, MW Mahoney, ... arXiv preprint arXiv:2306.07629, 2023	135	2023
An annotated dataset of literary entities D Bamman, S Popat, S Shen NAACL 2019, 2019	108	2019
What Language Model to Train if You Have One Million GPU Hours? T Le Scao, T Wang, D Hesslow, L Saulnier, S Bekman, MS Bari, ... EMNLP 2022, 2022	104	2022
Powernorm: Rethinking batch normalization in transformers S Shen, Z Yao, A Gholami, M Mahoney, K Keutzer ICML 2020, 2020	89	2020
Ermes: Emoji-Powered Representation Learning for Cross-Lingual Sentiment Classification Z Chen, S Shen, Z Hu, X Lu, Q Mei, X Liu WWW 2019, 2018	89*	2018
Raft: Adapting language model to domain specific rag T Zhang, SG Patil, N Jain, S Shen, M Zaharia, I Stoica, JE Gonzalez arXiv preprint arXiv:2403.10131, 2024	88	2024
K-lite: Learning transferable visual models with external knowledge S Shen, C Li, X Hu, Y Xie, J Yang, P Zhang, A Rohrbach, Z Gan, L Wang, ... NeurIPS 2022, 2022	88	2022

Das System kann den Vorgang jetzt nicht ausführen. Versuchen Sie es später erneut.

Artikel 1–20

Zitate pro Jahr

Doppelte Zitate

Zusammengeführte Zitate

Koautor hinzufügenKoautoren

Folgen

Zitiert von

Koautoren