Lianmin Zheng

Sitert av

	Alle	Siden 2020
Sitater	14233	13916
h-indeks	26	25
i10-indeks	27	27

9000

4500

2250

6750

2018201920202021202220232024202559 233 429 599 785 2300 8071 1695

Offentlig tilgang

Vis alle

12 artikler

0 artikler

tilgjengelige

ikke tilgjengelige

Basert på finansieringsmandater

Medforfattere

Ion StoicaProfessor of Computer Science, UC BerkeleyVerifisert e-postadresse på cs.berkeley.edu
Ying ShengxAIVerifisert e-postadresse på x.ai
Joseph E. GonzalezProfessor of Computer Science, UC BerkeleyVerifisert e-postadresse på berkeley.edu
Zhuohan LiUC BerkeleyVerifisert e-postadresse på berkeley.edu
Hao ZhangUC San DiegoVerifisert e-postadresse på ucsd.edu
Tianqi ChenCarnegie Mellon UniversityVerifisert e-postadresse på cmu.edu
Luis CezeProfessor of Computer Science and Engineering, University of WashingtonVerifisert e-postadresse på cs.washington.edu
Carlos GuestrinProfessor, Stanford UniversityVerifisert e-postadresse på stanford.edu
Thierry MoreauOctoML Inc., University of WashingtonVerifisert e-postadresse på cs.washington.edu
Cody (Hao) YuSoftware Engineer @ Anyscale | ex-Amazonian | UCLA PhD ‘19Verifisert e-postadresse på anyscale.com
Yida WangAmazonVerifisert e-postadresse på amazon.com
Danyang ZhuoDuke UniversityVerifisert e-postadresse på duke.edu
Koushik SenProfessor of Computer Science, University of California, BerkeleyVerifisert e-postadresse på cs.berkeley.edu
Weinan ZhangProfessor, Shanghai Jiao Tong UniversityVerifisert e-postadresse på sjtu.edu.cn
Yong Yu (俞勇)Professor, Shanghai Jiao Tong UniversityVerifisert e-postadresse på sjtu.edu.cn
Jianfei ChenAssociate Professor, Tsinghua UniversityVerifisert e-postadresse på mail.tsinghua.edu.cn

Følg

Lianmin Zheng

xAI

Verifisert e-postadresse på x.ai - Startside

Systems Machine Learning Compiler


Tittel Sorter etter sitater Sorter etter år Sorter etter tittel	Sitert av Sitert av	År
Judging llm-as-a-judge with mt-bench and chatbot arena L Zheng, WL Chiang, Y Sheng, S Zhuang, Z Wu, Y Zhuang, Z Lin, Z Li, ... Advances in Neural Information Processing Systems 36, 46595-46623, 2023	3471*	2023
Vicuna: An open-source chatbot impressing gpt-4 with 90%* chatgpt quality WL Chiang, Z Li, Z Lin, Y Sheng, Z Wu, H Zhang, L Zheng, S Zhuang, ... https://lmsys.org/blog/2023-03-30-vicuna/, 2023	2721*	2023
TVM: An automated end-to-end optimizing compiler for deep learning T Chen, T Moreau, Z Jiang, L Zheng, E Yan, H Shen, M Cowan, L Wang, ... 13th USENIX Symposium on Operating Systems Design and Implementation (OSDI …, 2018	2383*	2018
Efficient memory management for large language model serving with pagedattention W Kwon, Z Li, S Zhuang, Y Sheng, L Zheng, CH Yu, J Gonzalez, H Zhang, ... Proceedings of the 29th Symposium on Operating Systems Principles, 611-626, 2023	1487	2023
Learning to optimize tensor programs T Chen, L Zheng, E Yan, Z Jiang, T Moreau, L Ceze, C Guestrin, ... Advances in Neural Information Processing Systems 31, 2018	504	2018
Chatbot arena: An open platform for evaluating llms by human preference WL Chiang, L Zheng, Y Sheng, AN Angelopoulos, T Li, D Li, B Zhu, ... Forty-first International Conference on Machine Learning, 2024	459	2024
Ansor: Generating High-Performance Tensor Programs for Deep Learning L Zheng, C Jia, M Sun, Z Wu, CH Yu, A Haj-Ali, Y Wang, J Yang, D Zhuo, ... 14th USENIX symposium on operating systems design and implementation (OSDI …, 2020	450	2020
FlexGen: High-Throughput Generative Inference of Large Language Models with a Single GPU Y Sheng, L Zheng, B Yuan, Z Li, M Ryabinin, B Chen, P Liang, C Re, ... International Conference on Machine Learning, 2023	376	2023
Alpa: Automating Inter-and Intra-Operator Parallelism for Distributed Deep Learning L Zheng, Z Li, H Zhang, Y Zhuang, Z Chen, Y Huang, Y Wang, Y Xu, ... 16th USENIX symposium on operating systems design and implementation (OSDI 22), 2022	354	2022
H2o: Heavy-hitter oracle for efficient generative inference of large language models Z Zhang, Y Sheng, T Zhou, T Chen, L Zheng, R Cai, Z Song, Y Tian, C Ré, ... Advances in Neural Information Processing Systems 36, 34661-34710, 2023	344	2023
A hardware–software blueprint for flexible deep learning specialization T Moreau, T Chen, L Vega, J Roesch, E Yan, L Zheng, J Fromm, Z Jiang, ... IEEE Micro 39 (5), 8-16, 2019	285*	2019
Magent: A many-agent reinforcement learning platform for artificial collective intelligence L Zheng, J Yang, H Cai, M Zhou, W Zhang, J Wang, Y Yu Proceedings of the AAAI conference on artificial intelligence 32 (1), 2018	256	2018
How long can context length of open-source llms truly promise? D Li, R Shao, A Xie, Y Sheng, L Zheng, J Gonzalez, I Stoica, X Ma, ... NeurIPS 2023 Workshop on Instruction Tuning and Instruction Following, 2023	164*	2023
AlpaServe: Statistical multiplexing with model parallelism for deep learning serving Z Li, L Zheng, Y Zhong, V Liu, Y Sheng, X Jin, Y Huang, Z Chen, H Zhang, ... 17th USENIX Symposium on Operating Systems Design and Implementation (OSDI …, 2023	148	2023
LMSYS-Chat-1M: A Large-Scale Real-World LLM Conversation Dataset L Zheng, WL Chiang, Y Sheng, T Li, S Zhuang, Z Wu, Y Zhuang, Z Li, ... The Twelfth International Conference on Learning Representations, 2023	139	2023
SGLang: Efficient execution of structured language model programs L Zheng, L Yin, Z Xie, CL Sun, J Huang, CH Yu, S Cao, C Kozyrakis, ... Advances in Neural Information Processing Systems 37, 62557-62583, 2024	128*	2024
Slora: Scalable serving of thousands of lora adapters Y Sheng, S Cao, D Li, C Hooper, N Lee, S Yang, C Chou, B Zhu, L Zheng, ... Proceedings of Machine Learning and Systems 6, 296-311, 2024	96*	2024
Actnn: Reducing training memory footprint via 2-bit activation compressed training J Chen, L Zheng, Z Yao, D Wang, I Stoica, M Mahoney, J Gonzalez International Conference on Machine Learning, 1803-1813, 2021	79	2021
Rethinking benchmark and contamination for language models with rephrased samples S Yang, WL Chiang, L Zheng, JE Gonzalez, I Stoica arXiv preprint arXiv:2311.04850, 2023	77	2023
Tensorir: An abstraction for automatic tensorized program optimization S Feng, B Hou, H Jin, W Lin, J Shao, R Lai, Z Ye, L Zheng, CH Yu, Y Yu, ... Proceedings of the 28th ACM International Conference on Architectural …, 2023	73	2023

Systemet kan ikke utføre handlingen. Prøv på nytt senere.

Artikler 1–20

Sitater per år

Duplikatsitater

Sammenslåtte sitater

Legg til medforfattereMedforfattere

Følg

Sitert av

Medforfattere