Jiaming Ji (吉嘉铭)

Cited by

	All	Since 2019
Citations	1479	1478
h-index	13	13
i10-index	15	15

1300

650

325

975

2022202320249 185 1278

Public access

View all

7 articles

0 articles

available

not available

Based on funding mandates

Co-authors

Yaodong YangBOYA (博雅) Assistant Professor at Peking UniversityVerified email at pku.edu.cn
Xuehai PanPeking UniversityVerified email at pku.edu.cn
Boyuan ChenPeking UniversityVerified email at stu.pku.edu.cn
Tianyi (Alex) QiuPeking University, UC BerkeleyVerified email at berkeley.edu
Hantao LouPeking UniversityVerified email at stu.pku.edu.cn
Stephen McAleerOpenAIVerified email at openai.com
Yiran GengTuring Class, Peking UniversityVerified email at stu.pku.edu.cn
Yuanpei ChenSouth China University of TechnologyVerified email at stanford.edu

Jiaming Ji (吉嘉铭)

Peking University

Verified email at stu.pku.edu.cn - Homepage

AI Alignment Reinforcement Learning Large Language Model


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Baichuan 2: Open large-scale language models A Yang, B Xiao, B Wang, B Zhang, C Bian, C Yin, C Lv, D Pan, D Wang, ... arXiv preprint arXiv:2309.10305, 2023	448*	2023
Beavertails: Towards improved safety alignment of llm via a human-preference dataset J Ji, M Liu, J Dai, X Pan, C Zhang, C Bian, R Sun, Y Wang, Y Yang NeurIPS 2023, 2023	252	2023
Ai alignment: A comprehensive survey J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	177	2023
Safe rlhf: Safe reinforcement learning from human feedback J Dai, X Pan, R Sun, J Ji, X Xu, M Liu, Y Wang, Y Yang The Twelfth International Conference on Learning Representations (Spotlight), 2024	174	2024
Bi-dexhands: Towards human-level bimanual dexterous manipulation Y Chen, Y Geng, F Zhong, J Ji, J Jiang, Z Lu, H Dong, Y Yang IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023	110*	2023
Safety-Gymnasium: A Unified Safe Reinforcement Learning Benchmark J Ji, B Zhang, J Zhou, X Pan, W Huang, R Sun, Y Geng, Y Zhong, J Dai, ... NeurIPS 2023, 2023	60*	2023
Constrained update projection approach to safe policy optimization L Yang, J Ji, J Dai, L Zhang, B Zhou, P Li, Y Yang, G Pan NeurIPS 2022, 2023	45	2023
Aligner: Efficient alignment by learning to correct J Ji, B Chen, H Lou, D Hong, B Zhang, X Pan, T Qiu, J Dai, Y Yang NeurIPS 2024 Oral Presentation, 2024	42*	2024
Omnisafe: An infrastructure for accelerating safe reinforcement learning research J Ji, J Zhou, B Zhang, J Dai, X Pan, R Sun, W Huang, Y Geng, M Liu, ... JMLR 2024, 2023	34	2023
Heterogeneous-Agent Reinforcement Learning Y Zhong, JG Kuba, S Hu, J Ji, Y Yang JMLR, 2023	30	2023
The application of large language models in medicine: A scoping review X Meng, X Yan, K Zhang, D Liu, X Cui, Y Yang, M Zhang, C Cao, J Wang, ... Iscience 27 (5), 2024	21	2024
Cup: A conservative update policy algorithm for safe reinforcement learning L Yang, J Ji, J Dai, Y Zhang, P Li, G Pan arXiv preprint arXiv:2202.07565, 2022	18	2022
Augmented proximal policy optimization for safe reinforcement learning J Dai, J Ji, L Yang, Q Zheng, G Pan Proceedings of the AAAI Conference on Artificial Intelligence 37 (6), 7288-7295, 2023	13	2023
SafeDreamer: Safe Reinforcement Learning with World Models W Huang, J Ji, B Zhang, C Xia, Y Yang ICLR 2024, 2023	12	2023
Pku-beaver: Constrained value-aligned llm via safe rlhf J Dai, X Pan, J Ji, R Sun, Y Wang, Y Yang	11	2023
PKU-SafeRLHF: Towards Multi-Level Safety Alignment for LLMs with Human Preference J Ji, D Hong, B Zhang, B Chen, J Dai, B Zheng, T Qiu, B Li, Y Yang arXiv preprint arXiv:2406.15513, 2024	9*	2024
VOCE: Variational Optimization with Conservative Estimation for Offline Safe Reinforcement Learning J Guan, G Chen, J Ji, L Yang, A Zhou, Z Li NeurIPS 2023, 2023	9	2023
MyoChallenge 2022: Learning contact-rich manipulation using a musculoskeletal hand V Caggiano, G Durandau, H Wang, A Chiappa, A Mathis, P Tano, N Patel, ... NeurIPS 2022 Competition Track, 233-250, 2023	7	2023
Reward Generalization in RLHF: A Topological Perspective T Qiu, F Zeng, J Ji, D Yan, K Wang, J Zhou, Y Han, J Dai, X Pan, Y Yang arXiv preprint arXiv:2402.10184, 2024	4	2024
ProgressGym: Alignment with a Millennium of Moral Progress T Qiu, Y Zhang, X Huang, JX Li, J Ji, Y Yang NeurIPS 2024 Spotlight, 2024	1	2024

The system can't perform the operation now. Try again later.

Articles 1–20

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by

Co-authors