Wczytuję...
Nie można teraz wykonać tej operacji. Spróbuj ponownie później.
Artykuły
Profile
Mój profil
Moja biblioteka
Dane
Alerty
Ustawienia
Zaloguj się
Zaloguj się
Profile
Mój profil
Moja biblioteka
Shihan Dou
Fudan University
Zweryfikowany adres z m.fudan.edu.cn
Cytowane przez 1869
Alignment
RLHF
Reward Modeling
Oskar Hallström
R&D @ LightOn
Zweryfikowany adres z lighton.ai
Cytowane przez 25
transformers
post-training
reward modeling
Prywatność
Warunki
Pomoc
Informacje o Google Scholar
Pomoc dotycząca wyszukiwarki