متابعة
Błażej Mańczak
Błażej Mańczak
DynamoFL
بريد إلكتروني تم التحقق منه على dynamofl.com
عنوان
عدد مرات الاقتباسات
عدد مرات الاقتباسات
السنة
Codeit: Self-improving language models with prioritized hindsight replay
N Butt, B Manczak, A Wiggers, C Rainone, DW Zhang, M Defferrard, ...
arXiv preprint arXiv:2402.04858, 2024
182024
Hierarchical reinforcement learning for power network topology control
B Manczak, J Viebahn, H van Hoof
arXiv preprint arXiv:2311.02129, 2023
42023
PrimeGuard: Safe and Helpful LLMs through Tuning-Free Routing
B Manczak, E Zemour, E Lin, V Mugunthan
ICML 2024 Next Generation of AI Safety Workshop, 2024
22024
Towards transparent and explainable attention models
KJ Kubara, B Manczak, B Dolicki, K Sawicz
ML Reproducibility Challenge 2021, 2020
22020
Towards Self-Improving Language Models for Code Generation
M Defferrard, C Rainone, DW Zhang, B Manczak, N Butt, T Cohen
ICLR 2024 Workshop on Large Language Model (LLM) Agents, 0
يتعذر على النظام إجراء العملية في الوقت الحالي. عاود المحاولة لاحقًا.
مقالات 1–5