Подписаться
Vladimir Malinovskii
Vladimir Malinovskii
ML Researcher, Yandex Research
Подтвержден адрес электронной почты в домене yandex-team.ru - Главная страница
Название
Процитировано
Процитировано
Год
Pv-tuning: Beyond straight-through estimation for extreme llm compression
V Malinovskii, D Mazur, I Ilin, D Kuznedelev, K Burlachenko, K Yi, ...
Advances in Neural Information Processing Systems 37, 5074-5121, 2024
92024
Pushing the limits of large language model quantization via the linearity theorem
V Malinovskii, A Panferov, I Ilin, H Guo, P Richtárik, D Alistarh
arXiv preprint arXiv:2411.17525, 2024
22024
Cache Me If You Must: Adaptive Key-Value Quantization for Large Language Models
A Shutova, V Malinovskii, V Egiazarian, D Kuznedelev, D Mazur, ...
arXiv preprint arXiv:2501.19392, 2025
2025
В данный момент система не может выполнить эту операцию. Повторите попытку позднее.
Статьи 1–3