Здравствуйте, GlebЗ, Вы писали:
GЗ>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.
Вчера погонял ее немного в версии Q6_K (контекст 200к, использованный до 100к). Показала себя хуже геммы-4 или квена-35-3, но это может быть косяк с настройками модели (не было времени разбираться).
Очень часто зацикливается как на этапе thinking так и на этапе генерации. Приходится перезапускать запрос.