Realtime-дистилляция через API: как Thinking Machines ломает стереотипы о локальных моделях
Модель realtime interaction от Thinking Machines пока доступна только через API. Но дистилляция может вытащить её на локальные GPU. Разбираем перспективы.
Читать →