Доклад
  • Design and Architecture
  • Data Processing
  • Infrastructure

Бэкенд для AI Assistants под капотом: Redis, Redis, Redis

Зал 2На русском языке

В Yandex Cloud мы разрабатываем AI Assistants API — инструмент для создания AI-ассистентов. С точки зрения требований сервис интересен необходимостью соблюдать низкий оверхед при вызове генеративной модели. Во время разработки для минимизации задержки мы решили по минимуму заходить на диски за счет использования Redis.

В докладе разберем архитектуру решения, заменим SQS и Kafka на Redis. Наступим на несколько граблей с Redisson и срежем все усилия по минимизации задержки из-за нюансов деплоя. 

Спикеры

Приглашенные эксперты

Расписание