Доклад

Грузим в Kafka из базы: с CDC и без

  • На русском языке
Презентация pdf

Что, если каждое изменение из базы данных вам нужно транслировать в Kafka? Если в базе есть CDC — это отлично! А если нет? Какие подводные камни могут встретиться на пути? И даже если удалось настроить загрузку, как это правильно раскатать в большой организации с сотней команд?

Доклад будет сосредоточен на использовании Kafka Connect для забора данных из БД как с возможностью чтения WAL-логов, так и без нее. Посмотрим на неочевидные трудности, которые могут возникнуть в процессе:

  • Что произойдет, если мастер-нода базы данных откажет?
  • Как забрать данные из таблицы, если WAL-логи недоступны, а в ней даже нет тайм-стемпов?
  • Как написать свой коннектор, если open source-вариантов недостаточно? 

Обсудим особенности использования Kafka Connect на enterprise-уровне: как унифицировать метаданные, как деплоиться и откатываться из CI, как хранить секреты.

Как Platform Owner платформы потоковой обработки данных в Райффайзен Банке и дата-инженер с более чем пятилетним опытом, спикер поделится нюансами построения внутреннего PaaS-решения на больших объемах (десятки команд используют его, ежесекундно прогоняя тысячи сообщений).

Спикеры

Приглашенные эксперты

Расписание