Data-платформа нового поколения

Data Science/ML/AI

Павел Денисенко

Зал №7

Тезисы

Бизнес X5 Group — это почти 400 тыс. сотрудников, 27 тыс. магазинов и 71 распределительный центр в 8 федеральных округах. Управлять таким большим бизнесом без инструментов, основанных на данных, невозможно. Поэтому мы всегда не жалели сил и средств на развитие нашей дата-платформы.

После того как экспансия в цифровой сегмент рынка продовольствия стала для X5 Group стратегическим приоритетом, ожидания бизнеса от data-платформы выросли как в количественном, так и в качественном измерении. Нужно больше данных, их обработка должна занимать меньше времени, запросы выполняться быстрее и для большего количества пользователей. А кроме этого, традиционных BI-отчетов с актуальностью данных Т-1 или классических ML-моделей теперь недостаточно. Требуется NRT-аналитика с рекомендательными движками на LLM-моделях.

В докладе я расскажу, за счёт каких решений нам удалось вывести data-платформу на качественно новый уровень. Вы узнаете о том:

Как мы реализовали принцип Data Mesh, разделив ответственность за данные, но сохранив общий технологический и инфраструктурный ландшафт; как мы определили data hub и data contract.
Что такое принцип composable применительно к архитектуре data-платформы; как мы сделали доступным выбор вычислительных движков (trino, spark) для команд, работающих с платформой.
За счёт каких инфраструктурных решений наша data-платформа выдерживает нагрузку от тысяч пользователей, выполняющих сотни тысяч запросов, сохраняя при этом способность к быстрому масштабированию и оптимальному управлению ТСО.

Аудитория

Devops-engineer, team-lead, ML-engineer, engineers.

Уровень сложности

Middle.

Запись доклада

Презентация

Презентация (на Я.Диске)

Data Science/ML/AI

X5 Tech

Павел Денисенко

31 мая, 11:00 (GMT+7)

Зал №7

Data-платформа нового поколения

Павел Денисенко

Тезисы

Аудитория

Уровень сложности

Запись доклада

Презентация

Павел Денисенко

Павел Денисенко

Другие спикеры секции Data Science/ML/AI

Максим Али

Михаил Куляскин

Александр Иванов

Олег Дурандин

Максим Мараков

Михаил Тихомиров

Денис Нагаев

Александр Савостьянов

Матвей Михальчук

Леонид Верховцев

Валентин Мамедов

Константин Хицко

Еще на тему Data Science/ML/AI

Михаил Федоренко

Сергей Переслегин

Андрей Вульф

Яна Харлан

Руслан Остропольский

Константин Кичинский

Александр Хохлов

Xu Young

Алексей Дорошков

Андрей Кузнецов

Екатерина Тьюринг

Андрей Кузнецов

Станислав Моисеев

Дмитрий Притыкин

Даниил Терентьев

София Андрикова

Алексей Сигаев

Марат Зимнуров

Денис Омельков

Евгений Ночевкин

Андрей Алексеев

Никита Ульшин

Екатерина Камчатова

Филипп Лях

Дмитрий Мачихин

Ольга Чарыкова

Светлана Болсуновская

Егор Банщиков

Михаил Попов

Анна Обухова

Ирина Райт

Евгений Антонов

Дарья Попова

Дмитрий Новиков

Эдгар Сипки

Сергей Киселев

Татьяна Долгина

Екатерина Чернова

Александр Саликов

Софья Селезнева

Дмитрий Иванов

Григорий Тищенко

Никита Нартов

Сергей Хованов

Дмитрий Болдырев

Алексей Попов

Мария Гузанова

Василий Гордеев

Дарья Бородина

Андрей Вавилин

Михаил Тимофеев

Артём Елинек

Любовь Вайгель

Александр Гердт

Ксения Гаврилова

Геннадий Евстратов

Евгений Галактионов