Как найти и посчитать тигров в море и дельфинов в лесу

Data Science/ML/AI

Тезисы

Разработка социальных проектов вдохновляет, ведь их цель всегда ясна и значима. Однако эта сфера сопряжена с уникальными вызовами. Например, здесь редко встречаются большие бюджеты, что затрудняет поиск качественных и объёмных датасетов. Также сложно найти экспертов, способных помочь преобразовать задачу реального мира в задачу машинного обучения. В докладе я расскажу о двух своих социальных проектах, и поделюсь решениями, которые обеспечили их реализацию:

  • Как оптимизировать разбор десятков тысяч фотографий диких животных?
  • Можем ли мы узнать нужного тигра из тысячи? По словам, по глазам, по образу? Какие нюансы есть для задачи ReID диких животных?
  • Что эффективнее: множество компактных детекторов/классификаторов или одна огромная модель? И в каких случаях?
  • Фундаментальные модели (GLEE, SAM, Florence): благо или проклятие? Какие из них оказались полезны?
  • Нужен ли active learning с human-in-the-loop в проектах компьютерного зрения? Как его применять?

Аудитория

Data-scientist, ML-engineer.


Уровень сложности

Any level.

Сбер
Леонид Верховцев

В машинном обучении (в компьютерном зрении в частности) с 2018 года. Начинал с проектов по поиску дефектов в рельсах и определения границ раздела сред по георадиолокационным данным. Делал решение по распознаванию русского жестового языка. Затем работал над детекцией и реидентификацией диких животных. В проектах было многое: организация краудсорс разметки, ETL процессы для собираемых данных, обучение, инференс моделей и вывод их в прод. В процессе собрал все возможные грабли и шишки, о которых любит рассказывать.

Другие спикеры секции Data Science/ML/AI

Еще на тему Data Science/ML/AI