Расскажу кратко про генеративный ИИ и самые свежие новинки из области (VLM, VLA модели, имплементация механизма рассуждений типа DeepSeek R1). Дальшей перейду к робототехнике и применении LLM в части развития «мозга» антропоморфных роботов и манипуляторов. Покажу самые challenge-моменты технологического процесса, все вместе избавимся от страха, что роботы скоро захватят мир, поговорим про эмоциональный интеллект + всё это будем приправлять примерами работы современных моделей.
Analyst, data-scientist, engineers, everyone.
Any level.
Занимается машинным обучением с 2010 года, защитил диссертацию в 2013 году (к.т.н.), пишет докторскую диссертацию про применение мультимодальных архитектур для задач обеспечения пассивной безопасности мультимедийного контента. Руководит лабораторией мультимодального генеративного искусственного интеллекта FusionBrain в Институте искусственного интеллекта AIRI, один из отцов-основателей семейства моделей Kandinsky, преподает в Самарском университете и ИТМО, выступает с лекциями и пишет о событиях в AI и ML в авторском Telegram-канале @complete_ai. Автор более 100 научных публикаций, в том числе в топ-журналах (Q1/Q2) и сборниках Core A/A* конференций. Индекс Хирша — 14.