Эксперт объяснил тулякам, нужно ли ограничивать нейросети

Фото: Творческий индустриальный кластер "Октава"
22 марта Тулу посетил эксперт в области искусственного интеллекта Дмитрий Сошников. «ТУЛАСМИ» поговорили со специалистом о его работе в Microsoft и новом проекте, который был представлен на выставке в оружейной столице.
Вы проработали в Microsoft 16 лет. Как у вас появилась возможность поработать на одну из крупнейших технологических компаний мира?
Я преподавал в Московском авиационном институте и был руководителем студенческих команд, которые подавали свои инновационные проекты на конкурс Microsoft Imagine Cup. Наши команды стабильно занимали высокие места в России, выходили в международный этап конкурса, как-то даже заняли второе место в мире. Коллеги из Майкрософт по достоинству это оценили, пришли ко мне и предложили заниматься развитием конкурса Imagine Cup уже по всей стране, будучи сотрудником компании. Ну а дальше понеслось.

Какие проекты в вашей карьере вы сами считаете самыми интересными?
Если продолжать рассказ о конкурсе Imagine Cup — это такой всемирный конкурс студенческих стартапов — то самым интересным было привести международный финал конкурса в Россию в 2013 году. Студенты из более 30 стран собрались в Санкт-Петербурге, где проходило это яркое событие. Одним из ведущих членов жюри был создатель игры «Тетрис» Алексей Пажитнов. Можно сказать, что это один из ярких примеров самых первых российских игровых стартапов, который знают люди во всем мире. Мы привозили и других известных людей, мне посчастливилось дважды выступать на одной сцене со Стивом Балмером (предыдущим CEO Microsoft), встречаться с Биллом Гейтсом в ходе его последнего визита в Россию.
Из других проектов, которыми я горжусь, — это разработанный под моим руководством курс Microsoft AI for Beginners Curriculum — открытый курс по искусственному интеллекту для студентов и разработчиков. На его базе построены курсы, которые преподаю я и коллеги в МАИ, МИРЭА, РУТ МИИТ. Сейчас я много сотрудничаю с Yandex Cloud, и очень много проектов находится на стыке моих интересов, например, ИИ и искусство.

Вы в течение долгого времени занимались развитием искусственного интеллекта и машинным обучением. Расскажите, как происходит этот процесс?
За время, пока я занимался ИИ, это направление очень поменялось. Начинал я с того, что помогал строить диагностическую систему в медицине, извлекая знания из живого эксперта. Сейчас все больше построено на машинном обучении, когда мы «скармливаем» компьютеру много данных, и он учится на основе этих данных. Например, показывая ему все написанные человечеством тексты, мы учим модели (так называемые большие языковые модели) не только владеть языком, но и знать многое о мире и понимать смысл сказанного.
Каких принципов работы, по вашему мнению, необходимо придерживаться при обучении ИИ?
Один из важных принципов — избежать переобучения. Модели дают заведомо больше обучающих данных, чем она способна запомнить. Таким образом, мы стимулируем модель выявлять какие-то общие закономерности, абстракции — то есть, по сути дела, учиться, примерно так же, как это делает человек. Именно поэтому модели семейства GPT не могут точно запомнить все факты, а часто галлюцинируют. Они выдают правдоподобные ответы, но, строго говоря, не соответствующие действительности.
Нужно ли прописывать какие-то табуированные темы, на которые ИИ не будет давать ответы?
Это зависит от цели. Если мы хотим открыть модель для широкого пользования, было бы логичным запретить ей говорить такие вещи, например, ругаться матом. Пусть языковая модель подает молодежи пример достойного общения. Если же мы хотим натренировать модель, чтобы она, например, играла сторожа в виртуальном театре роботов — то логично было бы добавить такой модели чуточку такой лексики.
Один из последних ваших проектов - «Пульс распределенного тела» - посвящен изучению влияния текстовых и голосовых сообщений на человека. Чем вас привлек этот проект?
Мы делали этот проект совместно с художницей Ириной Иванниковой, которая уже проводила похожие эксперименты, но без большого участия технологий, в формате перформанса. В данном случае мы вынесли перформанс из зала на просторы интернета. Кроме того, сделали его распределенным не только в пространстве, но и во времени. То, что в процессе собираются данные, позволит нам в дальнейшем проанализировать их и понять, есть ли какая-то зависимость в том, на что реагирует художница. Но самое главное: проект позволяет зрителям дистанционно «прикоснуться» к сердцу художницы, поскольку Ирина делится со зрителями очень интимными вещами, своим сердечным ритмом.
На какой стадии сейчас находится этот проект? Есть ли какие-то предварительные итоги?
Предварительные итоги мы пока не подводили, так как надеемся собрать еще побольше данных. Пользуясь случаем, приглашаем всех читателей воспользоваться телеграм-ботом и послать художнице голосовое или текстовое сообщение. В ответ на это вы на следующий день получите картинку пульса художницы в момент прочтения вашего послания.