Он будут полезен студентам, которые задумываются о поступлении в магистратуру и на ДПО программы «ПАНДАН» (Прикладной анализ данных в социогуманитарных областях) и новую магистратуру Школы искусств и музейного наследия – «Музейные исследования и кураторские стратегии».
Обе программы ориентированы на подготовку специалистов, которые будут способны применять навыки анализа, разметки и визуализации данных в социогуманитарных науках, в том числе в области музейных технологий.
Воркшоп позволит участникам больше узнать о технологиях, преподаваемых на программах, попробовать на практике полученные знания под руководством наставников, а также задать интересующие вопросы о поступлении. Предварительные знания в области программирования не требуются.
Воркшоп пройдет в двух частях:
1. Пауки + роботы: королевство автоматизации во вселенной данных.
Иван Бибилов, Директор Прикладного центра машинного обучения, анализа данных и статистики (ПЦ МАСТ); Руководитель программы прикладного анализа данных (ПАНДАН)
Воркшоп посвящен скрепингу и парсингу данных из различных источников. Представим, что мы хотим ответить на вопрос, что чаще бывает в меню школ c котлетками: макароны или пюре. У нас есть очень много сайтов школ, где есть повседневное меню. Иногда в лучших традициях автоматизации: это фотография распечатки документа, которая представлена в виде pdf-документа. А может быть иногда и Excel. Необходимо пройтись по тысяче документов и накопить статистику. Далее автоматизировать рутинные действия.
Навыки могут быть применимы как в исследовательских целях, так и в рабочих и бизнес-задачах. А также в быту (наконец-то разобрать свой архив за десятки лет).
Что изучим:
— Создание собственного датасета.
— Автоматизация поиска и извлечения информации с сайтов и жестких дисков.
— Работа с изображениями и текстами. Различные форматы файлов.
— Сценарии на языке Python.
— Утилиты и библиотеки.
2. Картинки в текстовом пространстве
Олег Лашманов, Научный руководитель и исполнительный директор Лаборатории «Искусство и искусственный интеллект»
Когда у вас много изображений всегда хочется найти среди них интересные или содержащие какой-то предмет. Но как это сделать? Просматривать тысячи фотографий скучно и долго. В такие моменты приходят на выручку алгоритмы машинного обучения.
Что изучим:
— Создание собственного датасета.
— Zero-shot алгоритмы для поиска по изображениям.
— CLIP, BLIP и трансформация изображений в вектор.
Также мы просим участников, которые придут оффлайн, принести свои ноутбуки. Планшеты и смартфоны для практики не подойдут. Вы можете взять с собой любой работающий ноутбук, однако если возможности принести его нет, пишите нам на почту ievseeva@eu.spb.ru — мы постараемся вместе решить этот вопрос.
Напоминаем, что для того чтобы восстановить билет организатору можно не писать.
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.