Сбор и разметка данных для машинного обучения
Санкт-Петербург, весна 2020
Описание
Описание
В настоящее время практически любая содержательная задача по анализу данных или ML требует сбора размеченных данных, которые, как правило, нужны в большом количестве и требуют привлечения ручного труда. Работа с краудом
является одним из востребованных и ключевых навыков, которыми необходимо уметь пользоваться специалистам по анализу данных, если они хотят расти и решать все более крупные и амбициозные задачи.
В ходе курса мы будем учить настраивать процессы работы с краудом, а именно будем останавливаться на таких темах как декомпозиция, контроль качества, агрегация результатов и ценообразование.
Преподаватели — специалисты из разных сервисов Яндекса, которые регулярно используют краудсорсинг для решения таких задач как определение релевантности поисковой выдачи, тестирования и распознавание речи или объектов на изображениях.
ТГ канал для студентов курса - https://t.me/crowdcsc2020
Результаты обучения на курсе
Студенты, прошедшие данный образовательный курс, будут обладать глубоким пониманием и систематизированной картиной технологий краудсорсинга, что должно повысить эффективность работы продуктовых процессов. Будет очень интересно!
Пререквизиты
Пререквизитов нет, но базовые знания python, html, js и css приветствуются.
Критерии оценивания
9 домашек, которые в сумме составляют 100 баллов
Каждая домашка проверяется семинаристом, который ведет соответсвующий семинар, и разбалловка каждого задания определяется семинаристом.
- Отлично: 80-100
- Хорошо: 65-79
- Зачёт: 50-64
Дедлайн: 12 дней
- можно сдать ДЗ в течение недели после дедлайна, потеряв 3 балла.
- можно сдать по желанию ДЗ по истечении 1 недели после дедлайна с максимальной оценкой 5 баллов.
Бюджет на домашки
На создание и запуск проектов в Толоке вам будет выделен бюджет. На каждую домашку выделено $х, бюджет устанавливает семинарист. Если вы превысили бюджет, то можете запросить еще, но за каждый доллар вы получите по -1 баллу. (Совет от души: лучше экономить и копить бюджет на всякий случай)
(!) Если есть вопросы по конкретной домашке или лекции, пингуйте соответствующего преподавателя
@dbaidakova - куратор курса, все орг вопросы можно писать мне