Natimatica Efficient Header Challenge
О конкурсе
Компания Natimatica объявляет о конкурсе программных решений в области обработки естественного языка и машинного обучения. Задача конкурса заключается в преобразовании заголовков текстовых материалов с целью сделать их более привлекательными и "цепляющими". Целью участников является разработка программы, способной преобразовывать оригинальный заголовок в нечто более интересное.
Описание задачи
Одной из труднорешаемых прикладных задач обработки естественного языка является проблема повышения привлекательности контента для пользователя. В частности, кликабельность рекомендательных блоков напрямую зависит от того, насколько пользователей заинтересуют их материалы, обязательными атрибутами которых являются текстовые заголовки и описания. В настоящее время подобные задачи решаются вручную.
В условиях конкурса мы предлагаем улучшать текстовую привлекательность заголовков, используя при этом средства автоматической обработки естественного языка, такие как формальные грамматики, синтаксические и морфологические парсеры и другие. Заголовок материала рекомендательного блока представляет собой одно предложение, отражающее смысловое содержание озаглавленной статьи. Ясно, что для одной и той же статьи можно придумать массу различных заголовков, разных по привлекательности. Как правило, заголовок, придуманный авторами статьи, является далеко не самым эффективным. Главная задача конкурса - повысить эту эффективность, изменив его. Для этого можно выделить как минимум две стратегии:
- Чтобы увеличить вероятность перехода, заголовок можно соответствующим образом обрезать, скрыв часть содержащейся в нем информации. Например, из заголовка “В Москве дорожные знаки установят на фасадах зданий” можно сделать гораздо более привлекательный “В Москве дорожные знаки установят на ...”, вызвав тем самым пользовательский интерес.
- Заголовок можно сделать более привлекательным, переформатировав его, заменив часть слов или расширив. Например, заголовок “Полеты в Крым дешевеют” можно преобразовать в “Неожиданное решение властей, наконец-то полеты в Крым стали ...”.
Участники и условия участия
К участию допускаются учащиеся бакалавриата, магистранты и аспиранты. Участники могут объединяться в команды численностью до 3 человек, возможно также и индивидуальное участие. Все участники должны зарегистрироваться через Google-форму по ссылке внизу страницы.
Данные и требования к решениям
Участники конкурса получают доступ к данным, собранным с площадок сети Natimatica. Данные представляют собой коллекцию статей, состоящих из оригинальных текста, заголовка и ссылок на картинки. Они представляют собой примеры реальных материалов.
Оценка результатов и жюри
Решения (программный код, обученные классификаторы и т.д.) сдаются в специальную систему, доступ в которую участники получают после регистрации. Определение победителей будет происходить в два этапа:
- Экспертная оценка решений. На этом этапе жюри оценит решения на основе специально разработанных критериев и отберет несколько лучших.
- Тест в реальных условиях. На этом этапе решения участников будут подключены к рекомендательной системе Natimatica.
Жюри конкурса представлено членами команд основателей и разработчиков рекомендательной системы Natimatica.
Призы
По решению жюри, победитель, создавший наиболее эффективный алгоритм, получает в качестве приза Apple iPhone 7.
Важные даты
31 января - 20 марта - основной этап конкурса
20 марта, 23.59 МСК - дедлайн первого этапа сдачи решений
21 марта - 27 марта - проверка и оценивание решений, определение и объявление финалистов, объявление рекомендаций по улучшению решений
28 апреля - 4 апреля - время на доработку решений
4 апреля, 23.59 МСК - дедлайн второго этапа сдачи решений
5 апреля - 12 апреля - подключение решений к рекомендательной системе Natimatica, сбор статистики и оценивание решений
13 апреля - объявление результатов конкурса, награждение победителей
Все вопросы направляйте по адресу challenge@natimatica.com