Natimatica Efficient Header Challenge

О конкурсе

Компания Natimatica объявляет о конкурсе программных решений в области обработки естественного языка и машинного обучения. Задача конкурса заключается в преобразовании заголовков текстовых материалов с целью сделать их более привлекательными и "цепляющими". Целью участников является разработка программы, способной преобразовывать оригинальный заголовок в нечто более интересное.

Описание задачи

Одной из труднорешаемых прикладных задач обработки естественного языка является проблема повышения привлекательности контента для пользователя. В частности, кликабельность рекомендательных блоков напрямую зависит от того, насколько пользователей заинтересуют их материалы, обязательными атрибутами которых являются текстовые заголовки и описания. В настоящее время подобные задачи решаются вручную.

В условиях конкурса мы предлагаем улучшать текстовую привлекательность заголовков, используя при этом средства автоматической обработки естественного языка, такие как формальные грамматики, синтаксические и морфологические парсеры и другие. Заголовок материала рекомендательного блока представляет собой одно предложение, отражающее смысловое содержание озаглавленной статьи. Ясно, что для одной и той же статьи можно придумать массу различных заголовков, разных по привлекательности. Как правило, заголовок, придуманный авторами статьи, является далеко не самым эффективным. Главная задача конкурса - повысить эту эффективность, изменив его. Для этого можно выделить как минимум две стратегии:

  1. Чтобы увеличить вероятность перехода, заголовок можно соответствующим образом обрезать, скрыв часть содержащейся в нем информации. Например, из заголовка “В Москве дорожные знаки установят на фасадах зданий” можно сделать гораздо более привлекательный “В Москве дорожные знаки установят на ...”, вызвав тем самым пользовательский интерес.
  2. Заголовок можно сделать более привлекательным, переформатировав его, заменив часть слов или расширив. Например, заголовок “Полеты в Крым дешевеют” можно преобразовать в “Неожиданное решение властей, наконец-то полеты в Крым стали ...”.

Участники и условия участия

К участию допускаются учащиеся бакалавриата, магистранты и аспиранты. Участники могут объединяться в команды численностью до 3 человек, возможно также и индивидуальное участие. Все участники должны зарегистрироваться через Google-форму по ссылке внизу страницы.

Данные и требования к решениям

Участники конкурса получают доступ к данным, собранным с площадок сети Natimatica. Данные представляют собой коллекцию статей, состоящих из оригинальных текста, заголовка и ссылок на картинки. Они представляют собой примеры реальных материалов.

Оценка результатов и жюри

Решения (программный код, обученные классификаторы и т.д.) сдаются в специальную систему, доступ в которую участники получают после регистрации. Определение победителей будет происходить в два этапа:

  1. Экспертная оценка решений. На этом этапе жюри оценит решения на основе специально разработанных критериев и отберет несколько лучших.
  2. Тест в реальных условиях. На этом этапе решения участников будут подключены к рекомендательной системе Natimatica.

Жюри конкурса представлено членами команд основателей и разработчиков рекомендательной системы Natimatica.

Призы

По решению жюри, победитель, создавший наиболее эффективный алгоритм, получает в качестве приза Apple iPhone 7.

Важные даты

31 января - 20 марта - основной этап конкурса

20 марта, 23.59 МСК - дедлайн первого этапа сдачи решений

21 марта - 27 марта - проверка и оценивание решений, определение и объявление финалистов, объявление рекомендаций по улучшению решений

28 апреля - 4 апреля - время на доработку решений

4 апреля, 23.59 МСК - дедлайн второго этапа сдачи решений

5 апреля - 12 апреля - подключение решений к рекомендательной системе Natimatica, сбор статистики и оценивание решений

13 апреля - объявление результатов конкурса, награждение победителей

Все вопросы направляйте по адресу challenge@natimatica.com