AH Insiders! (c дескриптором)

Сложность: 800

«Мир полон очевидных вещей, которые никто никогда не замечает.»


Пролог

Сначала это выглядело как совпадение.
Один сорванный контракт, потом другой.
Ошибка в логистике, сбой в аналитике, утечка конфиденциальных решений совета.
Конкуренты действуют с пугающей точностью, словно знают будущее.

Holmes Industries, мегакорпорация с 15 000 сотрудников,
оказалась на грани катастрофы.
Финансовые потоки рушатся, репутация тает,
а рынок готовится к панике.

Проверили всё: сервера, связи, инфраструктуру.
Чисто.
Но информация всё равно просачивается.
Кто-то внутри сливает данные.

И тогда совет директоров вынес единственный вердикт:

«Проблема не в коде. Проблема в людях.»

Теперь это ваша работа.
Среди 15 000 сотрудников маленькая, но опасная группа инсайдеров.
От того, насколько быстро вы их найдёте,
зависит судьба компании… и, возможно, стабильность рынка.


Ваша миссия

Вы - аналитик внутренней безопасности Holmes Industries.
Вам передан месячный журнал всех событий: входов, выходов и встреч сотрудников.
Где-то среди этих записей - закономерности, которые указывают на тех, кто работает против компании.

Инсайдеров немного: от 5 до 15 человек (точно неизвестно сколько).
Но они умны. Их паттерны замаскированы под рутину.

Ваша задача - вычислить их.


Файл: events_participants.csv

person event_type event_time event_location event_partner
person_0001 entry 432 turnstile None
person_0456 meeting 2789 room_12 person_0023,person_0077

Файл с бинарным предсказанием для каждого сотрудника.

Формат CSV

person y_pred
person_0001 0
person_0002 1
person_0003 0

Правила: - Ровно 15 000 строк — по одному сотруднику.
- y_pred ∈ {0,1}
- В файле ровно K единиц, где 5 ≤ K ≤ 15.
- Дубликаты, пропуски, неверные ID → невалидно.
- Сабмит с K < 5 или K > 15 → не засчитывается.


Метрика: Jaccard@K

Пусть: - P — множество сотрудников с y_pred = 1 (|P| = K)
- T — истинное множество инсайдеров (скрыто организаторами)

$$ Jaccard@K = \frac{|P \cap T|}{|P \cup T|} $$

Примечания:

Данные для обучения: train_data

Данные для тестирования: test_data

Пример правильного ответа: sample_submission_data

Метрика задачи: rmse стандартная метрика

Отправить решение

Чтобы отправить решение, войдите в аккаунт.

Мои 5 посылок по задаче: AH Insiders! (c дескриптором)

Пока нет посылок по этой задаче.
ID Дата Статус Детали
Нет посылок