Сложность: 800
Посетители ИКЕА по-разному испытывают стулья на прочность: кто-то спокойно пьёт кофе, кто-то загружается фрикадельками и садится вместе с рюкзаком и покупками.
Вам выдали анонимизированные данные испытаний стульев. По характеристикам человека, его поведения в магазине и параметрам стула нужно предсказать, сломается стул или выдержит.
Целевая переменная:
broke_chair
- 1 — стул сломался под посетителем
- 0 — стул выдержал испытание
В данные включены как характеристики посетителя, так и параметры стула и «контекста» визита:
shopper_weight_kg — вес посетителя (кг) backpack_weight_kg — вес рюкзака и пакетов, с которыми он сел на стул (кг) meatballs_count — съедено фрикаделек в ресторане ИКЕА до посадки на стул soda_ml — выпито газировки (мл) до посадки на стул time_spent_minutes — время, проведённое в магазине до момента посадки (минуты) stress_level — субъективный уровень стресса (от 1 до 10) assembly_skill_level — навыки сборки мебели по шкале от 1 (собирает табуретку 3 часа) до 10 (собирает «ПАКС» без инструкции) previous_chairs_broken — сколько стульев человек ломал за жизнь по собственным воспоминаниям chair_model_max_load_kg — заявленная максимальная нагрузка на стул по паспорту (кг) seat_pressure_index — инженерный индекс нагрузки на сиденье, учитывающий вес, посадку и распределение нагрузки (безразмерный показатель) train.csvОбучающая выборка. Каждая строка — один эпизод «человек сел на стул». Содержит:
id — идентификатор наблюдения broke_chair — целевая переменная (0 или 1) test.csvТестовая выборка с теми же признаками, но без целевой переменной:
id broke_chair sample_submission.csvШаблон отправки ответа:
id broke_chair — сюда нужно записать ваше предсказание для каждого объекта из test.csvanswer.csvФайл с истинными значениями broke_chair для объектов из test.csv (используется только для проверки).
Построить модель, которая по параметрам посетителя, его поведения и характеристикам стула предсказывает, сломается стул или нет.
Ваша задача — проанализировать признаки, подобрать подходящий алгоритм (в том числе попробовав очень простые модели по одному признаку) и добиться наилучшего качества предсказания.
Данные для обучения: train_data
Данные для тестирования: test_data
Пример правильного ответа: sample_submission_data
Чтобы отправить решение, войдите в аккаунт.
| ID | Дата | Статус | Детали | |
|---|---|---|---|---|
| Нет посылок | ||||