Эта статья представляет собой обобщенный результат опыта интервьюера и интервьюируемого. Интуиция заключается в том, чтобы поддержать энтузиастов и профессионалов в области науки о данных, чтобы пройти собеседование по науке о данных.
Для ясности интервью предлагается обратиться к поясняющим ключевым моментам к перечисленной анкете. Эти вопросы поднимались в последние дни на разных этапах интервью с известными организациями по науке о данных.
- Что такое длинный и широкий набор данных?
- Что такое оси X и Y в логистической регрессии?
- Каковы методы построения деревьев решений?
- Как будет построено дерево решений и в чем его логика?
- Чем построение случайного леса отличается от деревьев решений?
- Как работает кластеризация K-средних?
- Что такое КНН?
- Каковы методы вычисления K в K-средних?
- Что такое K-средства++?
- Что такое бэггинг и буст моделей? Когда его использовать?
- Каков ваш подход к разработке проекта по науке о данных?
- Что именно вы сделали для проекта? Объясните с каждым этапом?
- Что такое точность и полнота? Обратите внимание на важность каждого?
- Перечислите и кратко изложите важность алгоритмов оптимизации?
- Как вы определили ключевые параметры в своем проекте?
- Как вы проверяли свою модель? или Как проверить модель?
- Как измерить производительность модели?
- Какие меры предосторожности учитываются для будущей производительности модели?
- Как вы интерпретировали модель?
- Что такое ПДП?
- Что такое A/B-тестирование? Почему он используется?
- Вы проверяли производительность вашей модели во время выполнения? Кратко это?
- Какие показатели учитываются при оценке вашей модели?
- Пример из практики: как определить отток клиентов в автомобильной отрасли в зависимости от обслуживания автомобилей?
- Почему повышение градиента важно?
- Что такое загрузочный набор данных? Будет ли замена/незамена?
- Каковы этапы обработки естественного языка?
- Пример: различные твиты, собранные с платформ социальных сетей и созданные в виде набора данных, как анализировать/исследовать эти данные и исключать фиктивные твиты, чтобы найти лучших авторов.
- Что такое тематическое моделирование?
- Зачем считать векторизатор, встраивание слов, word2vec?
- Объясните свой вклад в развертывание модели?
- Каков ваш повседневный режим работы?
- С какими критическими проблемами вы столкнулись в бизнесе? Как вы решили это / их?
- Пример из практики:6 дней, 50 магазинов. Человек должен обойти все магазины за 6 дней с минимальным расстоянием. Каков ваш подход к поиску маршрута?
- Пример из практики. Каков ваш подход к поиску 25 % покупателей, имеющих право на получение скидок в точках продаж?