Это данные из окопов, и мы здесь, чтобы познакомить вас с мельчайшими подробностями мира науки о данных. Так что добро пожаловать. Мы надеемся, что вы готовы запачкать руки (образно говоря).

Вы спрашиваете, кто здесь, в окопах (то есть, зачем вам прислушиваться к тому, что мы говорим)? Мы группа специалистов по обработке данных с разным опытом (исследователи, предприниматели, инженеры, банкиры - список можно продолжить). Мы хотим внести свой вклад в сообщество специалистов по науке о данных, по одному за раз, углубляясь в детали.

Наш ассортимент будет широким; все, от проектов, которые мы наблюдаем в разных компаниях, до наших любимых исследовательских проектов и задач в области науки о данных, в которых мы принимаем участие. Мы рассмотрим широкий спектр тем, от введения в маркетинговую атрибуцию до серии сообщений о рекомендательных системах.

Если вы все еще читаете, но не уверены, давайте перейдем к делу:

  1. Мы будем предоставлять тот контент, который мы всегда рады найти: статьи с понятным, повторно используемым и комментируемым кодом, статьи, которые «распаковывают» используемые нами пакеты (и объясняют, почему мы их используем), статьи, которые отслеживают наши источники данных. (и по возможности сделаем данные доступными).
  2. Мы вносим свой вклад в науку о данных с открытым исходным кодом - чем больше мы все будем делиться своими проектами и кодом, тем быстрее мы все сможем выполнять итерации, улучшать и вводить новшества.
  3. Мы очень открыты для отзывов общественности о нашей работе и наших мыслях и рады взаимодействовать с вами.

Мы постараемся сделать проект и код простыми для понимания, а его результаты - воспроизводимыми. И вместо того, чтобы не упомянуть, насколько утомительной была конкретная задача (или вообще упомянуть задачу), мы будем стараться сохранять интеллектуальную честность наших сообщений: если основной частью проекта была очистка данных или маркировка данных, а не какие-то причудливое моделирование машинного обучения, скажем так.

Короче говоря, мы рады быть частью движения, направленного на то, чтобы сделать науку о данных открытыми, строгими и воспроизводимыми, а также поделиться интересными вещами, которые мы узнали на этом пути.