Это данные из окопов, и мы здесь, чтобы познакомить вас с мельчайшими подробностями мира науки о данных. Так что добро пожаловать. Мы надеемся, что вы готовы запачкать руки (образно говоря).
Вы спрашиваете, кто здесь, в окопах (то есть, зачем вам прислушиваться к тому, что мы говорим)? Мы группа специалистов по обработке данных с разным опытом (исследователи, предприниматели, инженеры, банкиры - список можно продолжить). Мы хотим внести свой вклад в сообщество специалистов по науке о данных, по одному за раз, углубляясь в детали.
Наш ассортимент будет широким; все, от проектов, которые мы наблюдаем в разных компаниях, до наших любимых исследовательских проектов и задач в области науки о данных, в которых мы принимаем участие. Мы рассмотрим широкий спектр тем, от введения в маркетинговую атрибуцию до серии сообщений о рекомендательных системах.
Если вы все еще читаете, но не уверены, давайте перейдем к делу:
- Мы будем предоставлять тот контент, который мы всегда рады найти: статьи с понятным, повторно используемым и комментируемым кодом, статьи, которые «распаковывают» используемые нами пакеты (и объясняют, почему мы их используем), статьи, которые отслеживают наши источники данных. (и по возможности сделаем данные доступными).
- Мы вносим свой вклад в науку о данных с открытым исходным кодом - чем больше мы все будем делиться своими проектами и кодом, тем быстрее мы все сможем выполнять итерации, улучшать и вводить новшества.
- Мы очень открыты для отзывов общественности о нашей работе и наших мыслях и рады взаимодействовать с вами.
Мы постараемся сделать проект и код простыми для понимания, а его результаты - воспроизводимыми. И вместо того, чтобы не упомянуть, насколько утомительной была конкретная задача (или вообще упомянуть задачу), мы будем стараться сохранять интеллектуальную честность наших сообщений: если основной частью проекта была очистка данных или маркировка данных, а не какие-то причудливое моделирование машинного обучения, скажем так.
Короче говоря, мы рады быть частью движения, направленного на то, чтобы сделать науку о данных открытыми, строгими и воспроизводимыми, а также поделиться интересными вещами, которые мы узнали на этом пути.