Насколько данные изменили нашу жизнь за последнее десятилетие? Чуть более 10 лет назад был выпущен iphone. В то время наши телефоны делали зернистые фотографии, а видео было всего лишь выдачей желаемого за действительное. По-прежнему было странно покупать обувь через Интернет, и нам все еще приходилось носить с собой стопки карт, когда мы посещали новый город. А Netflix была только компанией по производству DVD.

Теперь ваши телефоны могут снимать фото и видео: каждую секунду на Facebook загружается более 4000 фотографий, а на YouTube каждую минуту загружается более 400 часов видео. Мы больше беспокоимся о возможности подключения, чем о том, чтобы у нас была карта. А наши картографические приложения предоставляют нам информацию о трафике в реальном времени и позволяют перемещаться по трафику. Не хочешь водить? Нет проблем, используйте приложение для обмена поездками, которое использует триллионы точек данных. Фундаментальный сдвиг, стоящий за этим радикальным изменением, - это сочетание значительного увеличения вычислительной мощности, хранилища и данных. И, конечно же, специалисты по обработке данных, дизайнеры и другие технологи, которые воплощают эти идеи в жизнь.

Преобразование данных только начинается. Мы собираемся перейти от секвенирования генома человека к индивидуальному лечению (точная медицина). На наших дорогах начали появляться беспилотные автомобили, и мы увидим попытки построить грузовые корабли и самолеты. А искусственный интеллект показал новые способы думать об играх, опередив лучших людей.

В то же время мы видели данные, которые использовались для причинения вреда путем сочетания халатности, наивности и изощренных атак. От выборов в США, Брексита, аварий из-за беспилотных автомобилей до расистских алгоритмов; мы должны ожидать увеличения вреда от данных. И мы только начинаем осознавать социальные последствия сокращения рабочих мест из-за автоматизации.

Вопрос, который нам нужно решить, заключается в том, что мы можем сделать, чтобы данные и технологии работали на нас, а не против нас?

Существуют нормативные подходы Европейского Союза (GDPR) и Калифорнии (CCPA). И слушания Конгресса США (без каких-либо действий). Были книги, в которых освещались предстоящие риски, такие как Оружие математического разрушения и Автоматизация неравенства. И появились новые аналитические центры, такие как Партнерство по ИИ, AI Now Institute и Центр гуманных технологий, которые начали работу, чтобы начать понимать более широкие последствия для общества.

Я фанат этих усилий. Они очень нужны. Вопрос, который я хочу задать: а как насчет аналитика данных и остальной команды, ответственной за создание этих технологий? Какова их роль во внедрении хорошей науки о данных? (Также обсуждается в этом посте.)

Когда мы с Хилари Мейсон опубликовали Управляемые данными: создание культуры данных, мы поняли, что мало что делается для расширения возможностей людей, которые хотят делать то, что правильно. Эти технологи, дизайнеры и менеджеры по продукту могут иметь правильные природные инстинкты, но часто оказываются в стороне из-за давления со стороны бизнеса или неоптимальной практики. А в других случаях даже не знаю, какие вопросы задать.

Вместе с Хилари Мейсон и Майком Лукидесом (которые были нашим редактором в каждой книге и мы, наконец, убедились, что мы должны стать соавторами) мы рассмотрели лучшие практики, которые мы видели у специалистов по обработке данных, и выпустили новую электронную книгу. -книга: Этика и наука о данных.

Учитывая, как много мы ожидаем изменений по этой теме, мы думаем об этой книге как о проекте с открытым исходным кодом, и это выпуск 0.1. Мы также позаботились о том, чтобы он всегда был бесплатным и под лицензией Creative Commons License (чтобы вы могли взять его и установить своими силами). Мы также хотим, чтобы другие рассмотрели возможность участия, и мы будем публиковать эти обновления в Серии изданий по этике O’Reilly Radar. Мы также намеренно сделали его как можно короче в надежде, что вы сможете поделиться им с другими командами. (Вы можете получить все наши другие электронные книги бесплатно здесь.)

Что вы можете ожидать найти в книге? Мы рассмотрим, что такое типовой контрольный список (созданный по образцу Манифеста контрольного списка от Атула Гаванде) для создания продуктов данных (если вы работаете над чем-то подобным, мы определенно хотим услышать от вас, что работает, а что нет). Идеи о том, как реализовать более этичное поведение в процессе разработки продукта, включая канал несогласия, если вы не согласны с командой. Как мы можем начать собеседование с талантами на предмет соответствия культурным и этическим нормам. Также то, что мы называем пятью С - пятью руководящими принципами формирования данных, помогают нам думать о создании продуктов данных (согласие, ясность, последовательность, контроль и прозрачность, а также последствия и вред). Наконец, мы включили набор примеров из практики команды Эда Фельтена в Принстоне, чтобы вы и ваша команда поработали над ними.

Больше всего мы хотим получить известие от вас. Влияние данных заключается в том, что данные происходят сейчас, и нам нужно понять это. Все начинается с нас. Те, кто строят эти технологии. Получите электронную книгу здесь.

Поехали. Никто не придет, решать нам.

-dj