Этот блог представляет рецензируемую статью в журнале DCE с открытым доступом. Ханна Мелиа (Citrine Informatics) обсуждает растущую область информатики материалов, ее потенциал для достижения экологических целей и роль открытых данных в ускорении исследований.

По оценкам, производство материалов и химикатов вызывает около четверти выбросов парниковых газов. Таким образом, переход на биосырье, создание экономики замкнутого цикла и повышение эффективности производства материалов важны для достижения глобальных целей по нулевому выбросу углерода. Материалы являются частью продуктов, которые нам нужны, чтобы помочь нам жить более устойчиво, внося свой вклад в обезуглероживание сети, электромобильность, улавливание углерода и так далее. Разработка преобразующих технологий для смягчения наших глобальных экологических и технологических проблем потребует значительных инноваций в проектировании, разработке и производстве передовых материалов и химикатов.

Разработка новых и квалифицированных материалов для использования в критически важных приложениях остается длительным процессом; двадцать лет от открытия до выхода на рынок — обычное дело. Чтобы внедрять инновации быстрее, чем традиционные (человеческие) методы, управляемые интуицией, мы должны перейти к парадигме информатики. Синергия между наукой о данных, материаловедением и искусственным интеллектом может быть использована для обеспечения преобразующих открытий на основе данных за счет использования прогностических моделей и цифровых двойников.

Материалы Информатика

Информатика материалов (MI) является растущей областью в химической промышленности. В этой области применяются принципы информатики для улучшения понимания, использования, выбора, разработки и обнаружения материалов. Общие промышленные приложения включают в себя:

  • Открытие новых материалов, обладающих определенными целевыми свойствами
  • Оптимизация состава или параметров обработки существующих материалов
  • Идентификация составов, которые одновременно соответствуют критериям производительности, стоимости и устойчивости.
  • Определение наиболее информативных экспериментов для выполнения в рамках бюджетных требований или других ограничений

Ознакомиться с кейсами таких компаний, как Panasonic и Showa Denko, можно здесь. Однако широкому внедрению MI препятствуют такие барьеры, как пробелы в навыках, культурное сопротивление и нехватка данных.

С нетерпением жду

Программные платформы MI доступны и совершенствуются, для их использования требуется меньше знаний в области науки о данных; однако для максимально эффективного использования технологии необходимо базовое понимание машинного обучения и обработки данных. Как всегда с программным обеспечением, мусор на входе, мусор на выходе. Это означает, что если исследователи в области материалов и химикатов в промышленности и академических кругах хотят ускорить свои исследования, необходимо, чтобы как бакалавриат, так и курсы непрерывного профессионального развития в области МИ были широко доступны.

Образовательный процесс должен охватывать тех, кто по-прежнему скептически относится к силе МИ, или тех, кто опасается, что он отнимет у них работу. Важно подчеркнуть, что машинное обучение не обязательно является черным ящиком и что знания экспертов в предметной области позволяют использовать машинное обучение на небольших разреженных наборах данных, таких как те, которые содержатся в материалах и химических веществах.

Наборы данных по материалам и химическим веществам обходятся дорого: получение одной точки данных иногда занимает месяцы и стоит десятки тысяч фунтов стерлингов. Полученная информация очень зависит от контекста. Исследовательская группа в следующей лаборатории может быть не в состоянии интерпретировать и повторно использовать данные, если в метаданные не включены точные условия тестирования. В целом, чем больше качественных данных доступно, тем лучше работают модели машинного обучения. Важно, чтобы будущие наборы данных хранились в соответствии с принципами FAIR, что может поощряться органами, финансирующими исследования. Как и в случае с проектом генома человека, доступ к высококачественным данным может оказать преобразующее, катализирующее воздействие на исследование материалов.

Публикация в Data-Centric Engineering

Перспективная статья DCE написана с моими коллегами Эриком Макли и Джеймсом Саалом. Мы обсуждаем важность информатики материалов для ускорения технологических инноваций, описываем существующие препятствия и примеры передовой практики, а также предлагаем, как исследователи, финансирующие агентства и образовательные учреждения могут помочь ускорить внедрение наборов инструментов MI для науки в 21 веке.

Конкурирующий интерес:Ханна Мелиа является консультантом по управлению продуктами в Citrine Informatics, компании, предоставляющей платформу искусственного интеллекта для ускорения разработки материалов и химикатов.

Ключевые слова:материалы; ДКЭ; открытые данные; Искусственный интеллект; устойчивость

Это блог Data-Centric Engineering, журнала с открытым доступом, издаваемого издательством Cambridge University Press и поддерживаемого фондом Lloyd’s Register Foundation. Вы также можете найти нас в Твиттере. Вот инструкция по подаче статьи в журнал.