Интеллектуальный анализ аргументов в праве - это автоматическое извлечение аргументов или аргументов из юридических документов. Написание программного обеспечения, которое автоматически исключает юридические аргументы, оказывается чрезвычайно трудным. Даже юристы могут столкнуться с трудностями при выявлении, классификации и извлечении юридических аргументов. Но общая задача становится немного более управляемой, если мы распознаем и преодолеем 7 основных препятствий на пути к успеху.

Определение единицы аргумента

У интеллектуального анализа аргументов в законе есть техническое определение. Это автоматическое извлечение единиц аргументации или аргументации из юридических документов на естественном языке с целью предоставления структурированных данных для вычислительных моделей аргументации и для механизмов аргументации. (См. Аткинсон и др.,« К искусственной аргументации AI Magazine (2017)»; Хабернал и Гуревич,« Анализ аргументации в пользовательском веб-дискурсе Вычислительная лингвистика (2017) »; Лоуренс и Рид, «Argument Mining: A Survey Компьютерная лингвистика (2020) ».)

Что такое «аргумент»? Аргумент состоит из компонентов аргумента и логических отношений между этими компонентами.

Единица аргументации содержит по крайней мере два предложения в качестве компонентов - один вывод и одно или несколько посылок. «Предложение» - это законченная мысль, которая может быть истинной или ложной, обычно выражаемая простым декларативным предложением. Например, английское предложение «ребенок ногой по мячу» выражает предположение, что ребенок пнул мяч. Но другие английские предложения могут выражать то же предложение (например, «мяч ударил по мячу»). И предложения на французском и испанском языках могут выражать то же самое суждение. Итак, мы можем думать о предложении как о логическом значении, выраженном простым предложением на естественном языке. Логика изучает аргументы, составленные из предложений, независимо от того, как эти предложения выражаются на естественном языке.

Мы можем прикрепить дополнительные метки компонентов аргумента. Например, влиятельная модель Стивена Тулмина называет заключение утверждением и делит предпосылки на данные и подтверждение. (Стивен Э. Тулмин, Использование аргументов: обновленное издание (Cambridge University Press, 2003).) данные определяются как факты, к которым мы обращаемся как основание для иска . (Там же, 90.) В судопроизводстве роль таких данных играет допущенное доказательство. Например, частью доказательства может быть то, что свидетель показал, что событие произошло, как описано. Тулмин описывает гарантии как общие гипотетические утверждения, которые могут действовать как мосты и санкционировать тот шаг, на который нас обязывает наш конкретный аргумент. (Там же, 91). В юридических аргументах, гарантии в этом смысле могут быть обобщениями здравого смысла, научными методами или правилами вывода, установленными законом. Например, здравый смысл может заключаться в следующем: Если свидетель показал, что событие произошло, как описано, то, вероятно, так оно и было. Вывод аргумента может заключаться в том, что событие действительно произошло, как описано.

Единицы аргументации также могут различаться логическими отношениями, которые связывают их пропозициональные компоненты вместе. (См. Лоуренс и Рид (2020), стр. 777.) Предпосылка связана с заключением посредством дедуктивного или вероятностного отношения вывода. Более того, сама посылка может быть логически сложной, состоящей из множества предложений, связанных между собой логическими связками, такими как союз и дизъюнкция.

Процесс добычи

Таким образом, аргументная единица состоит из заключения, сделанного из посылки или набора логически связанных посылок. Цели поиска аргументов в законе:

· Определить в юридическом документе предложения, относящиеся к аргументу;

· Извлекать пропозициональные компоненты аргумента из предложений;

· Извлекать логические связи аргументации из слов и фраз;

· Точно построить полную единицу аргументации; и

· Для соединения единиц аргументации в последовательные цепочки рассуждений («аргументация»).

Процесс «майнинга» обычно происходит послойно. На первый взгляд юридический документ представляет собой последовательность предложений (обычно сгруппированных в параграфы, которые могут быть сгруппированы в более крупные разделы документа). Предложения (или предложения, а иногда и фразы внутри предложений) выражают суждения. Некоторые слова или фразы в этих предложениях обычно выражают действующие логические отношения (например, «и», «или», «поэтому», «если»). Интеллектуальный анализ аргументов требует соединения соответствующих предложений вместе, используя соответствующие логические отношения, чтобы отразить выдвигаемые аргументы. Это также требует соотнесения целых аргументов друг с другом (например, поддерживающих или противодействующих аргументов).

Горные работы должны «выкопать» все эти сооружения и «вывести их на поверхность» - сделать их видимыми. Причем делать это правильно, не искажая смысла исходного документа. Графическое изображение в начале статьи свидетельствует о многоуровневом характере этой операции по добыче полезных ископаемых.

7 проблем автоматического извлечения аргументов

Автоматизированный майнинг требует создания программного обеспечения, которое может хорошо выполнять эти задачи при минимальной помощи человека или вообще без нее. Исходя из моего многолетнего опыта с юридической аргументацией, логикой и процессами автоматического извлечения, я разбил этот общий процесс на 7 основных задач, каждая из которых представляет свои трудности. Если мы сможем успешно справиться с каждым из них, мы прошли долгий путь к автоматизации интеллектуального анализа аргументов в пользу закона. В этом обсуждении я сосредоточусь на извлечении аргументов из решений по установлению фактов - то есть из юридических документов, написанных для объявления того, как проверяющий факты применяет правовые нормы к доказательствам, чтобы сделать выводы о фактах. Такие решения обычно выносятся судами первой инстанции или административными трибуналами.

1. Разработка вычислимых систем юридических правил

Первая проблема при извлечении аргументов из юридических решений - это фиксация регулирующих правовых норм в вычислимой форме. Юридические правила определяют проблемы, которые необходимо доказать, а также структурируют процесс доказательства. Юристы держат в уме сложные наборы таких юридических правил и постоянно используют эти правила для аргументов. Где мы находим такие правовые нормы? Могут ли машины извлекать их, а затем формировать системы? Как мы должны представлять и хранить такие системы правил в компьютерах? Я обнаружил, что мы можем представить юридические правила, используя специальную форму дерева вывода (« дерево правил )», которое затем может функционировать в аргументах, как того требует Тулмин. Подробности того, как программное обеспечение может извлекать и формулировать деревья правил, должны остаться для отдельной истории. Но, как я объясняю в другом посте, мы знаем, что интеллектуальный анализ аргументов в праве требует фиксирования юридических норм в вычислимом формате, поэтому их можно использовать в аргументации.

2. Сопоставление выводов по фактам с юридическими вопросами

Правовые нормы говорят нам о проблемах, которые необходимо доказать, но суд или трибунал должен решить, какие правила удовлетворяются в конкретном случае. Вторая проблема поиска аргументов - это определение выводов трибунала по представленным правовым вопросам, включая сопоставление каждого вывода с его соответствующим юридическим вопросом (согласно которому заключение является примерно). Адвокат стороны интерпретирует доказательства и использует правовые нормы с целью убедить проверяющего факты сделать выводы в пользу клиента адвоката. Решения, написанные лицом, принимающим решения, обычно объясняют, каковы правовые нормы, аргументы сторон, соответствующие доказательства, аргументы лица, принимающего решения, относительно доказательств и выводы исследователя фактов (так называемые установление фактов). Основная задача при извлечении аргументов из письменного решения по делу - выявление тех приговоров (или частей приговоров), которые объявляют фактические выводы трибунала. Эти установочные приговоры говорят нам, какие аргументы суд принял », а какие - отклонил.

3. Определение «релевантных» доказательств

Но какие доказательства в деле являются предпосылкой для какого заключения или вывода? Третья проблема поиска аргументов - выявление доказательств, относящихся к любому конкретному выводу о факте. По закону доказательство является относящимся к делу, если оно делает вывод более или менее вероятным, чем он был бы без доказательств. (См., Например, Федеральное правило доказывания 401.) Можем ли мы создать общий алгоритм для классификации доказательств как относящихся к делу в этом юридическом смысле? Ответить на такие вопросы нам поможет точный анализ аргументов на основе принятых решений в аналогичных случаях. Возможно, мы сможем индуктивно разработать методы для связывания типов доказательств с типами открытий.

4. Рассуждение от свидетельств и правил к выводам

Предположим, что мы можем добывать правовые нормы, факты и соответствующие доказательства, тогда какова причина, которая объединяет их все вместе? Четвертая задача - определить аргументацию лица, принимающего решения. Как обсуждалось выше, доказательства предоставляют Тулмину «данные» для аргументов, а правовые нормы предоставляют некоторые из «оснований» для умозаключений. Но большинство промежуточных выводов (пути рассуждения от доказательства к заключению) не регламентируются правовыми нормами. Исследователь фактов опирается на здравый смысл, статистическую теорию, науку или какой-либо другой источник. Юристы со всех сторон вопроса могут спорить об альтернативных способах вывода. Тем не менее, мы хотим выявить собственные доводы суда, отличные от аргументов сторон. Для начала, мы можем идентифицировать любые предложения из сообщенных решений, в которых явно указывается такое рассуждение. Но что, если рассуждение неявно? Мы сможем предоставить такое неявное рассуждение, если разработаем информативную таксономию типичных моделей или схем аргументации.

5. Определение шаблонов аргументов

Пятая задача поиска аргументов в праве - это сформулировать адекватный набор повторяющихся моделей аргументов. Типичный шаблон или схема могут помочь сделать неявные выводы. Кроме того, нам нужны категории или типы для классификации единиц аргументации, которые мы находим в решениях. Категории или типы позволят нам рассчитать процент успеха или неудачи для разных аргументов в разных обстоятельствах. Прошлые решения могут предоставить эмпирическую основу для разработки такой системы типов, если мы сможем индуктивно создать полезную систему классификации. Мы должны разработать такую ​​систему для классификации единиц аргумента и пометить достаточный объем данных, прежде чем мы сможем надеяться автоматизировать процесс обнаружения экземпляров типов аргументов.

6. Создание достаточно точных семантических данных

На каждом этапе процесса интеллектуального анализа данных мы хотим разработать прогнозные модели, которые помогут нам провести классификацию. Шестая проблема поиска аргументов в законе - создание достаточного количества семантических данных, которые являются достаточно точными, чтобы мы могли разработать такие модели. Семантические данные состоят из частей текста, помеченных или классифицированных по их значению или значимости. В конкретной области права юридические -смысловые данные отражают юридическое значение или значение. Создание достаточного количества качественных данных может быть трудным и дорогостоящим. Алгоритмы машинного обучения могут создавать модели, которые помогут с генерацией данных, но они не могут избавить от необходимости сначала создать достаточно точные данные. К счастью, эмпирические исследования показывают, что юридический язык настолько регулярен, что относительно небольшие объемы семантических данных могут адекватно обучать алгоритмы машинного обучения.

7. Разработка прогнозных моделей машинного обучения

Но что здесь означает «адекватно тренироваться»? Может ли машинное обучение когда-либо успешно вести интеллектуальный анализ аргументов в соответствии с законом? Седьмая проблема юридического анализа аргументов - разработка моделей машинного обучения, которые могут автоматически создавать семантические данные с достаточной точностью. То, что считается «достаточной точностью», зависит от предполагаемого варианта использования, лингвистических характеристик текста юридического документа и абстрактности необходимых нам семантических данных. В настоящее время мы можем создать достаточно семантических данных для обучения моделей, которые существенно повышают ценность юристов и судей при выполнении различных задач. Эти прогностические модели помогают автоматизировать многие подзадачи, связанные с решением этих семи проблем. Но полностью автоматическое извлечение всех аргументов в целом может быть сложной проблемой в течение длительного времени.

Заключение

Мы можем разложить проблему извлечения аргументов из юридических решений на серию задач, каждая из которых представляет собой сложную задачу. В целом стратегия состоит из:

· Определение тех типов предложений, которые могут содержать разные типы логической информации;

· Извлечение желаемой логической информации из этих предложений; и

· Использование шаблонов аргументов для формулирования единиц аргументации, содержащихся в тексте.

По мере того, как мы копаем глубже лингвистической поверхности юридического документа, вплоть до уровня слов отдельных предложений, мы используем лингвистические особенности текста, чтобы обозначить его более абстрактными логическими понятиями. Таким образом, добыча аргументов настолько же парадоксальна, насколько и сложна, особенно с точки зрения права. Но определение серии проблем и продвижение к каждой задаче дает нам стратегию успеха в решении общей проблемы.