Здесь мы собираемся обсудить пример точности различных методов классификации в машинном обучении на примере прогнозирования развода.
Цель задачи состоит в том, чтобы подготовить расчет ИИ, который может предсказать, будут ли они разделяться или нет. Набор данных был взят из UCI, который состоит из документа CSV и записи о превышении ожиданий эквивалентного набора данных. Я взял 80% и 20% для подготовки и тестирования отдельно. Всего имеется 54 качества, среди которых нет недостающих качеств. С помощью этих атрибутов мы должны предвидеть разделение. Ожидаемая доходность будет в парной структуре, либо «Да», либо «Нет».
1. В тот момент, когда одно из наших заявлений о сожалении выражает примирительные чувства, когда наши обмены мнениями идут ужасно, проблема не расширяется.
2. Я понимаю, что мы можем не обращать внимания на наши различия, даже если время от времени возникают трудности.
3. В тот момент, когда нам это нужно, мы можем начать наши диалоги с моей второй половинкой с самой ранней отправной точки и исправить ее.
4. В тот момент, когда я соревнуюсь со своей лучшей половиной, в конечном итоге мне удастся связаться с ним.
5. Время, которое я пережил со своей второй половинкой, для нас необычно.
6. У нас нет времени быть сообщниками дома.
7. Мы похожи на двух аутсайдеров, которые находятся в похожей ситуации дома, а не в семье.
8. Я максимально использую наши выходные со своей второй половинкой.
9. Я ценю то, что иду со своей лучшей половиной.
10. Моя лучшая половина и большая часть наших целей нормальны.
11. Я представляю, что через день, когда я оглядываюсь назад, я вижу, что моя вторая половинка и я согласны друг с другом.
12. У нас с моей второй половинкой есть сравнительные качества в плане индивидуальной гибкости.
13. Моя лучшая половина и я испытываем сравнительную стимуляцию.
14. Подавляющее большинство наших целей для отдельных лиц (подростков, компаньонов и т. д.) эквивалентны.
15. Наши фантазии о жизни с моей второй половинкой сравнительны и дружны
16. Мы с моей второй половинкой идеально подходим к вопросу о том, какой должна быть любовь
17. У нас с моей второй половинкой схожие взгляды на то, как быть веселым в жизни
18. У нас с моей второй половинкой есть сравнительные представления о том, каким должен быть брак
19. У нас с моей второй половинкой есть сравнительные представления о том, какой должна быть работа в браке
20. У меня и моей второй половинки есть сравнительные качества в доверительном управлении
21. Я точно знаю, что любит моя вторая половинка.
22. Я знаю, как нужно поступить с моей второй половинкой, когда она стерта с лица земли.
23. Я знаю, что предпочитает моя лучшая половина.
24. Я могу рассказать вам, какой стресс испытывает моя вторая половинка в своей жизни.
25. Я знаю о внутреннем мире моей второй половинки.
26. Я осознаю фундаментальные проблемы моей второй половинки.
27. Я понимаю, каковы нынешние источники стресса у моей второй половинки.
28. Я знаю ожидания и пожелания моей второй половинки.
29. Я довольно хорошо знаю свою лучшую половину.
30. Я знаю компаньонов моей второй половинки и их социальные связи.
31. Я чувствую силу, когда спорю со своей второй половинкой.
32. Говоря о своей половинке, я чаще всего использую артикуляции.
33. Я могу использовать противоположные объяснения характера моей второй половинки во время наших разговоров.
34. Я могу использовать враждебные выражения во время наших диалогов.
35. Я могу оскорбить наши диалоги.
36. Я могу быть унизительным, когда мы ссоримся.
37. Мой спор с моей второй половинкой не тихий.
38. Я презираю метод моей второй половинки поднять этот вопрос.
39. Сражения регулярно происходят внезапно.
40. Мы просто что-то мутим, прежде чем я понимаю, что происходит.
41. В тот момент, когда я разговариваю со своей второй половинкой о чем-то, моя тишина внезапно прерывается.
42. В тот момент, когда я борюсь со своей лучшей половиной, это просто щелкает, и я не издаю ни малейшего писка.
43. По большей части мне не терпится хотя бы чуть-чуть успокоить это состояние.
44. Иногда я считаю, что мне полезно на какое-то время уехать из дома.
45. Я предпочитаю молчать, а не спорить со своей второй половинкой.
46. Независимо от того, участвую ли я непосредственно в споре, мне не хочется агитировать противоположную сторону.
47. В тот момент, когда я спорю со своей лучшей половиной, я молчу, потому что боюсь не быть. готов сдержать свое негодование.
48. Я чувствую прямо в нашем обмене мнениями.
49. Я не имею ничего общего с тем, в чем меня обвиняют.
50. На самом деле я не тот человек, который несет ответственность за то, в чем меня обвиняют.
51. Я не из тех, кто небрежно относится к домашним проблемам.
52. Я бы не остановился ни на секунду, чтобы рассказать ей о недостатках моей второй половинки.
53. Когда я говорю об этом, я помогаю ей вспомнить недостатки моей второй половинки.
54. Я не отказываюсь просветить ее относительно неумелости моей второй половинки.
Предварительная обработка.
Сравнительное исследование моделей.
- Линейная регрессия.
2. Случайная регрессия леса.
3. Модель SVR.
4. Классификатор дерева решений.
5. Логистическая регрессия.
Полученные результаты
1] МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ: 86%
2] СЛУЧАЙНАЯ РЕГРЕССИЯ ЛЕСА: 87%
3] МОДЕЛЬ SVR: 97%
4] ДЕРЕВО РЕШЕНИЙ: 100 %
5] ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ: 97%
Заключение
В свете результатов мы можем сделать вывод, что у одной из моделей подготовки была возможность предвидеть с наиболее примечательной точностью, будет МОДЕЛЬ ДЕРЕВА РЕШЕНИЙ с точностью 100%, однако дерево выбора имеет высокие шансы переобучения, поэтому я Я использую логистическую регрессию, которая также дает очень приличную точность.
использованная литература
http://archive.ics.uci.edu/ml/datasets/Divorce+Predictors+data+set