This repository has been archived by the owner on Oct 12, 2019. It is now read-only.
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathwinequality.txt
87 lines (69 loc) · 3.77 KB
/
winequality.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
Запрос на цитату:
Этот набор данных доступен для исследований. Подробности описаны в [Cortez et al., 2009].
Пожалуйста, включите эту цитату, если вы планируете использовать эту базу данных:
П. Кортез, А. Сердейра, Ф. Алмейда, Т. Матос и Дж. Рейс.
Моделирование предпочтений вин путем интеллектуального анализа данных по физико-химическим свойствам.
В системах поддержки принятия решений, Elsevier, 47 (4): 547-553. ISSN: 0167-9236.
Доступно по адресу: [@Elsevier] http://dx.doi.org/10.1016/j.dss.2009.05.016
[Предпечатная подготовка (pdf)] http://www3.dsi.uminho.pt/pcortez/winequality09.pdf
[bib] http://www3.dsi.uminho.pt/pcortez/dss09.bib
1. Название: Качество вина
2. Источники
Автор: Пауло Кортес (Univ. Minho), Антонио Сердейра, Фернандо Алмейда, Тельмо Матос и Хосе Рейс (CVRVV) @ 2009
3. Прошлое использование:
П. Кортез, А. Сердейра, Ф. Алмейда, Т. Матос и Дж. Рейс.
Моделирование предпочтений вин путем интеллектуального анализа данных по физико-химическим свойствам.
В системах поддержки принятия решений, Elsevier, 47 (4): 547-553. ISSN: 0167-9236.
В приведенной выше ссылке были созданы два набора данных с использованием образцов красного и белого вина.
Входы включают объективные тесты (например, значения PH), а выход основан на сенсорных данных
(медиана не менее 3 оценок, сделанных экспертами по винам). Каждый эксперт оценил качество вина
между 0 (очень плохо) и 10 (очень отлично). Несколько методов интеллектуального анализа данных были применены к модели
эти наборы данных под регрессионным подходом. Модель машинной машины поддержки достигла
лучшие результаты. Были вычислены несколько показателей: MAD, матрица путаницы для фиксированного допусков ошибок (T),
и т. д. Также мы строим относительные значения входных переменных (как измерено чувствительностью
анализ).
4. Соответствующая информация:
Два набора данных связаны с красными и белыми вариантами португальского вина «Vinho Verde».
Для получения дополнительной информации см. Http://www.vinhoverde.pt/en/ или ссылку [Cortez et al., 2009].
Из-за вопросов конфиденциальности и логистики только физико-химические (входные) и сенсорные (выходные) переменные
(например, нет данных о типах винограда, винной марке, цене продажи вина и т. д.).
Эти наборы данных можно рассматривать как задачи классификации или регрессии.
Классы упорядочены и не сбалансированы (например, есть больше обычных вин, чем
отличные или плохие). Алгоритмы обнаружения выбросов могут быть использованы для обнаружения нескольких отличных
или плохие вина. Кроме того, мы не уверены, соответствуют ли все входные переменные. Так
было бы интересно проверить методы выбора объектов.
5. Количество экземпляров: красное вино - 1599; белое вино - 4898.
6. Количество атрибутов: 11 + атрибут вывода
Примечание. Некоторые атрибуты могут быть скоррелированы, поэтому имеет смысл применить
функция выбор.
7. Информация об атрибутах:
Для получения дополнительной информации см. [Cortez et al., 2009].
Input variables (based on physicochemical tests):
1 - fixed acidity
2 - volatile acidity
3 - citric acid
4 - residual sugar
5 - chlorides
6 - free sulfur dioxide
7 - total sulfur dioxide
8 - density
9 - pH
10 - sulphates
11 - alcohol
Output variable (based on sensory data):
12 - quality (score between 0 and 10)
Входные переменные (на основе физико-химических испытаний):
1 - фиксированная кислотность
2 - летучая кислотность
3 - лимонная кислота
4 - остаточный сахар
5 - хлориды
6 - свободный диоксид серы
7 - общий диоксид серы
8 - плотность
9 - pH
10 - сульфаты
11 - алкоголь
Выходная переменная (на основе сенсорных данных):
12 - качество (оценка от 0 до 10)
8. Отсутствующие значения атрибута: Нет