Коэффициент корреляции

Задача №1 Построение уравнения регрессии

Имеются следующие данные разных стран об индексе розничных цен на продукты питания (х) и об индексе промышленного производства (у).

 Индекс розничных цен на продукты питания (х)Индекс промышленного производства (у)
1 100 70
2 105 79
3 108 85
4 113 84
5 118 85
6 118 85
7 110 96
8 115 99
9 119 100
10 118 98
11 120 99
12 124 102
13 129 105
14 132 112

Требуется:

1. Для характеристики зависимости у от х рассчитать параметры следующих функций:

А) линейной;

Б) степенной;

В) равносторонней гиперболы.

2. Для каждой модели рассчитать показатели: тесноты связи и среднюю ошибку аппроксимации.

3. Оценить статистическую значимость параметров регрессии и корреляции.

4. Выполнить прогноз значения индекса промышленного производства у при прогнозном значении индекса розничных цен на продукты питания х=138.

Решение


Задача №3. Расчёт параметров регрессии и корреляции с помощью Excel

По территориям региона приводятся данные за 200Х г.

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х Среднедневная заработная плата, руб., у
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Задание:

1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.

2. Рассчитайте параметры уравнения линейной регрессии

Линейная функция.

3. Оцените тесноту связи с помощью показателей корреляции и детерминации.

4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.

5. Оцените с помощью средней ошибки аппроксимации качество уравнений.

6. Оцените с помощью F-критерия Фишера статистическую надёжность результатов регрессионного моделирования.

7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости Уровень значимости 0,05.

8. Оцените полученные результаты, выводы оформите в аналитической записке.

Решение


Задача №4. Построение регрессионной модели с использованием фиктивной переменной

Исследовать зависимость между результатами зимней (Х) и летней (У) сессий.
В таблице приведена средняя оценка, полученная по итогам сессии, а также указана принадлежность студента к группе А или Б.

№ п/п х у Группа
1 3,7 4,8 Б
2 3,5 3,5 Б
3 4,3 5 Б
4 3 4 Б
5 4,6 4,2 Б
6 4,6 4,1 Б
7 3,8 4,8 А
8 3,6 3,5 Б
9 3,3 4,4 Б
10 3,9 3 Б
11 4,7 3,7 Б
12 4,6 4,4 Б
13 4,6 3,8 Б
14 3,3 3,1 Б
15 4,3 3,6 Б
16 3,1 4,8 А
17 3,2 3 А
18 4,2 4,8 А
19 3,3 3,4 Б
20 3,5 4,2 А

1. Построить линейную регрессионную модель У по Х.
2. Проверить значимость коэффициентов уравнения и самого уравнения регрессии.
3. Построить регрессионную модель У по Х с использованием фиктивной переменной «группа».
4. Проверить значимость коэффициентов уравнения и самого уравнения регрессии.
5. Вычислить коэффициенты детерминации для обычной модели и модели с фиктивной переменной.

Решение


Задача №43. Расчёт описательных статистик

Компания Zagat публикует рейтинги ресторанов, расположенных в разных городах США.

Рестораны Нью-Йорка

В таблице содержатся оценки качества пищи, оформления блюд, уровня обслуживания и стоимость обеда для одного человека в 200 ресторанах Нью-Йорк Сити (NYC) и Лонг-Айленда (LI).

  Город Пища Оформление Обслуживание Суммарный рейтинг Цена
1 NYC 19 21 18 58 50
2 NYC 18 17 17 52 38
3 NYC 19 16 19 54 43
4 NYC 23 18 21 62 56
5 NYC 23 20 21 64 51
6 NYC 23 18 20 61 36
7 NYC 20 17 16 53 25
8 NYC 20 15 17 52 33
9 NYC 19 18 18 55 41
10 NYC 21 19 19 59 44
11 NYC 20 17 16 53 34
12 NYC 21 23 21 65 39
13 NYC 24 20 22 66 49
14 NYC 20 17 20 57 37
15 NYC 17 18 14 49 40
16 NYC 21 17 20 58 50
17 NYC 21 19 21 61 50
18 NYC 20 16 19 55 35
19 NYC 17 11 13 41 22
20 NYC 21 16 20 57 45
21 NYC 23 20 23 66 44
22 NYC 17 19 16 52 38
23 NYC 22 14 15 51 14
24 NYC 19 19 18 56 44
25 NYC 21 19 20 60 51
26 NYC 19 14 16 49 27
27 NYC 19 17 19 55 44
28 NYC 21 13 21 55 39
29 NYC 24 21 21 66 50
30 NYC 19 16 19 54 35
31 NYC 17 15 15 47 31
32 NYC 19 16 19 54 34
33 NYC 22 19 21 62 48
34 NYC 22 18 20 60 48
35 NYC 14 15 15 44 30
36 NYC 22 22 21 65 42
37 NYC 20 15 18 53 26
38 NYC 18 14 17 49 35
39 NYC 18 20 16 54 32
40 NYC 24 18 21 63 63
41 NYC 21 17 18 56 36
42 NYC 18 17 17 52 38
43 NYC 20 19 19 58 53
44 NYC 21 10 17 48 23
45 NYC 19 14 19 52 39
46 NYC 18 17 17 52 45
47 NYC 20 16 17 53 37
48 NYC 21 12 14 47 31
49 NYC 19 17 19 55 39
50 NYC 21 20 20 61 53
51 NYC 21 18 21 60 37
52 NYC 17 14 17 48 37
53 NYC 17 17 18 52 29
54 NYC 23 19 18 60 38
55 NYC 23 22 21 66 37
56 NYC 21 18 19 58 38
57 NYC 21 19 23 63 39
58 NYC 21 18 18 57 29
59 NYC 22 18 20 60 36
60 NYC 22 20 20 62 38
61 NYC 23 20 22 65 44
62 NYC 23 18 20 61 27
63 NYC 21 14 19 54 24
64 NYC 17 17 17 51 34
65 NYC 23 23 22 68 44
66 NYC 15 17 15 47 23
67 NYC 19 14 17 50 30
68 NYC 20 19 18 57 32
69 NYC 20 15 17 52 25
70 NYC 20 12 18 50 29
71 NYC 23 19 20 62 43
72 NYC 19 21 19 59 31
73 NYC 15 13 15 43 26
74 NYC 20 17 22 59 34
75 NYC 21 17 18 56 23
76 NYC 23 20 21 64 41
77 NYC 27 16 19 62 32
78 NYC 17 17 16 50 30
79 NYC 22 11 17 50 28
80 NYC 20 16 19 55 33
81 NYC 20 12 16 48 26
82 NYC 25 25 24 74 51
83 NYC 17 17 18 52 26
84 NYC 25 22 23 70 48
85 NYC 19 18 19 56 39
86 NYC 27 20 24 71 55
87 NYC 21 11 17 49 24
88 NYC 19 18 19 56 38
89 NYC 20 21 20 61 31
90 NYC 23 19 21 63 30
91 NYC 24 27 23 74 51
92 NYC 18 18 20 56 30
93 NYC 15 16 14 45 27
94 NYC 16 20 17 53 38
95 NYC 18 16 17 51 26
96 NYC 20 12 18 50 28
97 NYC 21 24 21 66 33
98 NYC 21 18 19 58 38
99 NYC 23 15 20 58 32
100 NYC 19 14 16 49 25
101 LI 22 24 21 61 53
102 LI 24 23 23 58 44
103 LI 23 20 23 58 47
104 LI 26 21 24 65 59
105 LI 30 27 28 71 58
106 LI 31 26 28 69 44
107 LI 30 27 26 63 35
108 LI 24 19 21 56 37
109 LI 24 23 23 60 46
110 LI 23 21 21 61 46
111 LI 25 22 21 58 39
112 LI 30 32 30 74 48
113 LI 29 25 27 71 54
114 LI 23 20 23 60 40
115 LI 23 24 20 55 46
116 LI 22 18 21 59 51
117 LI 26 24 26 66 55
118 LI 29 25 28 64 44
119 LI 26 20 22 50 31
120 LI 30 25 29 66 54
121 LI 31 28 31 74 52
122 LI 21 23 20 56 42
123 LI 30 22 23 59 22
124 LI 26 26 25 63 51
125 LI 24 22 23 63 54
126 LI 25 20 22 55 33
127 LI 28 26 28 64 53
128 LI 29 21 29 63 47
129 LI 31 28 28 73 57
130 LI 20 17 20 55 36
131 LI 20 18 18 50 34
132 LI 25 22 25 60 40
133 LI 25 22 24 65 51
134 LI 30 26 28 68 56
135 LI 22 23 23 52 38
136 LI 29 29 28 72 49
137 LI 28 23 26 61 34
138 LI 22 18 21 53 39
139 LI 28 30 26 64 42
140 LI 27 21 24 66 66
141 LI 29 25 26 64 44
142 LI 19 18 18 53 39
143 LI 30 29 29 68 63
144 LI 26 15 22 53 28
145 LI 22 17 22 55 42
146 LI 22 21 21 56 49
147 LI 29 25 26 62 46
148 LI 26 17 19 52 36
149 LI 28 26 28 64 48
150 LI 26 25 25 66 58
151 LI 28 25 28 67 44
152 LI 25 22 25 56 45
153 LI 26 26 27 61 38
154 LI 25 21 20 62 40
155 LI 28 27 26 71 42
156 LI 30 27 28 67 47
157 LI 26 24 28 68 44
158 LI 30 27 27 66 38
159 LI 26 22 24 64 40
160 LI 30 28 28 70 46
161 LI 31 28 30 73 52
162 LI 31 26 28 69 35
163 LI 25 18 23 58 28
164 LI 20 20 20 54 37
165 LI 25 25 24 70 46
166 LI 22 24 22 54 30
167 LI 23 18 21 54 34
168 LI 22 21 20 59 34
169 LI 30 25 27 62 35
170 LI 22 14 20 52 31
171 LI 32 28 29 71 52
172 LI 20 22 20 60 32
173 LI 19 17 19 47 30
174 LI 29 26 31 68 43
175 LI 30 26 27 65 32
176 LI 24 21 22 65 42
177 LI 34 23 26 69 39
178 LI 24 24 23 57 37
179 LI 32 21 27 60 38
180 LI 22 18 21 57 35
181 LI 23 15 19 51 29
182 LI 29 29 28 78 55
183 LI 25 25 26 60 34
184 LI 28 25 26 73 51
185 LI 27 26 27 64 47
186 LI 29 22 26 73 57
187 LI 22 12 18 50 25
188 LI 22 21 22 59 41
189 LI 24 25 24 65 35
190 LI 27 23 25 67 34
191 LI 25 28 24 75 52
192 LI 19 19 21 57 31
193 LI 18 19 17 48 30
194 LI 18 22 19 55 40
195 LI 26 24 25 59 34
196 LI 20 12 18 50 28
197 LI 25 28 25 70 37
198 LI 29 26 27 66 46
199 LI 23 15 20 58 32
200 LI 28 23 25 58 34

1. Вычислите среднее арифметическое и медиану каждого показателя для двух групп ресторанов.

2. Вычислите первый и третий квартили каждого показателя для двух групп ресторанов.

3. Определите размах, дисперсию, стандартное отклонение и коэффициент вариации каждого показателя для двух групп ресторанов.

4. Являются ли эти данные асимметричными? Если да, определите вид асимметрии.

5. Постройте блочные диаграммы выборок каждого показателя для двух групп ресторанов.

6. Определите коэффициенты корреляции. Постройте матрицы коэффициентов парной корреляции для показателей двух групп ресторанов. Сделайте выводы.

Решение


Задача №47. Построение модели линейной регрессии

Имеются данные о количестве проданного товара и его цене:

Количество (тыс. / день) Цена (руб. / за ед.)
8 5,0
10 3,5
24 2,0
16 2,5

Изобразить данные на графике, построить модель линейной регрессии, определить тесноту связи. Объяснить значение коэффициентов.

 Решение


Задача №54. Расчёт коэффициента корреляции

Имеются данные о рейтинге авиакомпании и оценке ее безопасности. Вычислите линейный коэффициент корреляции.

№ п/п Рейтинг авиакомпании, y Оценка безопасности, х
1 3,9 0,7
2 3,9 0,68
3 3,8 0,59
4 3,7 0,25
5 3,6 0,63
6 3,3 0,5
7 3,3 0,46
8 3,3 0,24
9 3,2 0,23
10 3,2 0,6
11 3,2 0,46
12 3,2 0,5
13 3,2 0,51
14 3,1 0,3
15 3,1 0,55
16 3,1 0,6
17 3,1 0,76
18 3,1 0,46
19 3,1 0,3
20 3 0,35
21 3 0,4
22 3 0,35
23 3 0,3
24 2,9 0,3
25 2,9 0,57
26 2,8 0,33
27 2,7 0,3
28 2,6 0,3
29 2,3 0,4
30 2,1 0,25

Решение