Название: Зависимость потребления бензина от количества автомобилей
Вид работы: курсовая работа
Рубрика: Математика
Размер файла: 178.06 Kb
Скачать файл: referat.me-215642.docx
Краткое описание работы: Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.
Зависимость потребления бензина от количества автомобилей
Кафедра высшей математики
Курсовая работа
по теории вероятностей и математической статистике
на тему:
« Зависимость потребления бензина от количества автомобилей »
Дубна, 2003
Оглавление
ВВЕДЕНИЕ
ПОСТАНОВКА ЗАДАЧИ
ДИАГРАММА РАССЕИВАНИЯ
ПОСТРОЕНИЕ ПРЯМОЙ Y=AX+B, НАИМЕНЕЕ ОТКЛОНЯЮЩЕЙСЯ ОТ ТОЧЕК (XI;YI)В СРЕДНЕМ КВАДРАТИЧНОМ
ПОСТРОЕНИЕ КРИВОЙ Y=PX2+QX+R, НАИМЕНЕЕ ОТКЛОНЯЮЩЕЙСЯ ОТ ТОЧЕК (XI;YI) В СРЕДНЕМ КВАДРАТИЧНОМ
АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ И ВЫВОД О ЗАВИСИМОСТИ XI И YI
ВЫВОД
СПИСОК ЛИТЕРАТУРЫ
Введение
В данной работе исследуется зависимость потребления бензина в городе от количества автомобилей с помощью методов математической статистики.
Бензин – смесь легких углеводородов с t кип 30-205 °C; прозрачная жидкость, плотность 0,70-0,78 г/см3. Получают главным образом перегонкой или крекингом нефти. Топливо для карбюраторных авто- и авиадвигателей; экстрагент и растворитель для жиров, смол, каучуков.
Автомобиль – транспортная безрельсовая машина главным образом на колесном ходу, приводимая в движение собственным двигателем (внутреннего сгорания, электрическим или паровым). Различают автомобили пассажирские (легковые и автобусы), грузовые, специальные (пожарные, санитарные и др.) и гоночные. Скорость легковых автомобилей до 300 км/ч, гоночных до 1020 км/ч (1993), грузоподъемность грузовых автомобилей до 180 т.
Обычно в любой области науки при изучении двух величин проводятся эксперименты, и задача состоит в том, чтобы на основании экспериментальных точек выявить функциональную зависимость.
Если мы рассматриваем слабо формализованные системы, которые трудно поддаются однозначным и точным описаниям, связь между величинами X и Y изначально корреляционная. Это связано, что Y зависит не только от X, но и от других параметров.
В этом случае, задача состоит в том, чтобы приближённо свести корреляционную связь к функциональной с помощью подбора такой функции, которая максимально возможным способом была бы близка к экспериментальным точкам. Такая функция называется функцией регрессии.
Обычно вид самой функции угадывается, но она зависит от некоторых параметров. Задача статистического и корреляционного анализа состоит в нахождении этих параметров. Для этого и используется метод наименьших квадратов.
Постановка задачи
Даны выборки
– количество автомобилей,
– потребление бензина.
Задача состоит в изучении характера зависимости
1. Изобразить точки ()
на плоскости (на миллиметровой бумаге и в виде точечного графика на компьютере)
2. Методом наименьших квадратов определить числа такие, что прямая
наименее уклоняется от точек (
)
в среднем квадратичном.
3. Методом наименьших квадратов определить числа такие, что парабола
наименее уклоняется от точек (
)
в среднем квадратичном.
4. Сравнить между собой результаты пунктов 2. и 3.
5. С помощью сравнения статистик
где объем выборки, ответить на вопросы:
1) Подтвердилась ли гипотеза о том, что зависимость между и
близка к линейной ?
2) Подтвердилась ли гипотеза о том, что зависимость между и
близка к квадратичной?
3) Какая из двух кривых - прямая или парабола - меньше отклоняется от точек выборки () ?
Диаграмма рассеивания
Даны выборки и
, которые можно интерпретировать следующим образом:
— потребление бензина,
— количество автомобилей. Задача состоит в изучении характера зависимости между
и
. Исходные выборки представлены в таблице:
X | Y | X | Y | X | Y | X | Y |
8,64558 | 116,76 | 22,2483 | 112,8 | 35,3723 | 113,328 | 48,6586 | 125,396 |
9,30954 | 115,72 | 22,38 | 114,03 | 35,8685 | 119,397 | 49,2468 | 126,783 |
9,54538 | 109,996 | 22,743 | 114,952 | 36,0494 | 124,624 | 49,0515 | 125,652 |
9,91695 | 126,634 | 23,0127 | 117,027 | 36,5302 | 118,734 | 49,7645 | 119,88 |
10,3459 | 112,28 | 23,9216 | 110,664 | 36,7256 | 126,531 | 50,6983 | 129,604 |
11,1794 | 115,564 | 24,7213 | 120,474 | 37,2568 | 125,601 | 50,4538 | 125,877 |
12,0403 | 116,048 | 25,2151 | 120,749 | 38,6184 | 121,974 | 51,7368 | 124,935 |
12,4383 | 114,524 | 25,5633 | 125,365 | 38,669 | 123,196 | 52,3859 | 121,572 |
12,8887 | 114,716 | 26,5224 | 117,494 | 39,2617 | 119,925 | 52,932 | 127,416 |
13,3673 | 107,328 | 26,654 | 112,982 | 40,1783 | 122,293 | 53,1557 | 123,507 |
13,5643 | 114,422 | 26,7975 | 112,34 | 40,239 | 120,465 | 54,0261 | 128,29 |
14,4435 | 118,925 | 27,6272 | 127,172 | 41,1804 | 122,419 | 54,4972 | 136,727 |
14,4909 | 123,297 | 28,2653 | 121,229 | 40,8874 | 127,014 | 54,3892 | 125,732 |
15,3408 | 119,606 | 28,6799 | 119,246 | 42,0704 | 133,402 | 55,475 | 124,107 |
15,5866 | 116,443 | 28,9424 | 113,728 | 42,7372 | 136,142 | 55,7691 | 128,79 |
16,9966 | 119,384 | 29,8652 | 124,189 | 42,8423 | 123,36 | 55,912 | 139,417 |
17,4323 | 116,428 | 30,2303 | 131,775 | 43,6994 | 128,363 | 56,6281 | 127,151 |
17,2341 | 123,058 | 30,6092 | 113,164 | 44,4041 | 118,225 | 57,6097 | 130,697 |
17,7988 | 116,349 | 31,6162 | 122,517 | 45,0372 | 126,604 | 57,3441 | 142,839 |
18,5831 | 116,665 | 32,1788 | 117,256 | 45,1258 | 127,831 | 58,699 | 134,079 |
19,4722 | 118,844 | 32,7243 | 114,794 | 45,4427 | 122,39 | 59,0407 | 130,316 |
19,8208 | 123,205 | 32,7933 | 130,624 | 46,3461 | 129,182 | 59,3109 | 129,148 |
20,6594 | 109,789 | 33,1236 | 133,529 | 46,5863 | 127,344 | 59,8175 | 135,398 |
20,8651 | 118,634 | 34,0453 | 123,582 | 47,3429 | 124,694 | 60,3217 | 131,061 |
21,0348 | 110,347 | 34,9061 | 135,169 | 47,7225 | 117,103 | 61,2562 | 126,388 |
Изобразим эти точки в виде точечного графика с соответствующими координатами (,
); для этого надо найти размах выборки по X
и Y
и выбрать соответствующий масштаб. Сначала находим
и
, затем размах выборки по X
, которая вычисляется по формуле
и в результате равна 52,61062. Аналогично
и
, а размах выборки поY
получим равный 35,511. Глядя на размах выборок по X
и по Y
, выбираем масштаб диаграммы рассеивания и строим её.
рис.1. Диаграмма рассеивания
По формуле где
можно найти коэффициент корреляции:
Он не равен нулю, следовательно, зависимость между X и Y существует.
Построение прямой y=ax+b, наименее отклоняющейся от точек (Xi ;Yi )в среднем квадратичном
Для построения прямой y = ax + b
, наименее отклоняющейся от точек в среднем квадратичном, необходимо методом наименьших квадратов определить числа a, b такие, что функция двух переменных
принимает минимальное значение. Данная функция имеет вид:
.
Зная, что необходимым условием минимума функции является равенство нулю ее первых частных производных, имеем следующую систему для нахождения значений :
,
Данная система может быть представлена в виде:
,
где
В результате получим что:
Докажем теперь, что в точке функция
имеет минимум. Достаточным условием существования экстремума функции двух переменных является следующее неравенство:
.
Для доказательства введем следующие обозначения:
Составим дискриминант . Тогда, если
, то функция имеет в точке экстремум, а именно минимум при А>0 (или С>0). Из системы видно, что эти условия выполняются:
=
, С=200>0.
То есть точка действительно является точкой минимума.
Следовательно, функция при данных значениях
имеет следующий график:
рис.2. График уравнения линейной регрессии
Построение кривой y=px2 +qx+r, наименее отклоняющейся от точек (Xi ;Yi ) в среднем квадратичном
Для построения кривой , наименее отклоняющейся от точек
в среднем квадратичном, необходимо методом наименьших квадратов определить числа
,
и
такие, что функция трех переменных
принимает минимальное значение. Данная функция имеет вид:
Аналогично нахождению значений для прямой
составляем систему трех линейных уравнений, которая является необходимым условием минимума функции:
Данная система является системой линейных однородных уравнений. Решая эту систему методом Крамера и зная, что:
составляем определители, состоящие из коэффициентов при и столбца свободных членов.
Значения находим делением соответствующих определителей.
=
=
=
Докажем теперь, что в точке
функция
имеет минимум. Достаточным условием существования минимума функции трех переменных является следующее неравенство:
d.
Получаем следующее уравнение:
Воспользуемся критерием Сильвестра, т.е. найдем миноры 1-ого, 2-ого и 3-ого порядков и докажем, что они положительные.
=
=
Найдем миноры первого, второго и третьего порядков для этого определителя:
Так как все миноры положительны, то по критерию Сильвестра d, и функция
имеет минимум в точке
.
Таким образом, парабола имеет следующий график:
рис.3. График уравнения параболической регрессии
Анализ полученных результатов и вывод о зависимости Xi и Yi
рис.4. Сравнение линейной и параболической регрессий
Для сравнения полученных результатов построения кривых и
определим значения статистик:
Поскольку и
, можно говорить о том, что зависимость между
и
близка и к линейной, и к квадратичной. При этом парабола
меньше отклоняется от точек
и
, чем прямая
Вывод
Зависимость потребления бензина от количества автомобилей близка к линейной и к квадратичной. Однако видно, что разница между значениями статистик небольшая. Следовательно, с практической точки зрения удобнее приближать точки выборки
и
к прямой
.Выявление зависимости между потреблением бензина и количеством автомобилей пригодится для понимания ситуации, которая складывается у нас на дорогах и влияет на природу, поскольку потребление бензина всегда сопровождается вредными выбросами.
Список литературы
1. Гмурман В.Е. Теория вероятностей и математическая статистика. — М.: Высшая школа 1998.
2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике — М.: Высшая школа 1998.
3. Ивашев-Мусатов О. С. Теория вероятностей и математическая статистика — М.: Наука 1979.
4. Мазный Г.Л., Прогулова Т.Б. Методическое пособие к курсовому проектированию по ВМ и информатике. — Дубна: Кафедра ВМ и САУ, 1996.
Похожие работы
-
Модель парной регрессии
Содержание ТЕМА 1. Выборка и генеральная совокупность Задача 1 ТЕМА 2. Модель парной регрессии Задача 12 ТЕМА 3. Модель множественной регрессии Задача 13
-
Корреляционно-регрессионный анализ
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ НОВГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Имени ЯРОСЛАВА МУДРОГО ИНСТИТУТ ЭКОНОМИКИ И УПРАВЛЕНИЯ Кафедра: Статистики и экономико-математических методов
-
Задача по Экономико-математическое моделирование
ФЕДЕРАЛЬНОЕ Вариант № . Нефтеперерабатывающий завод производит в месяц 1500000 л алкилата, 1200000 л крекинг - бензина и 1300000 л изопентола. В результате смешения этих компонентов в пропорциях 1:1:1 и 3:1:2 получается бензин сорта А и Б соответственно. Стоимость 1000 л бензина сорта А и Б соответственно равна 90 и 120 усл. ед..
-
Прогноз цен на бензин в России в 2011 году
Прогнозирование цен на бензин в России в 2010 году. 1. Предпрогнозная ориентация Россия относится к числу стран, которые, являясь крупными производителями и экспортерами нефти, одновременно сохраняют у себя высокие цены на бензин. Автомобильный рынок страны стремительно расширяется, соответственно, и спрос на топливо пропорционально возрастает.
-
Эконометрика 8
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
-
Математический анализ. Регрессия
y=a уравнение регрессии. Таблица 1 1.35 1.09 6.46 3.15 5.80 7.20 8.07 8.12 8.97 10.66 Оценка значимости коэффициентов регрессии. Выдвигается и проверяется гипотеза о том что истинное значение коэффициента регрессии=0.
-
Контрольная работа по Эконометрике
Построим поле корреляции (на отдельном листе) и сформулируем гипотезу о форме связи, предполагая, что генеральное уравнение регрессии – линейное: Найдем оценки b0 и b1 параметров модели парной линейной регрессии
-
Зависимость цены от качества
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ КАФЕДРА МАТЕМАТИКИ И ИНФОРМАТИКИ ЛАБОРАТОРНАЯ РАБОТА по эконометрике Вариант № 1 Омск, 2010 г.
-
Уравнения регрессии. Коэффициент эластичности, корреляции, детерминации и F-критерий Фишера
Автономная некоммерческая организация Высшего профессионального образования «ПЕРМСКИЙ ИНСТИТУТ ЭКОНОМИКИ И ФИНАНСОВ» Факультет Экономический
-
Контрольная работа по Экономико-математическому моделированию
По территориям Волго-Вятского, Центрально-Черноземного и Поволжского районов известны данные за ноябрь 1998 г. Район Потребительские расходы в расчете на душу населения тыс. руб. у