Математическая статистикА icon

Математическая статистикА




НазваМатематическая статистикА
Сторінка3/5
Дата07.09.2012
Розмір0.54 Mb.
ТипДокументи
1   2   3   4   5
^

Обработка результатов наблюдений по методу наименьших квадратов



Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число опытов ограничено. Только при очень большом числе опытов эти случайности сглаживаются, и явление обнаруживает в полной мере присущие ему закономерности.

Случаен ступенчатый вид статистической функции распределения непрерывной случайной величины; случайна форма гистограммы, ограниченной тоже ступенчатой линией. Поэтому на практике часто приходится решать вопрос о том, как подобрать для данного статистического распределения аналитическую формулу, выражающую лишь существенные черты статистического материала. Такая задача называется задачей выравнивания статистических распределений.

Обычно выравниванию подвергаются гистограммы. Задача сводится к тому, чтобы заменить гистограмму плавной кривой, имеющей достаточно простое аналитическое выражение, и в дальнейшем пользоваться ею в качестве плотности распределения (рис.4).




Рис. 4


Для нахождения оценок параметров функциональной зависимости применяется метод наименьших квадратов. При этом метод наименьших квадратов не решает вопроса вида аналитической функции, а дает возможность при заданном типе аналитической функции y=f(x) подобрать наиболее вероятные значения для параметров этой функции. Например, если несколько полученных в опыте точек на плоскости, ход расположены приблизительно прямой (рис.5),



Рис. 5


то естественно возникает идея заменить эту зависимость линейной функцией y=kx+a, для которой требуется определить лишь параметры а и k. Если зависимость явно нелинейная (рис.6), в качестве аппроксимирующей кривой выбирают многочлен (в частном случае, параболу).



Рис. 6


При этом необходимо иметь в виду, что если производится выравнивание гистограмм, то соответствующая функция должна обладать основными свойствами плотности:



Сущность метода наименьших квадратов заключается в следующем. Пусть зависимость у от х выражается формулой



где - подлежащие определению параметры.


В результате n независимых опытов были получены следующие данные, оформленные в виде статистической таблицы:


Номер опыта

1

2

...

k

...

n

xi

x1

x2

...

xk

...

xn

yi

y1

y2

...

yk

...

yn


Согласно методу наименьших квадратов, наивероятнейшие значения параметров дают минимум функции



Если имеет непрерывные частные производные по всем неизвестным параметрам то необходимое условие минимума функции S представляет систему уравнений с m+1 неизвестными:



Если в качестве аппроксимирующей функции взят многочлен, т.е.



то оценка его коэффициентов определяются из системы m+1 линейных уравнений:



Если значения хi известны без ошибок, а значения yi независимы и равноточны, то оценка дисперсии величины yi определяется формулой



где - значение, вычисленное в предположении, что коэффициенты поли....... заменены их полученными оценками.

При гауссовом законе распределения величин yi изложенный метод дает минимальную ошибку.

Пример 1. Найти оценки параметров линейной функции



Решение. Для определения коэффициентов и методом наименьших квадратов составляем систему



Решая систему получаем




где



Пример 2. С помощью прибора измеряется какой-то параметр . Случайная величина Х - ошибка измерения параметра . С целью исследования точности прибора произведено n=500 измерений этой ошибки. Результаты измерений сведены в группированный статистический ряд:


Разряды

-4-3

-3-2

-2-1

-10

01

12

23

34

Частоты

0,012

0,05

0,144

0,266

0,240

0,176

0,092

0,20

Число попаданий в i-й разряд

6

25

72

133

120

88

46

10


Определить аналитический вид плотности распределения f(x).

Решение. Вначале построим гистограмму распределения случайной величины Х.



Как видно из гистограммы, подходящей для аппроксимации является гауссова функция:



Таким образом, необходимо определить лишь два параметра, математическое ожидание и дисперсию . Поскольку мы не располагаем всеми наблюденными n=500 значениями случайной величины, оценим и по группированному статистическому ряду. Делается это так: выбирается в качестве "представителя" i-го разряда его середина и этому значению хi приписывается частота .

Тогда

=-3,5*0,012-2,5*0,05-1,5*0,144-0,5*0,266+0,5*0,240+1,5*0,176+2,5*

*0,092+3,5*0,02=0,162.



Среднее квадратическое отклонение



Таким образом оценку для плотности распределения случайной величины Х можно записать в виде

.

Для решения задач обоснованного прогноза, т.е. для определения пределов, в которых с наперед заданной надежностью будет содержаться интересующая нас величина, если другие связанные с ней величины получат определенные значения, необходимо определить их функциональную зависимость. Функция представляющая собой статистическую зависимость одной случайной величины от другой называется регрессией.

Для гауссового распределения системы случайных величин (X, Y) связь между ними выражается уравнениями линейной регрессии:



где и - коэффициенты линейной регрессии y на х и х на y, соответственно.

Коэффициенты линейной регрессии выражаются через характеристики системы (X,Y) следующим образом:



или, учитывая, что коэффициент корреляции имеем:



Перемножив левые и правые части этих равенств, после извлечения корня получаем



т. е. коэффициент корреляции есть среднее геометрическое коэффициентов линейной регрессии. Он характеризует насколько близко связь между случайными величинами Х и Y к линейной зависимости.

Выборочные уравнения прямых регрессий имеют вид:



В тех случаях, когда линейное приближение является явно недостаточным, можно рассматривать в качестве приближенных уравнений регрессий более сложные функции, неизвестные параметры которой определяются методом наименьших квадратов.


Пример. Определить выборочное уравнение линейной регрессии Х по Y, если по результатам опытов получены следующие оценки:



Решение. Выборочный коэффициент корреляции



Тогда x-410=0,1*(64,3/62)*(y-170), или x=0,104y+392,32.


Выводы

1. Одной из часто встречающихся задач, встающих перед аналитиками различных специальностей, является задача нахождения зависимости между некоторыми наборами данных эксперимента. В общей постановке задача описания эмпирической зависимости с помощью параметрической регрессии предполагает, что задается функция, определенная с точностью до нескольких параметров, которые подбирают таким образом, чтобы получающаяся функция с максимальной точностью соответствовала данным эксперимента. Наиболее просто определяются параметры для случая линейной регрессии.


2. При выравнивании (сглаживании) эмпирических зависимостей наиболее часто исходят из того, что наилучшим приближением в данном классе функций является то, для которого сумма квадратов отклонений обращается в минимум. Вопрос о том, в каком классе функций следует искать наилучшее приближение, решается уже не математически, а исходя из характера эмпирической кривой. Аналогично обстоит дело и с задачей выравнивания статистических распределений. Принципиальный вид выравнивающей плавной кривой выбирается заранее, исходя из условий возникновения случайной величины Х или просто из соображений, связанных с внешним видом гистограммы.


3. Одним из основных методов определения статистических оценок параметров, входящих в выравнивающую функцию, является метод наименьших квадратов.

1   2   3   4   5

Схожі:

Математическая статистикА iconКонтрольные вопросы по дисциплине " теория вероятностей и математическая статистика"
Консультации по курсу “Теория вероятностей и математическая статистика” проводятся: каждый вторник, среда с 15. 00-16. 30
Математическая статистикА iconКонспект лекций по курсу "Теория вероятностей и математическая статистика"
Теория вероятностей это математическая наука, изучающая закономерности в случайных событиях
Математическая статистикА iconТесты по курсу «Теория вероятностей и математическая статистика»
Случайным событием называется всякий факт, который обязательно происходит в результате опыта
Математическая статистикА iconТесты по курсу «Теория вероятностей и математическая статистика»
Случайным событием называется всякий факт, который обязательно происходит в результате опыта
Математическая статистикА iconОсновы математической статистики
Математическая статистика это наука, занимающаяся методами обработки результатов опытов или наблюдений над случайными явлениями
Математическая статистикА iconДержавного закладу «Луганський національний університет імені Тараса Шевченка»
Цикли фундаментальних дисциплін; цикли дисциплін за спеціальністю: економіка; економетрія економічна статистика, фінансова статистика,...
Математическая статистикА iconТеория вероятностей
Колосов А. И., Печенежский Ю. Е., Станишевский С. А. Теория вероятностей и математическая статистика. Учебное пособие. – Харьков:...
Математическая статистикА iconВопросы к зачету по курсу «Теория вероятностей и математическая статистика»
Граничные теоремы в схеме Бернулли. Пример использования локальной теоремы Муавра-Лапласа и теоремы Пуассона
Математическая статистикА iconКонтрольные вопросы по дисциплине " теория вероятностей и математическая статистика"
Законы распределения дискретной случайной величины (ряд распределения, многоугольник распределения, функция распределения)
Математическая статистикА iconКонтрольные вопросы по курсу "теория вероятностей и математическая статистика" теория вероятностей
Что такое элементарное событие, поле событий? Какие бывают операции и отношение между событиями?
Додайте кнопку на своєму сайті:
Документи


База даних захищена авторським правом ©zavantag.com 2000-2013
При копіюванні матеріалу обов'язкове зазначення активного посилання відкритою для індексації.
звернутися до адміністрації
Документи