Читайте также:
|
|
Статистическое распределение выборки.
Пусть изучается некоторая случайная величина . С этой целью проводится независимых опытов, в результате проведения которых в распоряжении исследователя появятся лишь данные выборки генеральной совокупности (среди значений могут быть и одинаковые). Опытные значения случайной величины можно рассматривать и как значения разных независимых случайных величин с тем же распределением, что и , и, следовательно, с теми же числовыми характеристиками, которые имеет . Значения в этом случае называются реализациями случайных величин .
Если наблюдаемые значения расположить в порядке их возрастания (выполнить ранжирование), то получим вариационный ряд , где ‑ число наблюдаемых значений выборки, равных , , (объем выборки). При этом числа называют вариантами, ‑ частотами (или весами), ‑ относительными частотами (или частостями, или долями). Статистическим распределением выборки называют перечень вариант в порядке возрастания и соответствующих им частот (или относительных частот), который записывают в виде таблицы.
Статистическое распределение выборки является оценкой неизвестного распределения. При больших значениях статистическое распределение мало отличается от истинного распределения.
Пример 1. В результате тестирования группа абитуриентов набрала баллы: 5;3;0;1;4;2;5;4;1;5. Записать полученную выборку в виде: 1) вариационного ряда; 2) статистического ряда; 3) чему равен объем выборки?
Решение. 1) Выполним ранжирование статистических данных: 0;1;1;2;3;4;4;5;5;5. Получили вариационный ряд. 2) Подсчитаем частоту и частость вариантов: , , , , , и составляем таблицу:
0,1 | 0,2 | 0,1 | 0,1 | 0,2 | 0,3 |
(объем выборки)
.
В случае, когда число значений признака (случайной величины ) велико или признак является непрерывным, составляют интервальный статистический ряд. В первую строку таблицы интервального статистического ряда записывают частичных промежутков: , , , , которые берут одинаковыми по длине. При слишком большом, как и при слишком малом, числе интервалов, трудно уловить характерные черты варьирования наблюдений. Для определения оптимального числа интервалов на практике пользуются формулой Стерджеса , а длина частичного интервала , где ‑ это разность между наибольшей и наименьшей вариантой. За начало первого интервала рекомендуется брать , . Формирование интервалов заканчивают, как только конец очередного интервала больше максимального наблюдения. Во второй строке интервального статистического ряда записывают число наблюдений (), попавших в каждый интервал ( называют интервальной частотой), или записывают ‑ относительные интервальные частоты. Статистический интервальный ряд представляется в виде следующей таблицы:
Интервалы | ||||
Частоты | ||||
Частости |
(При вычислении интервальных частостей округление результатов следует проводить таким образом, чтобы ).
Одним из способов обработки вариационного ряда является построение эмпирической функции распределения. Обозначим через ‑ число наблюдений, при которых значения вариант оказываются меньше , а ‑ общее число наблюдений (объем выборки). Тогда отношение является относительной частотой попадания выборочных значений левее точки , или относительной частотой события . Эмпирической функцией распределения выборки называется функция , которая для каждого значения определяет относительную частоту события .
Пример 2. Построить эмпирическую функцию распределения и ее график по выборке:
Решение. , ‑ число наблюдений, при которых значения вариант оказываются меньше , а ‑ объем выборки. Объем выборки равен 1+2+1+6=10.
, если (наблюдений меньше 0 нет). , если (здесь ). , если (здесь ) и т.д.
Отметим, что при увеличении числа наблюдений относительная частота события приближается к вероятности этого события. Эмпирическая функция распределения является оценкой теоретической функции распределения случайной величины .
Пользуясь данными интервального статистического ряда, можно построить также эмпирическую функцию распределения, приняв в качестве «основных» точек границы интервалов: , , , , , .
Пример 3. В результате серии из 200 измерений получены величины линейных отклонений. После группировки данных выборка представлена статистическим рядом
0,035 | 0,055 | 0,075 | 0,120 | 0,245 | 0,205 | 0,130 | 0,085 | 0,035 | 0,015 |
Построить эмпирическую функцию распределения .
Решение. Находим значения функции в «основных» точках:
-20 | -15 | -10 | -5 | ||||||||
0,035 | 0,09 | 0,165 | 0,285 | 0,530 | 0,735 | 0,865 | 0,95 | 0,985 |
При графическом изображении данной функции соединяют последовательно «основные» точки отрезками прямой (полученную кривую называют кумулятой).
Дата добавления: 2015-01-12; просмотров: 81 | Поможем написать вашу работу | Нарушение авторских прав |