Читайте также:
|
|
Вариационные ряды. Большинство изучаемых в статистических исследованиях величин принимают неодинаковые значения у различных элементов изучаемой статистической совокупности, т.е. варьируют. С целью изучения варьирования и установления закономерностей, которым подчиняется изучаемое явление, проводят наблюдение и получают значения признака у каждого элемента совокупности.
Различные значения признака, наблюдающиеся у элементов совокупности, называются вариантами, а число, показывающее, сколько раз встречается каждый вариант называется частотой варианта.
Неупорядоченность информации, содержащейся в приведенных статистических данных, затрудняет их использование для дальнейшего анализа. Поэтому данные наблюдений подвергают первичной обработке, состоящей в группировке совокупности по вариантам.
Расположим наблюдавшиеся значения вариант признака в порядке их возрастания. Эта операция называется ранжированием данных наблюдений.
Дискретным вариационным рядом или рядом распределения частот называется ранжированный ряд вариант с соответствующими им частотами.
Каждому варианту можно поставить в соответствие не частоту, а отношение соответствующей частоты к объему совокупности. Эти числа называются относительными частотами или частостями вариант и выражают долю (удельный вес) в совокупности элементов с тем или иным значением признака. В этом случае получим дискретный вариационный ряд относительных частот.
Наряду с понятием частоты (относительной частоты) используется понятие накопленной или кумулятивной частоты (относительной частоты). Накопленная частота показывает, сколько наблюдалось элементов со значением признака, меньшим или равным некоторому числу. Накопленная относительная частота определяется как отношение накопленной частоты к общему числу наблюдений и показывает долю тех элементов совокупности, у которых рассматриваемый признак меньше или равен определенного значения.
Для построения рядов распределения накопленных частот и накопленных относительных частот необходимо вычислить их для каждого варианта путем последовательного суммирования частот и относительных частот с первого до данного варианта.
Результаты построения дискретных вариационных рядов можно представить в виде следующей таблицы:
№ | Вариант | Частота | Относительная частота | Накопленная частота | Накопленная относительная частота |
x 1 | f 1 | w 1 | f 1 | w 1 | |
x 2 | f 2 | w 2 | f 1+ f 2 | w 1+ w 2 | |
… | … | … | … | … | … |
s | xs | fs | ws | f 1+ f 2+…+ fs | w 1+ w 2+…+ ws |
… | … | … | … | … | … |
k | xk | fk | wk |
Заметим, что если для изучения вариации признака X сформирована выборка объема n, то число k различных вариант может быть меньше или равно n. Кроме того, для частот и относительных частот выполняются равенства:
= n, =1.
Если количество вариантов k слишком велико или близко к объему выборки, то дискретный вариационный ряд оказывается малоудобным для проведения анализа вариации признака. В этом случае целесообразно составить вариационный ряд по интервалам значений изучаемого признака, называемый интервальным вариационным рядом.
Для построения интервального вариационного ряда весь диапазон изменения признака, от наименьшего xmin до наибольшего xmax, разбивают на определенное число равных или неравных интервалов. Затем подсчитывают число элементов совокупности, значения признака которых попадает в тот или иной интервал, т.е. вычисляют частоты попаданий значений признака в интервал. Число интервалов, как правило, выбирают от 7 до 16, так, чтобы в каждый интервал попадало не менее 5 % всех наблюдений
Если число интервалов трудно определить заранее, то для расчета величины равных интервалов при достаточном объеме совокупности может быть использована формула Стерджесса:
.
Если h оказывается дробным числом, то за величину интервала следует взять либо ближайшее целое число, либо ближайшую "хорошую" дробь.
За начало первого интервала рекомендуется принимать величину, равную (xmin – h /2). Построение интервалов продолжают до тех пор, пока начало следующего по порядку интервала не будет равным или большим xmax. Так как некоторые значения признака могут совпадать с границами интервалов, то в каждый интервал включаются варианты большие, чем нижняя граница интервала и меньшие или равные верхней границе интервала. Другими словами, граничное значение следует относить к интервалу, у которого данное значение является верхней границей.
Как и для дискретного распределения, интервальный вариационный ряд можно преобразовать в интервальные ряды относительных частот, накопленных частот и накопленных относительных частот. Кроме того, интервальный ряд может быть условно перестроен в дискретный путем замены каждого интервала его серединой. Итак, в общем виде интервальный вариационный ряд можно представить в виде таблицы:
№ | Нижняя граница | Верхняя граница | Середина интервала | Частота | Относительная частота | Накопленная частота | Накопленная относительная частота |
a 1 | b 1 | x 1=(a 1+ b 1)/2 | f 1 | w 1 | f 1 | w 1 | |
a 2 | b 2 | x 2=(a 2+ b 2)/2 | f 2 | w 2 | f 1+ f 2 | w 1+ w 2 | |
… | … | … | … | … | … | … | … |
s | as | bs | xs =(as + bs)/2 | fs | ws | f 1+ f 2+…+ fs | w 1+ w 2+…+ ws |
… | … | … | … | … | … | … | … |
k | ak | bk | xk =(ak + bk)/2 | fk | wk |
Графическое изображение вариационных рядов. Геометрическая иллюстрация статистических данных придает им наглядность, а в ряде случаев позволяет подвергнуть их анализу в наиболее простой и доступной форме, выявив закономерности варьирования изучаемого признака. Наиболее широко используются следующие виды графического изображения вариационных рядов: полигон (многоугольник), гистограмма и кумулятивная кривая.
Полигон распределения частот или относительных частот используется для изображения соответствующего дискретного вариационного ряда. Для его построения в прямоугольной системе координат по оси абсцисс откладывают значения вариант xs , а по оси ординат – их частоты fs или относительные частоты ws . Полученные точки соединяют ломаной линией (рис. 8.1).
Для изображения интервального вариационного ряда применяются гистограммы. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладывают интервалы варьирования признака, и на них, как на основаниях, строят прямоугольники с высотами, равными частотам или относительным частотам соответствующего интервала. В результате получается ступенчатая фигура, состоящая из примыкающих друг к другу прямоугольников, которая и называется гистограммой (рис.8.2).
Из гистограммы можно получить полигон того же распределения, если середины верхних основания прямоугольников соединить отрезками прямой (рис. 8.3).
Вариационный ряд можно изобразить графически и с помощью кумулятивной кривой – кривой накопленных частот или накопленных относительных частот. Если ряд дискретный, то в прямоугольной системе координат строят точки с координатами (xs, ) или (xs, ), где xs – варианты, , – соответствующие им накопленные частоты или накопленные относительные частоты. Если ряд интервальный, то строят точки, абсциссы которых – правые границы интервалов, а ординаты – соответствующие им накопленные частоты или накопленные относительные частоты. Нижней границе первого интервала соответствует точка, ордината которой равна нулю (т.к. накопленные частоты равны нулю к началу первого интервала). Соединив полученные точки отрезками прямой, получают кумулятивную кривую.
Дата добавления: 2015-01-05; просмотров: 54 | Поможем написать вашу работу | Нарушение авторских прав |