Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Числовые характеристики статистических распределений

Читайте также:
  1. I. Клинико - эпидемиологические характеристики геморрагических лихорадок и геморрагической лихорадки с почечным синдромом.
  2. I. Сущность общественного мнения, его характеристики и проблемы изучения.
  3. II. Практическое задание №1. Ряды распределений и их характеристики
  4. IV. Энергетические характеристики атомов.
  5. Quot; Русская правда" как источник для характеристики социально-правовой структуры древнерусского общества.
  6. V.ХАРАКТЕРИСТИКИ САМОАКТУАЛИЗИРУЮЩИХСЯ ЛЮДЕЙ
  7. Акции: определение, характеристики, удостоверяемые права
  8. Анализ результатов статистических компьютерных расчетов
  9. Анализ статистических данных по объему продукции (работ, услуг), номенклатуре, ассортименту.
  10. Анализ эффективности функционирования предприятий и организаций, экономической конъюнктуры. Системы статистических показателей финансовой деятельности предприятий и организаций

Статистическое распределение содержит полную информацию о вариации изучаемого признака. Но построение вариационного ряда оказывается недостаточным, когда возникает задача сравнения вариации в двух и более статистических совокупностей. Определенные выводы можно сделать, изучая графическое изображение вариационного ряда. С целью более полного и точного описания совокупности необходимо дополнить графический анализ небольшим количеством сводных характеристик распределения, вычисленных с использованием вариантов и их частот. Эти характеристики должны отражать присущие изучаемой совокупности закономерности и тенденции.

Для описания статистических распределений обычно используются три вида характеристик: 1) средние или характеристики центральной тенденции; 2) характеристики изменчивости (вариации) признака; 3) характеристики, отражающие дополнительные особенности распределений, в частности их форму.

 

Средние характеристики. Средняя характеризует типичный для совокупности размер признака, т.е. центральную тенденцию в распределении. Практическое использование такой характеристики целесообразно в том случае, когда отдельные варианты ряда распределения концентрируются вблизи некоторого значения. Если же совокупность неоднородна, результаты наблюдений значительно отличаются друг от друга и не обнаруживают общей тенденции, то использование средней становится формальным.

Средние величины имеют ту же размерность, что и изучаемый признак. Существуют различные формы средних величин: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая и т.д.

Средняя арифметическая. Наиболее распространенным видом средней является средняя арифметическая, которая вычисляется по формуле

, (9.1)

где хі элемент совокупности, n – ее объем.

Если по наблюдениям составлен вариационный ряд, то следует использовать следующую формулу:

(9.2)

где хі – варианты признака в дискретном или середины интервалов в интервальном рядах, fi – соответствующие частоты, k – количество вариантов или интервалов, n – объем совокупности. Величины fi ­­­­­ в этой формуле часто называют весами, а саму характеристику­­­­­, вычисленную по формуле (9.2) – взвешенной.

Если по данным наблюдений построен дискретный вариационный ряд, то формулы (9.1) и (9.2) дают одинаковые значения средней арифметической. Если же построен интервальный ряд, то средние арифметические, вычисленные по формулам (9.1) и (9.2), как правило, не совпадают, т.к. в формуле (9.2) значения признака внутри каждого интервала принимается равными серединам интервалов. Однако ошибка, возникающая в результате такой замены, будет мала, если наблюдения распределены равномерно внутри каждого интервала и не скапливаются к одноименным границам интервалов (т.е. либо все к нижним границам, либо все к верхним границам).

Средняя арифметическая применяется в том случае, когда сумма наблюдений должна остаться неизменной, если каждое из них заменить средней арифметической.

Наряду со средними в качестве характеристик центра распределения применяются так называемые структурные средние – мода и медиана.

Мода. Модой ­­­­­ называется значение признака, которому соответствует наибольшая частота, т.е. которое наблюдалось наибольшее число раз.

Для дискретного ряда мода находится непосредственно из распределения частот.

Если составлен интервальный вариационный ряд, то мода вычисляется по следующей приближенной формуле:

,

где x 0 – начало модального интервала, т. е. интервала, имеющего максимальную частоту, h – длина модального интервала, fi – частота модального интервала, fi – 1 и fi + 1 частоты соответственно предшествующего и последующего за модальным интервалов.

Распределение, имеющее одну моду называется унимодальным; две моды – бимодальным; три и более мод – мультимодальным.

Медиана. Медианой называется значение признака, приходящееся на середину ранжированного ряда наблюдений.

Если проведено нечетное число наблюдений, т.е. n =2 k +1, k Î Z, и результаты наблюдений размещены по возрастанию, то медиана равна:

Ме = xk +1­­­­­.

Если проведено четное число наблюдений, т.е. n =2 k, k Î Z, то на середину ранжированного ряда приходятся значения­­­­­ xk ­­­­­и xk +1­­­­­­­­­. В этом случае в качестве медианы принимают среднее арифметическое двух серединных элементов, т.е.

Ме = (xk + xk +1)/2­­­­­.

Если составлен интервальный вариационный ряд, то медиана вычисляется по следующей формуле:

,

где x 0 – начало мeдианного интервала, т. е. интервала, в котором эмпирическая функция распределения ­­­­­ принимает значение 0.5, h – длина медианного интервала, n – объем выборки, Ті –1 сумма частот интервалов, предшествующих медианному; fi – частота медианного интервала.

Следует отметить, что средняя арифметическая и медиана могут не являться элементами распределения, в то время как модой обязательно является одно или несколько значений изучаемого признака.

 

Характеристики вариации. Рассмотренные выше характеристики центра статистической совокупности тем более характерны для данного распределения, чем ближе группируются наблюдения вокруг средней арифметической, т.е. чем менее они рассеяны. Поэтому средние характеристики должны быть дополнены измерением вариации признака относительно средней, т.е. характеристиками изменчивости наблюдавшихся значений признака.

Простейшим измерителем вариации является размах варьирования ­­­­­ R, т.е. разность между наибольшим и наименьшим значением признака: R = xmaxxmin ­­­­­­­­­­­­­­­­­­­­­. Размах варьирования дает лишь приближенное представление о вариации признака и, кроме того, на крайние значения ряда распределения могут влиять различные случайные факторы, что делает их весьма ненадежными.

Выше отмечалось, что наибольший интерес представляет группировка значений признака около средней арифметической. Отклонения вариантов от средней арифметической определяют разности (xi ­­­­­­­­­­), а веса вариантов – как часто имеют место эти разности в данном распределении. Однако сумма произведений отклонений ­­­­­­­­­­ на их веса не может являться мерой рассеяния признака, т.к. по доказанной выше теореме эта сумма всегда равна нулю. Для устранения влияния знака отклонений переходят либо к абсолютным величинам отклонений, либо к квадратам отклонений, получая при этом различные характеристики вариации признака.

Среднее линейное отклонение. Средним линейным отклонением вариационного ряда называется средняя арифметическая абсолютных величин отклонений вариантов от их средней арифметической:

,

где хі – варианты признака в дискретном или середины интервалов в интервальном рядах, fi – соответствующие частоты, k – количество вариантов или интервалов, n – объем совокупности.

Дисперсия выборки. Дисперсией s2 называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:

; (9.3)

где хі элемент совокупности, n – ее объем, – средняя арифметическая.

Если по наблюдениям построен вариационный ряд, то применяют формулу:

, (9.4)

где хі – варианты признака в дискретном или середины интервалов в интервальном рядах, fi – соответствующие частоты, k – количество вариантов или интервалов, n – объем совокупности.

Стандартное отклонение. При вычислении дисперсии суммируются квадраты отклонений вариантов, в силу чего дисперсия измеряется в квадратах тех единиц, в которых измеряется изучаемый признак. Для того, чтобы характеристика вариации выражалась в тех же единицах, что и значения признака, используют корень квадратный из дисперсии.

Средним квадратическим отклонением (стандартным отклонением) называется арифметическое значение корня квадратного из дисперсии:

. (9.5)

Коэффициент вариации. ­­­­ Для сравнительной оценки вариации в распределениях с различными значениями средней используется также коэффициент вариации­­­­, равный выраженному в процентах отношению среднего квадратического отклонения к средней арифметической:

.

 

Коэффициент вариации позволяет определить, насколько хорошо средняя арифметическая представляет все элементы статистической совокупности. Если V< 33%­­­­­­­­­­, то статистическая совокупность является однородной и средняя будет отражать типичный размер изучаемого признака. Если коэффициент вариации V >33%­­­­­­­­­­, то, как правило, можно сделать вывод о неоднородности статистической совокупности и средняя арифметическая не является типичным значением для всех элементов. Однако коэффициент вариации теряет смысл при =0­­­­­­­ и становится малонадежным при близких к нулю значениях средней.

 

Характеристики формы. Если полигон вариационного ряда скошен в ту или иную стороны от средней арифметической, то такой ряд называют асимметричным. В качестве меры асимметрии вариационного ряда используется коэффициент асимметрии.

Коэффициентом асимметрии вариационного ряда называется отношение центрального момента третьего порядка к кубу среднего квадратического отклонения:

 

Если коэффициент асимметрии As <0­­­­­­­­­­, то в этом случае имеет место левосторонняя асимметрия: в вариационном ряду преобладают варианты меньшие, чем средняя. Если же в вариационном ряду преобладают значения большие, чем средняя, то имеет место правосторонняя асимметрия и As >0­­­­­­­­­­­­­­­­­­­­. Для симметричного распределения варианты, равноудаленные от средней , имеют одинаковые частоты, и поэтому n 3=0, следовательно, As =0­­­­­­­­­­




Дата добавления: 2015-01-05; просмотров: 170 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.009 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав