Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Закон распределения дискретной случайной величины. Примеры.

Читайте также:
  1. b) соблюдение частными военными и охранными компаниями и их сотрудниками национальных законов стран происхождения, транзита и осуществления деятельности;
  2. B.Подзаконы
  3. E) законы, указы, имеющие силу закона, указы, распоряжения.
  4. E) законы, указы, имеющий силу закона, указы, распоряжения.
  5. E) экономические законы и развитие экономических систем
  6. E. закономерности психического развития, протекающего в неблагоприятных условиях, патогенная сила которых превышает компенсаторные возможности индивида
  7. Gl] Тема 9.Законность и правопорядок. Мировой правопорядок
  8. I. Понятие законности. Соотношение законности, права и власти.
  9. I. Понятие законности. Соотношение законности, права и власти.
  10. I. Поняття зворотної дії в часі закону про кримінальну відповідальність.

Законом распределения дискретной случайной величины называют перечень всех возможных ее значений и их вероятностей. Обычно закон распределения задается в виде таблицы, одна графа которой содержит все возможные значения случайной величины, а вторая - соответствующие им вероятности: X: x1, x2,..., xn; P: p1, p2,..., pn. Представление закона распределения возможно также в виде формулы, посредством параметров или в виде графика.

12. Биномиальное распределение. Распределение Пуассона. Биномиальное распределение, распределение вероятностей числа появлений некоторого события при повторных независимых испытаниях. Если при каждом испытании вероятность появления события равна р, причём 0 £ p £ 1, то число m появлений этого события при n независимых испытаниях есть случайная величина, принимающая значения m = 1, 2,.., n с вероятностями Распределение Пуассона моделирует случайную величину, представляющую собой число событий, произошедших за фиксированное время, при условии, что данные события происходят с некоторой фиксированной средней интенсивностью и независимо друг от друга.

13. Математическое ожидание дискретной случайной величины и его эмпирический смысл. Свойства матем. Ожидания:…….Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности: M(X) = x1 p1+ x2 p2+...+ xn pn. Реально на основе данных выборки мы не можем вычислить M(X). Однако эту характеристику можно оценить. В качестве оценки можно использовать среднее арифметическое, то есть M(X) ≈`X. Чем больше объём выборки (число наблюдений), тем точнее эта оценка. Математическое ожидание обладает следующими свойствами: 1. Математическое ожидание постоянной величины равно самой постоянной: M(C) = C. 2. Постоянный множитель можно выносить за знак математического ожидания: M(CX) = CM(X). 3. Математическое ожидание суммы нескольких случайных величин равно сумме математических ожиданий слагаемых: M(X+Y+Z) = M(X)+M(Y)+M(Z). 4. Математическое ожидание произведения нескольких взаимно независимых случайных величин равно произведению их математических ожиданий: M(XЧYЧZ) = M(X)ЧM(Y)ЧM(Z). Все эти свойства имеют большое практическое значение.

 

14.Мат.ожидание числа появления события А в одном и нескольких независимых испытаниях. Теорема. Математическое ожидание числа появлений события А в n независимых испытаниях равно произведению числа испытаний на вероятность появления события испытаний: M(X)=np. Доказательство. Будем рассматривать в качестве случайной величины Х число независимых испытаний. Очевидно, общее число Х появлений события А в этих испытаниях складывается из чисел появлений события в отдельных испытаниях. Поэтому если Х1-число появлений события в первом испытании, Х2-во втором,…,Хn-в n-м, то общее число появлений события Х=Х12+…+Хn. По третьему свойству мат. ожидания, М(Х)=М(Х1)+М(Х2)+…+М(Хn). Каждое из слагаемых правой части равенства есть мат. ожидание числа появлений события в одном испытании: М(Х1)-в первом, М(Х2)-во втором и т. д. Т. к. мат. ожидание числа появлений события в одном испытании равно вероят. события, то М(Х1)= М(Х2)= М(Хn)= p. Подставляя в правую часть равенства вместо каждого слагаемого p, получим M(X)=np.

 

 

15.Дисперсия дискретной случайной величины формула для вычисления дисперсии. Свойства дисперсии: D(C), D(CX), D(X+Y), D(X-Y). Среднее квадратичное отклонение.Дисперсией случайной величины X называется математическое ожидание квадрата отклонений случайной величины от ее математического ожидания. Дисперсия обозначается как D(Х).Для дискретных случайных величин т. е. дисперсия дискретной случайной величины равна сумме квадратов отклонений отдельных значений случайной величины от ее математического ожидания, умноженных на вероятности этих значений.Для непрерывных случайных величин Положительный корень квадратный из дисперсии называется средним квадратическим (стандартным) отклонением случайной величины.

Эта величина обозначается, как .Дисперсия и стандартное отклонение характеризуют изменчивость (вариативность) случайной величины. Чем сильнее случайная величина отклоняется от своего математического ожидания, тем больше величины D(X) и . Последнюю () использовать удобнее, так как его размерность совпадает с размерностью случайной величины (например, если Х - кол-во долларов, выигранное в лотерею, то - измеряется в $.

Свойства дисперсии 1. Дисперсия постоянной величины С равна нулю: D(C)=0.

2. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат: D(CX)= C2D(X).3. Дисперсия суммы 2-х независимых случайных величин равна суме дисперсий этих величин: D(X+Y)= D(X)+D(Y),если X и Y – независимые с.в.4. Дисперсия разности двух независимых случайных величин равна сумме их дисперсий: D(X-Y)= D(X)+D(Y)

 

 

16.Дисперсия появления события А в одном и нескольких независимых испытаниях.

Теорема. Дисперсия числа появлений события А в n независимых испытаниях, в каждом вероятность p появления события постоянна, равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании: D(X)=npq. Доказательство. Рассмотрим случ. величину Х-число появлений события А в n независимых испытаниях. Очевидно, общее число появлений события в этих испытаниях равно сумме появлений события в отдельных испытаниях: Х=Х12+…+Хn, где Х1-число наступлений события в первом испытании, Х2-во втором,…,Хn-в n-м. Величины Х12,…Хn взаимно независимы, т. к. исход каждого испытания не зависит от исходов остальных, поэтому мы вправе воспользоваться следствием1: D (Х)= D (Х1)+ D (Х2)+…+ D (Хn). Вычислим дисперсию Х1 по формуле D(Х1)=М(Х12)-Ї М(Х12. Величина Х1-число появлений события А в первом испытании, потому М(Х1)= p. Найдем мат. ожидание величины Х12, которая может принимать только два значения, а именно: 12 с вероят. p и 02 с вероят. q. Подставляя найденные результаты в соотношение имеем D(Х1)= p- p2= p(1-p)= pq. Очевидно, дисперсия каждой из остальных случ. величин также равна pq. Заменив каждое слагаемое правой части через pq, окончательно получим D(X)=npq.

 

17.Мат.ожидание, дисперсия и среднее квадратичное отклонение среднего арифметического одинаково распределенных взаимно независимых случайных величин.

Обозначим через среднее арифметическое рассматриваемых случайных величин-Х. Установим связь между числовыми характеристиками среднего арифметического Х и соответствующими числовыми характеристиками отдельно взятой случайной величины. Математическое ожидание среднего арифметического одинаково распределенных взаимно независимых случайных величин равно математическому ожиданию а каждой из величин: М(Х)=а. Дисперсия среднего арифметического n одинаково распределенных взаимно независимых случайных величин в n раз меньше дисперсии D каждой из величин: D(Х)= D/ n. Среднее квадратическое отклонение среднего арифметического одинаково распределенных взаимно независимых случайных величин в раз среднего квадратического отклонения каждой из величин: .

 

18. Закон больших чисел Практика изучения случайных явлений показывает, что хотя результаты отдельных наблюдений, даже проведенных в одинаковых условиях, могут сильно отличаться, в то же время средние результаты для достаточно большого числа наблюдений устойчивы и слабо зависят от результатов отдельных наблюдений. Теоретическим обоснованием этого замечательного свойства случайных явлений является закон больших чисел. Названием "закон больших чисел" объединена группа теорем, устанавливающих устойчивость средних результатов большого количества случайных явлений и объясняющих причину этой устойчивости.

Простейшая форма закона больших чисел, и исторически первая теорема этого раздела - теорема Бернулли, утверждающая, что если вероятность события одинакова во всех испытаниях, то с увеличением числа испытаний частота события стремится к вероятности события и перестает быть случайной. Теорема Пуассона утверждает, что частота события в серии независимых испытаний стремится к среднему арифметическому его вероятностей и перестает быть случайной.

Предельные теоремы теории вероятностей, теоремы Муавра-Лапласа объясняют природу устойчивости частоты появлений события. Природа эта состоит в том, что предельным распределением числа появлений события при неограниченном возрастании числа испытаний (если вероятность события во всех испытаниях одинакова) является нормальное распределение.

Центральная предельная теорема объясняет широкое распространение нормального закона распределения. Теорема утверждает, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин с конечными дисперсиями, закон распределения этой случайной величины оказывается практически нормальным законом.Теорема, приведенная ниже под названием " Закон больших чисел " утверждает, что при определенных, достаточно общих, условиях, с увеличением числа случайных величин их среднее арифметическое стремится к среднему арифметическому математических ожиданий и перестает быть случайным.

Закон больших чисел. Если случайные величины  1,  2, …,  n, … попарно независимы и ,то для любого  > 0

19. интегральная функция распределения и ее свойства. Пример:интегральная функция распределения дискретной случайной величины. Вероятность попадания случайной величины в заданный промежуток. Интегральной функцией распределения называют функцию F(x), определяющую для каждого значения x случайной величины X вероятность того, что величина X примет значение, меньшее x, то есть F(x) = P(X < x).Распределение вероятностей дискретной случайной величины может быть задано перечнем всех ее возможных значений и их вероятностей. Такой способ задания неприменим для непрерывных случайных величин. Общим способом задания распределений любых типов случайных величин является интегральная функция распределения. Пусть x - действительное число. Вероятность события, состоящего в том, что случайная величина X примет значение, меньшее x, то есть вероятность события X < x обозначим через F(x). Интегральной функцией распределения называют функцию F(x), определяющую для каждого значения x вероятность того, что случайная величина X примет значение, меньшее x, то есть F(x) = P(X < x). Интегральная функция распределения имеет следующие свойства. 1. Значения интегральной функции принадлежат отрезку (0,1): 0 і F(x) і 1. Следовательно, график интегральной функции распределения расположен в полосе, ограниченной прямыми y = 0, y = 1. 2. F(x) - неубывающая функция, то есть F(x2) і F(x1), если x2 > x1. Следовательно, при возрастании x в интервале (a, b), в котором заключены все возможные значения случайной величины, график интегральной функции распределения поднимается вверх. 3. Если возможные значения случайной величины принадлежат интервалу (a, b), то F(x) = 0 при a і x, F(x) = 1 при x і b. То есть при a і x ординаты графика интегральной функции распределения равны нулю; при x і b ординаты графика равны единице. Для дискретной случайной величины график интегральной функции распределения имеет ступенчатый вид.

20. Непрерывная случайная величина. Непрерывной случайной величиной (НСВ) называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Множество возможных значений непрерывной случайной величины бесконечно и несчетно. Дифференциальная функция распределения (плотность веро­ятности) f(x) — это первая производная от функции распреде­ления. График функции f(x) называют кривой распределения. Вероятность попадания Х в заданный интервал (a, b) равна Геометрически эта вероятность равна площади криволиней­ной трапеции, ограниченной осью абсцисс, прямыми х = а и х == b и кривой распределения (рис. 1, а). Площадь под всей кривой равна единице.Одним из наиболее часто встречающихся распределений является нормальное распределение. Оно играет большую роль в теории вероятностей и занимает среди других распределений особое положение. Нормальный закон распределения является предельным законом, к которому приближаются другие законы распределения при часто встречающихся аналогичных условиях. Если предоставляется возможность рассматривать некоторую случайную величину как сумму достаточно большого числа других случайных величин, то данная случайная величина обычно подчиняется нормальному закону распределения. Суммируемые случайные величины могут подчиняться каким угодно распределениям, но при этом должно выполняться условие их независимости (или слабой зависимости). При соблюдении некоторых не очень жестких условий указанная сумма случайных величин подчиняется приближенно нормальному закону распределения и тем точнее, чем большее количество величин суммируется. Ни одна из суммируемых случайных величин не должна резко отличаться от других, т. е. каждая из них должна играть в общей сумме примерно одинаковую роль и не иметь исключительно большую по сравнению с другими величинами дисперсию. Для примера рассмотрим изготовление некоторой детали на станке-автомате. Размеры изготовленных деталей несколько отличаются от требуемых. Это отклонение размеров от стандарта вызывается различными причинами, которые более или менее независимы друг от друга. К ним могут относиться: неравномерный режим обработки детали; неоднородность обрабатываемого материала; неточность установки заготовки в станке; износ режущего инструмента и деталей станков; упругие деформаций узлов станка; состояние микроклимата в цехе; колебание напряжения в электросети и т. д. Каждая из перечисленных и подобных им причин влияет на отклонение размера изготовляемой детали от стандарта. Таким образом, общее отклонение размера, фиксируемое измерительным прибором, является суммой большего числа отклонений, обусловленных различными причинами. Если ни одна из этих причин не является доминирующей, то суммарное отклонение является случайной величиной, имеющей нормальный закон распределения. Так как нормальному закону подчиняются только непрерывные случайные величины, то это распределение можно задать в виде плотности распределения вероятности. Определение: Непрерывная случайная величина Х имеет нормальное распределение (распределена по нормальному закону), если плотность распределения вероятности f(x) имеет вид

где а и —некоторые постоянные, называемые параметрами нормального распределения. Функция распределения F(x) в рассматриваемом случае принимает вид

Параметр а- есть математическое ожидание НСВХ, имеющей нормальное распределение,  - среднее квадратическое отклонение, тогда дисперсия равна Выясним геометрический смысл параметров распределения а и . Для этого исследуем поведение функции f(x). График функции f(x) называется нормальной кривой.Рассмотрим свойства функции f(x): 1°. Областью определения функции f(x) является вся числовая ось. 2°. Функция f{x) может принимать только положительные значения, т. е. f(x}>0. 3°. Предел функции f(x) при неограниченном возрастании |х| равен нулю, т. е. ось ОХ является горизонтальной асимптотой графика функции 4°. Функция f{x) имеет в точке х = a максимум, равный 5°. График функции f(x) симметричен относительно прямой х = а.6°. Нормальная кривая в точках х = а +  имеет перегиб,

На основании доказанных свойств построим график плотности нормального распределения f(x).

 
 

 

Как видно из рисунка, нормальная кривая имеет колоколообразную форму. Эта форма является отличительной чертой нормального распределения. Иногда нормальную кривую называют кривой Гаусса. При изменении параметра а форма нормальной кривой не изменяется. В этом случае, если математическое ожидание (параметр а) уменьшилось или увеличилось, график нормальной кривой сдвигается влево или вправо.

 
 

При изменении параметра s изменяется форма нормальной кривой. Если этот параметр увеличивается, то максимальное значение функции f(x) убывает, и наоборот. Так как площадь, ограниченная кривой распределения и осью Ох, должна быть постоянной и равной 1, то с увеличением параметра кривая приближается к оси Ох и растягивается вдоль нее, а с уменьшением  кривая стягивается к прямой х=а.

 
 

Использование формул f(x) и F(x) для практических расчетов затруднительно. Но решение задач по этим формулам можно упростить, если от нормального распределения с произвольными параметрами а и перейти к нормальному распределению с параметрами а=0,  = 1. Функция плотности нормального распределения f(x) с параметрами а=0,  =1 называется плотностью стандартной нормальной случайной величины и ее график имеет вид:

Функция плотности и интегральная функция стандартной нормальной СВ будут иметь вид:

Для вычисления вероятности попадания СВ в интервал (a, b) воспользуемся функцией Лапласа: Перейдем к стандартной нормальной случайной величине Тогда

Значения функции Ф(u) необходимо взять из таблицы приложений "Таблица значений функции Ф(х)".

 

 

21. Равномерное распределение прямоугольное распределение, специальный вид распределения вероятностей случайной величины Х, принимающей значения из интервала (аh, a + h); характеризуется плотностью вероятности:

Математическое ожидание: Ех = a, дисперсия Dx = h 2/3, характеристическая функция: С помощью линейного преобразования интервал (а — h, a + h) может быть переведён в любой заданный интервал. Так, величина Y = (Xa + h)/2 h равномерно распределена на интервале (0, 1). Если Y1, Y2,..., Yn равномерно распределены на интервале (0, 1), то закон распределения их суммы, нормированной математическим ожиданием n /2 и дисперсией n /12, при возрастании n быстро приближается к нормальному распределению (даже при n = 3 приближение часто бывает достаточным для практики).

 

22.Нормальное распределение вероятностей Гаусса, дифференциальная функция распределения, вероятностный смысл параметров, нормированное нормальное распределение, интегральная функция распределения, функция Лапласа.

Нормальным называется распределение вероятностей непрерывной случайной величины,которое описывается плотностью. Мы видим,что нормальное распределение определяется двумя параметрами: а и ….Достаточно знать эти парамеры,чтобы задать нормальное распределение.Вероятностный смысл таков: а есть мат ожидание, … -среднее квадратическое отклонение нормального распределения. а) Математическое ожидание нормального распределения равно параметру а.б)Среднее квадратическое отклонение нормального распределения равно параметру σОбщим называют нормальное распределение с произвольными параметрами а и σ (σ>0). Нормированным называют нормальное распределение с параметрами а=0 и σ=1. Плотность нормированного распределенияϕ(х)=

 

23. Нормальная кривая, ее вид при различных значениях параметров.

График плотности нормального распределения называют нормальной кривой (кривой Гаусса).Исследуем функцию у= 1.Очевидно,функция определена на всей оси х;2 При всех значениях х функция принимает положительные значения;3. Предел функции при неограниченном возростании х равен нулю;4.Исследуем функцию на экстремиум.Найдем производную: у =- Видно,что уˈ=0 при х=а,уˈ>0 при х<а,уˈ<0 при х>а.Следовательно,при х=а функция имеет максимум равный 1\( 5. Разность х-а содержится в анлитическом выражении функции в квадрате.6. При х=а+ и х= вторая производная равна нулю,а при переходе через эти точки она меняет знак. Известно,что графики функций f(x) f (x- имеют одинаковую форму; сдвинув график f(x) в положительном направлении оси х на а единиц масштаба при а >0 или в отраправленицательном направлении при а<0,получим график f(x-a)Отсюда следует,что изменение величины параметра а не изменяет формы нормальной кривой,п приводит лишь к ее сдвигу вдоль оси Ох:вправо,если а возрастает, и влево,если а убывает. По-иному обстоит дело,если изменяется параметр . С возростанием максимальная ордината нормальной кривой убываент,а сама кривая становится более пологой,она сжимается к ос Ох; при убывании нормальная кривая становится более «островершинной» и растягивается в положительном направлении оси Оу.

 

24. Если предполагается нормальное распределение признака в генеральной совокупности, то получить ответ на этот вопрос очень просто. Как говорилось ранее, вероятность попадания нормально распределенной случайной величины в заданный интервал можно определить по функции распределения: или с помощью функции плотности вероятностей: P(x1<X<x2)= Итак, вероятность попадания с.в. U-->N(0;1) в заданный интервал: ,где Ф — принятое обозначение для функции нормированного нормального распределения которое имеет следующий вид:

, при этом .Часто представляет интерес вероятность попадания с.в. U-->N(0;1) в симметричный интервал. Тогда Учитывая свойства функции Лапласа, получаем. Интеграл, входящий в выражение, не выражается в элементарных функциях, поэтому для вычисления функции Ф(u) используют вспомогательную функцию — функцию Лапласа (интеграл вероятностей): который табулируется. Функция Лапласа является нечетной, т.е. Ф0(-u)=–Ф0(u). В книгах по теории вероятности приведена либо таблица значений функции Лапласа , либо .Чтобы найти вероятность попадания нормально распределенной случайной величины в заданный интервал с помощью функции Лапласа, сначала с.в. Х нормализуется, а затем используется следующая формула: Преобразуя формулу Лапласа-нечётную (P()=2Ф()), положив . Получим P(|X-a|< t)=2Ф(t) Правило 3-х сигм: если случайная величина распределена нормально,то абсолютная величина ее отклонения от мат ожидания не превосходит утроенного среднего квадратичного отклонения. На практике правило трех сигм применяется так: если распределние изучаемой величины неизвестно,но условие,указанное в приведенном правиле,выполняется,то есть основание предпологать,что изучаемая величина распределена нормально; в противном случае она не распределена нормально.

 

 

25. Понятие о центральной предельной теоремеЦентральная предельная теорема была открыта русским математиком А. М. Ляпуновым. «Если случайная величина Х представляем собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой их которых на всю сумму ничтожно мало, то Х имеет распределение, близкое к нормальному» Пускай Х1, Х2,…,Хn…-последовательность независимых случайных величин, каждая из которых имеет конечные математическое ожидание и дисперсию: M(Xk) =ak. D(Xk)=bk2. Введем обозначения: Обозначим функцию распределения нормированной суммы через . Говорят, что к последовательности Х1, Х2,… применима центральная предельная теорема, если при любом х функция распределения нормированной суммы при n стремится к нормальной функции распределения: В частности, если все случайные велечины Х1, Х2,…одинаково распределены, то к этой последовательности применима центральная предельная теорема, если дисперсии всех величин Хі(і=1,2,…)конечны и отличны от нуля. А. М. Ляпунов доказал, что если для >0 при n отношение Ляпунова стремится к нулю, то к последовательности Х1, Х2,…применима центральная предельная теорема. Сущность условия Ляпунова состоит в требовании, чтобы каждое слагаемое суммы оказывало на сумму ничтожное влияние.

 

26. Асимптотические формулы Лапласа Локальная теорема Муавра-Лапласа. Если npq > 9, то для расчетов используют приближение Муавра-Лапласа , где 0 < p < 1, величина ограничена при n  . Требование ограниченности величины xk означает, что при n  величина k тоже должна расти вместе с величиной n. Точность формулы

растет, как с ростом величин n и k, так и по мере приближения к 0.5 величин p и q. Исследуем точность асимптотической формулы Муавра-Лапласа на следующем примере.ПРИМЕР 2. Точность формулы Муавра-Лапласа. Вычислим вероятность того, что случайная величина, имеющая биномиальное распределение, принимает значение, равное n/ 2. Выполним вычисления для n = 10, 20, 50. Сравним результаты вычислений по формуле Бернулли и по приближенной формуле Муавра-Лапласа. Интегральная теорема Муавра-Лапласа. При n  для схемы Бернулли при любых a и b справедлива формула

Отсюда следует, что вероятность того, что число успехов в n испытаниях Бернулли заключено между k 1 и k 2, можно вычислить по формуле

, где , , - функция Лапласа. Точность этой приближенной формулы растет с ростом n. Если значение npq сравнительно невелико, то лучшее приближение дает формула

,и для вычисления вероятности того, что число успехов в n испытаниях Бернулли заключено между k 1 и k 2, можно использовать формулу

, где , ПРИМЕР 3. Точность интегральных формул Муавра-Лапласа. Вероятность рождения мальчика p = 0.51, а девочки - q = 1 - p = 0.49. Найдем вероятность того, что среди 10 000новорожденных мальчиков будет не менее 4 000 и не более 5000. Вычисления проведем по формуле Бернулли и по приближенным интегральным формулам Муавра-Лапласа.

27. Теорема Пуассона. При большом количестве испытаний вычисления по формуле Бернулли становятся затруднительными. Однако в ряде случаев их можно заменить более простыми асимптотическими формулами. Одна из них основана на теореме Пуассона. Если число испытаний n  и p  0 так, что np  ,  > 0, то при любых k = 0, 1, 2, …. Это означает, что при больших n и малых p вместо вычислений по точной формуле можно воспользоваться приближенной формулой .На практике пуассоновским приближением пользуются при npq= np (1-p)< 9. Исследуем точность асимптотической формулы Пуассона на следующем примере.ПРИМЕР 1. Точность формулы Пуассона. В здании 1000 лампочек. Вероятность выхода из строя одной лампочки в течение года p =0.003. Найдем вероятность того, что в течение одного года выйдет из строя более трех ламп. Выполним вычисления используя формулу Бернулли и по теореме Пуассона. Для вычисления вероятности по формуле Бернулли используем формулу P ( > 3) = 1- P( 3) = 1- F (3), где F (x) - функция распределения для биномиального распределения. Для вычисления вероятности по теореме Пуассона используем формулу P ( > 3) = 1- P( 3) = 1- F (3), где F (x) - функция распределения Пуассона с параметром  = np = 3.Выполним те же вычисления для p = 0.3 и n = 10 ( = np = 3).

 

 

28. Стьюдента распределение с f степенями свободы, распределение отношения Т = X/Y независимых случайных величин Х и Y, где Х подчиняется нормальному распределению с математическим ожиданием EX = 0 и дисперсией DX = 1, а fY 2 имеет «Хи-квадрат» распределение с f степенями свободы. Функция распределения Стьюдента выражается интегралом

.Если X1,..., Xn независимые случайные величины, одинаково нормально распределённые, причём EX i= a и DX i= s 2(i = 1,..., n), то при любых действительных значениях а и s > 0 отношение подчиняется Стьюдента распределение с f = п- 1 степенями свободы (здесь и ). Это свойство было впервые (1908) использовано для решения важной задачи классической теории ошибок У. Госсетом (Англия), писавшим под псевдонимом Стьюдент (Student). Суть этой задачи заключается в проверке гипотезы а = a 0 (a 0 = заданное число, дисперсия s 2 предполагается неизвестной). Гипотезу а = a 0 считают не противоречащей результатам наблюдений X 1,..., X n, если справедливо неравенство , в противном случае гипотеза а = а 0 отвергается (так называемый критерий Стьюдента). Критическое значение t = t n-1(a)представляет собой решение уравнения S n-1(t) = 1 – , a — заданный значимости уровень (0 < a < ). Если проверяемая гипотеза а = а 0 верна, то критерий Стьюдента, соответствующий критическому значению t n–1(a), может её ошибочно отвергнуть с вероятностью а. Стьюдента распределение используется для решения множества др. задач математической статистики (см. Малые выборки, Ошибок теория, Наименьших квадратов метод)Критерий Пирсона

 
   

Нормальный закон распределения характеризуется плотностью вероят­ности вида где M{X}, ____ — соответственно математическое ожидание и диспер­сия случайной величины. согласованности изучаемого распределения с нормальным

Для проверки гипотезы о соответствии, экспериментального закона распределения случайной величины нормальному применяют критерий Пир­сона или, как его иначе называют, критерий X2 (хи-квадрат),так как принятие и отклонение гипотезы основаны на X2 -распределении.

Использование критерия Пирсона основано на сравнении эмпиричес­ких (наблюдаемых) ___ и теоретических (вычисленных в предположении нормального распределения) _____ частот. Обычно ____ и _____ различны.

Возможно, что расхождение случайно (незначимо) и объясняется малым числом наблюдений, способом их группировки Или другими причина­ми. Возможно, что расхождение частот неслучайно (значимо) и объясня­ется тем, что теоретические частоты вычислены, исходя из неверной ги­потезы о нормальном распределении генеральной совокупности.Критерий Пирсона отвечает на поставленный ранее вопрос. Однако, как и любой статистический критерий, он не доказывает справедливость гипотезы, а лишь устанавливает при принятом уровне значимости q ее согласие или несогласие с данными наблюдений.Пусть по выборке объема ___ получено эмпирическое распределение.

Допустим, в предположении нормального распределения генеральной совокупности, вычислены теоретические частоты _____. При уровне значимости q требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.В качестве критерия проверки нулевой гипотезы принимается слу­чайная величина илигде К- число интервалов (вариант).Эта величина случайная, так как в различая опытах она принимает различные, заранее неизвестные значения. Чем меньше различаются эмпирические и теоретические частоты, тем меньше значение критерия (1.9) и, следовательно, он в известной мере характеризует близость эмпири­ческого и теоретического распределений. Возведением в квадрат разнос­тей частот устраняется возможность взаимного погашения положительных и отрицательных разностей.При неограниченном возрастании объема выборки (_________) закон распределения случайной величины (1.9), независимо от того, какому за­кону распределения подчинена генеральная совокупность, стремится к за­кону распределения X2 с f степенями свободы. Поэтому случайная ве­личина (1.9) обозначена X2, а сам критерий называют критерием сог­ласия "хи квадрат".

Число степеней свободы находят по равенству f=K-1-l где l- число параметров предполагаемого распределения, которые оце­нены по данным выборки, а l вызвана тем, что имеется дополнитель­ное ограничение:т.е.- Теоретическое число элементов совокупности должно быть равно фак­тическому числу элементов.

Поскольку в данном случае, предполагаемое распределение является нормальным, nо оценивают два параметра (математическое ожидание и среднеквадратическое отклонение), поэтому l=2, и число степеней свободы Если расчетное (наблюдаемое) значение критерия (1.9).оказалось меньше критического _____ которое находят по таблицам, для соответствующего уровня значимости q и числа степеней свободы, т.е. если то нет оснований отвергнуть нулевую гипотезу о нормальности распреде­ления. В противном случае (при ___________) нулевая гипотеза отверга­ется.

При проверке гипотезы о нормальности распределения существует правило, согласно которому общее количество элементов выборки должно быть а число элементов, попавших в любой i-и интервал (т.е. значения эмпи­рических частот ____),должно быть ___________________________

Если в крайние интервалы попадает меньшее число элементов, то они объединяются с соседними интервалами. Внутренние интервалы объеди­нять запрещается. Общее число интервалов К, оставшихся после объеди­нения, должно удовлетворять условию _____________ Иначе число степеней, свободы f окажется равным нулю, и гипо­тезу невозможно будет проверить.В целях контроля вычислений формулу целесообразно преобра­зовать к виду приведен пример расчета наблюдаемого значения крите­рия ____ по известным эмпирическим и теоретическим частотам. Если ­­­­_________, то нет оснований отвергнуть нулевую гипоте­зу. Т.е., расхождение эмпирических и теоретических частот незначимо. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

 

 

29. Критические точки и критические области распределения

 

30. Генеральная и выборочная совокупности.

Пусть требуется изучить совокупность однородных объектов относительно некоторого качествен­ного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным—контролируемый размер детали. Иногда проводят сплошное обследование, т. е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяют сравнительно редко. Например, если совокупность содержит очень большое число объектов, то провести сплошное обследование физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование практически не имеет смысла. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению. Различают генеральную и выборочную совокупности: Генеральной совокупностью называют совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений случайной величины, или совокупность результатов всех мыслимых наблюдений, проводимых в неизменных условиях над одной из случайных величин, связанных с данным видом объектов.

Замечание: Часто генеральная совокупность содержит конечное число объектов. Однако если это число достаточно велико, то иногда в целях упрощения вычислений допускают, что генеральная совокупность состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объема генеральной совокупности (достаточно большого объема) практически не сказывается на результатах обработки данных выборки. Выборочной совокупностью называют часть отобранных объектов из генеральной совокупности. Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N = 1000, а объем выборки п =100. Число объектов генеральной совокупности N значительно превосходит объем выборки n. Из ряда чисел видно, что все 60 значений случайной величины разбиты на семь групп, в пределах каждой из которых все значения случайной величины одинаковы. Таким образом, имеется семь различных значений случайной величины: 0; 1; 2; 3; 4; 5; 7. Каждое такое значение обычно называют вариантом. Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантом, а изменение этого значения ­ варьированием. Варианты будем обозначать малыми буквами конца латинского алфавита с соответствующими порядковому номеру группы индексами.

Для каждой группы сгруппированного ряда данных можно подсчитать их численность, т.е. определить число, которое показывает, сколько раз встречается соответствующий вариант в ряде наблюдений. Такие числа называют частотой варианта. Численность отдельной группы сгруппированного ряда наблюдаемых данных называется частотой или весом соответствующего варианта и обозначается тi, где i—индекс варианта.В ряде случаев представляет практический интерес относительная частота того или иного варианта, называемая частостью. Отношение частоты данного варианта к общей сумме частот всех вариантов называется частостью или долей этого варианта и обозначается рi, где i—индекс варианта, т.е. Нетрудно заметить, что частость является статистической вероятностью появления варианта. Естественно считать частость выборочным аналогом (вычисленной по выборочным данным) вероятности рi появления значения хi, случайной величины X. Подсчитав частоты и частости для каждого варианта, наблюдаемые данные представляют в виде таблицы, которую называют дискретным вариационным рядом. В первой строке расположены- варианты, во второй- соответствующие частоты, в третьей- соответствующие частости.

 

31.Дискретное и интервальное статистические распределения, полигон и гистограмма.Для наглядности строят различные графики статистического распределения,и, в частности,полигон и гистограмму. Полигоном частот называют ломаную,отрезки которой соединяют точки (х1;n1),(x2;n2),…(xk;nk).Для построения полигона частот на оси абсцисс откладывают варианты хі, а на оси ординат-соответствующие им частоты nі.Точки (хі;nі) соединяют отрезками прямых и получают полигон частот. Полигоном относительных частот называют ломанную,отрезки которой соединяют точки (x1 W1),(x2W2),…,(xk Wk). Для построения полигона относительных частот на оси абсцисс откладывают варианты хі, а на ординат-соответствующие им относительные частоты Wі. Точки (хі Wі) соединяют отрезками прямых и получают полигон относительных частот. Гистограммой частот называют ступенчатую фигуру,состоящую из прямоугольников,основаниями которых служат частичные интервалы длинною h, а высоты равны отношению nі\h(плотность частоты). Для построениия гистограммы частот на оси абсцисс откладывают частичные инервалы,а над ними проводят отрезки,параллельные оси абсцисс на расстоянии nі\h.Плошадь і-го частичного прямоугольника равна hnі\ =nі-сумме частот варианта і-го интервала; следовательно,площадь гистограммы частот равна сумме всех частот,т.е.,объему выборки.

 

 

32 Точечные оценки параметров распределения.

Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки, полученные в результате n наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр. Рассматривая значения количественного признака как независимые случайные величины, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения - это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра. Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям: оценка должна быть несмещенной, эффективной и состоятельной.

Поясним каждое из понятий. Несмещенной называют статистическую оценку Q*, математическое ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т. е.

M(Q*) = Q. Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру. Эффективной называют статистическую оценку, которая (при заданном объеме выборки п) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема (n велико!) к статистическим оценкам предъявляется требование состоятельности. Состоятельной называют статистическую оценку, которая при п стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при п стремится к нулю, то такая оценка оказывается и состоятельной. Рассмотрим точечные оценки параметров распределения, т.е. оценки, которые определяются одним числом Q* =f(x1, x2,…,xn), где x1, x2,…,xn- выборка.

32. Выборочные числовые характеристики распределения: Среднее квадратичное отклонение — это статистическая величина, описывающая разброс значений изучаемой величины вокруг ее ожидаемого значения. Чтобы рассчитать среднее квадратичное отклонение, необходимо рассчитать дисперсию (величину разброса результатов); затем извлечь из этого числа квадратный корень (с1/2).Расчет дисперсии проводится следующим образом: Шаг 1: Сначала вычисляем отклонение каждого потенциального результата от ожидаемого (xt — х). Тогда в случае проекта 3 первый результат равен (-16) (это наш х.), а ожидаемый результат (х) равен 26. Вычитая второе значение из первого, получаем (-42). Шаг 2: Возводим в квадрат результат, полученный на шаге 1, для каждого из результатов (х. — х)2. Итак, для первого результата проекта 3 берем (-42) и возводим в квадрат: (-42)2 = 1 764. Шаг 3: Умножаем число, полученное в результате шага 2, на вероятность получения результата. В случае первого результата проекта 3 мы умножаем 1 764 на 0,25 = 441. То есть (xt — xj2pr Шаг 4: Наконец, складываем вместе результаты всех этих расчетов по отдельному проекту. Так, для проекта 3 складываем (441 + 50 + 121). Получаем дисперсию с = 612.Заметьте, что дисперсия — это очень большое число по сравнению с первоначальным возможным результатом: для проекта 3 были результаты (-16), 36 × 48, между тем как дисперсия больше 600; это потому, что дисперсия измеряется в фунтах в квадрате, или ЧПС (NPV) в квадрате и т.д. Следующий шаг — получить среднее квадратичное отклонение (о) путем извлечения квадратного корня из значения дисперсии. Таким образом, вычисляется отклонение от ожидаемого значения непосредственно в фунтах или в единицах прибыли. Среднее квадратичное отклонение дает общий критерий для сравнения дисперсии возможных результатов для множества проектов. Таким образом, среднее отклонение для проекта 3 равно (600)1/2 = 24,49. Выборочная средняя. Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n. Выборочной средней называют среднее арифметическое значение признака выборочной совокупности. Если все значения признака выборки различны, то если же все значения имеют частоты n1, n2,…,nk, то

Выборочная средняя является несмещенной и состоятельной оценкой генеральной средней.

Замечание: Если выборка представлена интервальным вариационным рядом, то за xi принимают середины частичных интервалов. Дисперсия Понятие дисперсии обобщается на многомерные случайные величины нетривиальным образом. Это обобщение будет сделано в следующем разделе. Здесь лишь приведем формулы для вычисления дисперсии компонент двумерного случайного вектора.

Если (, ) - двумерная случайная величина, то D  = M ( - M )2 = M2 - M ()2, D  = M ( - M )2 = M2 - M ()2.Входящие в эту формулу математические ожидания вычисляются по приведенным выше формулам.

 

33. Точечные оценки числовых характеристик. Основные определения. Метод моментов.
Статистической оценкой:| * неизвестного параметра:| теоретического распределения называют функцию f(X1,X2,...,Xn) от наблюдаемых С.В. X1,X2,...,Xn. Точечной называют статистическую оценку, которая определяется одним числом:| *=f(x1,x2,...,xn), где х1,х2,...,xn - результаты n наблюдений над количественным признаком Х (выборка). Несмещенной называют точечную оценку, мат. ожидание которой равно оцениваемому параметру при любом объеме выборки. Смещенной называют точечную оценку, мат. ожидание которой не равно оцениваемому параметру. Несмещенной оценкой генеральной средней (мат. ожидания) служит выборочная средняя: Хв=(сумма по i от 1 до k nixi)/n, где xi - варианта выборки, ni - частота варианты xi, n=сумма по i от 1 до k ni - объем выборки. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия: Dв=(сумма по i от 1 до k ni(Хi-Xв)*2)/n. Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия: s*2=n/n-1*Dв=сумма ni(xj - Xв)*2/n-1. Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов соответствующим эмпирическим моментам того же порядка. Если распределение определяется одним параметром, то для его отыскания приравнивают один теоретический момент одному эмпирическому моменту того же порядка. Например, можно приравнять начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка: v1=M1. Учитывая, что v1=M(X) и М1=Хв, получим М(Х)=Хв. Если распределение определяется двумя параметрами, то приравнивают два теоретических момента двум соответствующим эмпирическим моментам того же порядка. Учитывая, что v1=M(X),M1=Хв,мю=D(X),m2=Dв, имеем систему: М(Х)=Хв, D(X)=Dв.

 

34. Интервальные оценки параметров распределения. Интервальной называют оценку, которая определяется двумя числами—концами интервала. Интервальные оценки позволяют установить точность и надежность оценок. Пусть найденная по данным выборки статистическая характеристика Q* служит оценкой неизвестного пара­метра Q. Будем считать Q постоянным числом (Q может быть и случайной величиной). Ясно, что Q* тем точнее определяет параметр Q, чем меньше абсолютная величина разности |Q- Q*|. Другими словами, если >0 и |Q- Q*| <, то чем меньше , тем оценка точнее. Таким образом, положительное число  характеризует точность оценки. Однако статистические методы не позволяют категорически утверждать, что оценка Q* удовлетворяет неравенству |Q- Q*| <; можно лишь говорить о вероятности , с которой это неравенство осуществляется. Надежностью (доверительной вероятностью) оценки называют вероятность , с которой осуществляется неравенство |Q—Q* | <. Обычно надежность оценки задается наперед, причем в качестве  берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999. Пусть вероятность того, что, |Q- Q*| < равна :

P(|Q- Q*| <)= . Заменив неравенство равносильным ему двойным неравенством получим:

Р [Q* —< Q < Q* +] =  Это соотношение следует понимать так: вероятность того, что интервал Q* - < Q < Q* + заключает в себе (покрывает) неизвестный параметр Q, равна . Интервал (Q* -  Q* +) называется доверительным интервалом, который покрывает неизвестный параметр с надежностью .

2.2. Интервальная оценка вероятности биноминального распределения по относительной частоте.

Найдем доверительный интервал для оценки вероятности по относительной частоте, используя формулу:

Если n достаточно велико и р не очень близка к нулю и единице, то можно считать, что относительная частота распределена приближенно по нормальному закону, причем М(W)= р. Заменив Х на относительную частоту, математическое ожидание - на вероятность, получим равенство:

Приступим к построению доверительного интервала (р1, р2), который с надежностью  покрывает оцениваемый параметр р Потребуем, чтобы с надежностью g выполнялось соотношение указанное выше равенство:

Заменив

, получим: Таким образом, с надежностью  выполняется неравенство (чтобы получить рабочую формулу, случайную величину W заменим неслучайной наблюдаемой относительной частотой w и подставим 1- р вместо q):

Учитывая, что вероятность р неизвестна, решим это неравенство относительно р. Допустим, что w > р. Тогда

Обе части неравенства положительны; возведя их в квадрат, получим равносильное квадратное неравенство относительно р:

Дискриминант трехчлена положительный, поэтому корни действительные и различные:

меньший корень

больший корень:

Замечание1: При больших значениях n, пренебрегая слагаемыми ,и учитывая

получим приближенные формулы для границ доверительного интервала:

2.1.1. Доверительный интервал для оценки математического ожидания при известном .

Пусть количественный признак генеральной совокупности распределен нормально. Известно среднее квадратическое отклонение этого распределения -. Требуется оценить математическое ожидание а по выборочной средней. Найдем доверительный интервал, покрывающий а с надежностью . Выборочную среднюю будем рассматривать как случайную величину (она изменяется от выборки к выборке), выборочные значения признака- как одинаково распределенные независимые СВ с математическим ожиданием каждой а и средним квадратическим отклонением . Примем без доказательства, что если величина Х распределена нормально, то и выборочная средняя тоже распределена нормально с параметрами .Потребуем, чтобы выполнялось равенство

Заменив Х и , получим

получим

Задача решена. Число t находят по таблице функции Лапласа Ф(х).

Пример1. СВХ распределена нормально и  =3. Найти доверительный интервал для оценки математического ожидания по выборочным средним, если n = 36 и задана надежность  =0,95.

Из соотношения 2Ф(t)= 0,95, откуда Ф(t) = 0,475 по таблице найдем t: t =1,96. Точность оценки

Доверительный интервал

. Пример2. Найти минимальный объем выборки, который обеспечивает заданную точность  =0,3 и надежность  = 0,975, если СВХ распределена нормально и  =1,2.

Из равенства




Дата добавления: 2015-01-12; просмотров: 128 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.039 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав