Случайная величина. Случайные величины Множество возможных значений случайной величины

Случайная величина как фундаментальное понятие теории вероятности имеет большое значение в ее приложениях. Это понятие является абстрактным выражением случайного события. Более того, оперировать со случайными величинами иногда более удобно, чем со случайными событиями.

Случайной называется величина, которая в результате опыта может принять то или иное (но только одно) значение (до опыта неизвестно, какое именно).

События принято обозначать большими буквами латинского алфавита, вероятность буквой Р, например, Р(А). Реализации события (случайные величины) обозначаются малыми буквами: a 1 , a 2 , …, a n .

Поскольку в теории вероятностей и математической статистике рассматриваются массовые явления, то случайная величина, как правило, характеризуется возможными значениями и их вероятностями.

Среди встречающихся в практике случайных величин можно выделить дискретные и непрерывные.

Дискретными случайными величинами называются такие, которые принимают только отделенные друг от друга значения и могут быть заранее перечислены. Например, количество автомобилей на заданном километровом участке дороги в конкретный момент времени; число бракованных узлов деталей автомобиля в партии из n штук.

Для дискретных случайных величин характерно, что они принимают отдельные, изолированные значения, которые можно заранее перечислить. Например, количество автомобилей на заданном участке дороги может принимать только целочисленные значения 0, 1,2, ..., п и зависит от времени суток и интенсивности движения.

Существуют случайные величины другого типа, которые чаще встречаются и имеют большое практическое значение.

Непрерывной случайной величиной называется такая, возможные значения которой непрерывно заполняют некоторый промежуток (интервал числовой оси). Интервал числовой оси может быть конечным или бесконечным. Примерами непрерывных случайных величин являются время безотказной работы автомобиля в заданных дорожных условиях, скорость движения автомобиля на заданной дороге, ошибка измерения.

В отличие от дискретных возможные значения непрерывных случайных величин нельзя заранее перечислить, так как они непрерывно заполняют некоторый промежуток.

Случайные величины обозначаются обычно большими буквами латинского алфавита - X, Y, Z, Т, а их возможные значения соответствующими малыми x i , y i , z i , t i , где i = 1, 2, .... п.

Рассмотрим дискретную случайную величину X с возможными значениями x 1 , x 2 , …, x n . В результате проведения многократных опытов величина Т может принять каждое из значений x i , т. е.:

X = x 1 ; X = x 2 ; …; X = x n .

Обозначим вероятности этих событий буквой р с соответствующими индексами:


P(X = x 1)= p 1 ; P(X = x 2)= p 2 ; …; P(X = x n)= p n .

Исходя из того, что события x i образуют полную группу несовместимых событий, т. е. никаких других событий произойти не может, сумма вероятностей всех возможных значений случайной величины Т равна единице.

Эта суммарная вероятность каким-то образом распределена между отдельными значениями случайной величины

Дискретную случайную величину можно полностью описать с вероятностной точки зрения, если точно указать вероятность каждого события, т. е. задать это распределение. Этим будет установлен закон распределения случайной величины.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями . Зная его, можно до опыта судить о том, какие значения случайной величины будут появляться чаще и какие реже. Способы или формы представления закона распределения случайной величины различны.

Простейшей формой задания закона распределения дискретной случайной величины Т является ряд распределения или таблица, в которой перечислены возможные значения этой величины и соответствующие им вероятности.

ОДНОМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

Понятие случайной величины. Дискретные и непрерывные случайные величины. Функция распределения вероятностей и ее свойства. Плотность распределения вероятности и ее свойства. Числовые характеристики случайных величин: математическое ожидание, дисперсия и их свойства, среднее квадратическое отклонение, мода и медиана; начальные и центральные моменты, асимметрия и эксцесс.

1. Понятие случайной величины.

Случайной называется величина, которая принимает в результате испытаний то или иное (но при этом только одно) возможное значение, заранее известное, меняющееся от испытания к испытанию и зависящее от случайных обстоятельств. В отличие от случайного события, являющегося качественной характеристикой случайного результата испытания, случайная величина характеризует результат испытания количественно. Примерами случайной величины могут служить размер обрабатываемой детали, погрешность результата измерения какого-либо параметра изделия или среды. Среди случайных величин, с которыми приходится встречаться на практике, можно выделить два основных типа: дискретные величины и непрерывные.

Дискретной называется такая случайная величина, которая принимает конечное или бесконечное счетное множество значений. Например, частота попаданий при трех выстрелах; число дефектных изделий в партии из штук; число вызовов, поступающих на телефонную станцию в течение суток; число отказов элементов прибора за определенный промежуток времени при испытании его на надежность; число выстрелов до первого попадания в цель и т. д.

Непрерывной называется такая случайная величина, которая может принимать любые значения из некоторого конечного или бесконечного интервала. Очевидно, число возможных значений непрерывной случайной величины бесконечно. Например, ошибка при измерении дальности радиолокатора; время безотказной работы микросхемы; погрешность изготовления деталей; концентрация соли в морской воде и т. д.

Случайные величины обычно обозначают буквами ,и т. д., а их возможные значения -,и т. д. Для задания случайной величины недостаточно перечислить все ее возможные значения. Необходимо также знать, как часто могут появиться те или иные ее значения в результате испытаний при одних и тех же условиях, т. е. нужно задать вероятности их появления. Совокупность всех возможных значений случайной величины и соответствующих им вероятностей составляет распределение случайной величины.

2. Законы распределения случайной величины.

Законом распределения случайной величины называется всякое соответствие между возможными значениями случайной величины и соответствующими им вероятностями. Про случайную величину говорят, что она подчиняется данному закону распределения. Две случайные величины называются независимыми , если закон распределения одной из них не зависит то того, какие возможные значения приняла другая величина. В противном случае случайные величины называются зависимыми . Несколько случайных величин называются взаимно независимыми , если законы распределения любого числа из них не зависит от того, какие возможные значения приняли остальные величины.

Закон распределения случайной величины может быть задан в виде таблицы, в виде функции распределения, в виде плотности распределения. Таблица, содержащая возможные значения случайной величины и соответствующие вероятности, является простейшей формой задания закона распределения случайной величины:

Табличное задание закона распределения может быть использовано только для дискретной случайной величины с конечным числом возможных значений. Табличная форма задания закона случайной величины называется также рядом распределения.

Для наглядности ряд распределения представляют графически. При графическом изображении в прямоугольной системе координат по оси абсцисс откладывают все возможные значения случайной величины, а по оси ординат - соответствующие вероятности. Затем строят точки и соединяют их прямолинейными отрезками. Полученная фигура называетсямногоугольником распределения (рис. 5). Следует помнить, что соединение вершин ординат делается только в целях наглядности, так как в промежутках между и,и, и т. д. случайная величиназначений принять не может, поэтому вероятности ее появления в этих промежутках равны нулю.

Многоугольник распределения, как и ряд распределения, является одной из форм задания закона распределения дискретной случайной величины. Они могут иметь самую различную форму, однако все обладают одним общим свойством: сумма ординат вершин многоугольника распределения, представляющая собой сумму вероятностей всех возможных значений случайной величины, всегда равна единице. Это свойство вытекает из того, что все возможные значения случайной величины образуют полную группу несовместных событий, сумма вероятностей которых равна единице.

Простейшей формой задания этого закона является таблица, в которой перечислены возможные значения случайной величины и соответствующие им вероятности.

Такая таблица называется рядом распределения случайной величины Х.


0 x 1 x 2 x 3 x 4 x 5 x 6

Функция распределения

Закон распределения является полной и исчерпывающей характеристикой дискректной случайной величины. Однако она не является универсальной, так как не может быть применима к непрерывным случайным величинам. Непрерывная случайная величина принимает бесчисленное множество значений, заполняющих некоторый промежуток. Составить таблицу, включающую все значения непрерывной случайной величины практически невозможно. Следовательно, для непрерывной случайной величины не существует закон распределения, в том понимании как он существует для дискретной случайной величины.

Каким же образом описать непрерывную случайную величину?

Для этого используется не вероятность события Х=х, а вероятность события Х<х, где х - некоторая переменная. Вероятность этого события зависит от х и является функцией х.

Эта функция называется функцией распределения случайной величины Х и обозначается F(x):

F(x)=P(X

Функция распределения является универсальной характеристикой случайной величины. Она существует для любых случайных величин: дискретных и непрерывных.

Свойства функции распределения:

1. При х 1 >х 2 F(x 1)> F(x 2)

2. F(- ∞)=0

3. F(+ ∞)=1

Функция распределения дискретной случайной величины - разрывная ступенчатя функция, скачки происходят в точках, соответствующих возможным значениям случайной величины, и равны вероятности этих значений. Сумма этих скачков равна единице.

1 F(x)





Числовые характеристики случайных величин.

Основными характеристиками дискретных случайных величин являются:

· функция распределения;

· ряд распределения;

для непрерывной случайной величины:

· функция распределения;

· плотность распределения.

Любой закон представляет некоторую функцию, и указание этой функции полностью описывает случайную величину.

Однако прирешении ряда практических задач не всегда необходимо характиризовать случайную величину в полном объеме. Достаточно указать только некоторые числовые параметры, характеризующие случайную величину.

Такие характеристики, назначение которых заключается в представлении в концентрированном виде наиболее существенных особенностей распределения, называются числовыми характеристиками случайной величины.

Характеристики положения

(МОЖ,мода,медиана)

Из всех используемых числовых характеристик случайных величин, чаще используются характеристики описывающие положение случайной величины на числовой оси, а именно указывают некоторое среднее значение, около которого группируются возможные значения случайной величины.

Для этого используются следующие характеристики:

· математическое ожидание;

· медиана.

Математическое ожидание (среднее значение) вычисляется следующим образом:

х 1 р 1 2 р 2 +….+х n р n ∑ х i р i

р 1 + р 2 + …..+р n n

Учитывая, что∑ p i , МОЖ равно М[Х] = x i p i

Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Приведенная формулировка справедлива только для дискретных случайных величин.

Для непрерывных величин

М[Х] = x f(x)dx, где f(x) - плотность распределения Х.

Существуют различные способы расчета среднего значения. Наиболее распространенными формами представления средних величин являются среднее арифметическое значение, медиана и мода.

Среднее арифметическое получается путем деления суммарной величины данного признака для всей однородной статистической совокупности на количество единиц этой совокупности. Для расчета среднего арифметического используется формула:

Хср = (Х1+Х2+... +Хn):n,

где Хi - значение признака у i-ой единицы совокупности, n - количество единиц совокупности.

Модой случайной величины называется ее наиболее вероятное значение.


М


Медианой называется значение, которая расположена в середине упорядоченного ряда. Для нечетного количества единиц ряда медиана является единственной и находится точно в середине ряда, для четного - она определяется как среднее значение двух рядом расположенных единиц совокупности, занимающих среднее положение.

Статистика представляет собой отрасль науки, которая изучает количественную сторону массовых явлений общественной жизни, состоящих из отдельных элементов, единиц. Объединение элементов составляет статистическую совокупность. Целью изучения является установление количественных закономерностей развития данного явления. Оно основано на применении теории вероятностей и законе больших чисел. Сущность этого закона заключается в том, что несмотря на индивидуальные случайные колебания отдельных элементов совокупности, в общей массе проявляется определенная закономерность, характерная для данной совокупности в целом. Чем большее количество единичных элементов характеризующих исследуемое явление рассматривается, тем более четко обнаруживается закономерность, присущая данному явлению.

Преступность - явление социальное, массовое, представляет собой статистическую совокупность многочисленных фактов единичных преступных проявлений. Это и дает основание применять для ее изучения методы теории статистики.

В статистических исследованиях общественных явлений, можно выделить три этапа:

1) статистическое наблюдение, т.е. сбор первичного статистического материала;

2) сводная обработка собранных данных, в процессе которой производится подсчет итогов, расчет сводных (обобщающих) показателей и представление результатов в виде таблиц и графиков;

3)анализ, в ходе которого выявляются закономерности исследуемой статистической совокупности, взаимосвязи между различными ее составляющими, осуществляется содержательная интерпретация обобщающих показателей.

Первым этапом статистического исследования является статистическое наблюдение. Оно играет особую роль, так как ошибки, допущенные в процессе сбора данных, практически невозможно исправить на дальнейших этапах работы, что влечет за собой в конечном итоге неверные выводы о свойствах сследуемого явления, неправильную их интерпретацию.

По способу регистрации фактов статистическое наблюдение делится на непрерывное и прерывное. Под непрерывным, или текущим, понимается такое наблюдение, при котором установление и выявление фактов производится по мере их возникновения. При прерывном наблюдении регистрация фактов производится либо регулярно через определенные промежутки времени, либо по мере необходимости.

По охвату единиц обследуемой совокупности различают сплошное и несплошное наблюдение. Сплошным называется наблюдение, при котором учету подлежат все единицы изучаемой совокупности. Так, например, регистрация преступлений теоретически представляет собой сплошное наблюдение. Однако на практике определенная часть преступлений, называемых латентными, остается за пределами исследуемой статистической совокупности и поэтому фактически такое наблюдение является несплошным. Несплошным называется наблюдение, при котором регистрации подлежат не все единицы изучаемой совокупности. Оно подразделяется на несколько видов: наблюдение основного массива, выборочное наблюдение и некоторые другие.

Наблюдение основного массива (его иногда называют несовершенным сплошным методом) представляет собой такой вид несплошного наблюдения, при котором из всей совокупности единиц объекта наблюдению подвергается такая их часть, которая составляет подавляющую, преобладающую долю всей совокупности. Проведение наблюдения по этому методу практикуется в тех случаях, когда сплошной охват всех единиц совокупности сопряжен с особыми трудностями и в то же время исключение из наблюдения определенного количества единиц не оказывает существенного влияния на выводы о свойствах всей совокупности. Поэтому регистрацию преступлений скорее можно отнести именно к данному виду наблюдения.

Наиболее совершенным видом несплошного наблюдения является выборочное, при котором с целью характеристики всей совокупности обследованию подвергается лишь некоторая ее часть, однако взятая на выборку по определенным правилам. Основным условием правильности проведения выборочного наблюдения является такой отбор, в результате которого отобранная часть единиц по всем подлежащим изучению признакам достаточно точно характеризовала бы всю совокупность в целом. Чаще всего выборочное наблюдение применяется в ходе социологических исследований. В дальнейшем будем рассматиривать правила и способы отбора единиц при выборочном наблюдении.

После того как первичный материал собран и проверен, осуществляется второй этап статистического исследования сводка. Статистическое наблюдение дает материал, характеризующий отдельные единицы объекта исследования. Задача сводки - подытожить, систематизировать и обобщить результаты наблюдения так, чтобы стало возможным выявить характерные черты и существенные свойства, обнаружить закономерности изучаемых явлений и процессов.

Простейшим примером сводки является суммирование всех зарегистрированных преступлений. Однако такое обобщение не дает полного представления о всех свойствах криминогенной обстановки. Чтобы охарактеризовать преступность глубоко и всесторонне, необходимо знать, как общее количество преступлений распределяется по видам, времени, месту и способу совершения, и т.п.

Распределение единиц изучаемого объекта на однородные группы по существенным для них признакам называется статистической группировкой. Объекты, исследуемые статистикой, обычно характеризуются многими свойствами и отношениями, выражаемыми различными признаками. Поэтому группировка обследуемых объектов может производиться в зависимости от задач статистического исследования по одному или нескольким из этих признаков. Так, личный состав органа может быть сгруппирован по должностям, специальным званиям, возрасту, выслуге лет, семейному положению и т.д.

В результате обработки и систематизации первичных статистических материалов получаются ряды цифровых показателей, которые характеризуют отдельные стороны изучаемых явлений или процессов либо их изменение. Эти ряды называются статистическими. По своему содержанию статистические ряды делятся на два вида: ряды распределения и ряды динамики. Рядами распределения называются ряды, характеризующие распределение единиц исходной совокупности по какому-либо одному признаку, разновидности которого расположены в определенном порядке. Например, распределения общего количества преступлений на отдельные виды, численности всего личного состава по должностям представляют собой ряды распределения.

Динамическими рядами называются ряды, которые характеризуют изменение размеров общественных явлений во времени. Подробное рассмотрение таких рядов и их использование при аналихзе и прогнозе криминогенной обстановки составляет предметом отдельной лекции.

Результаты статистического наблюдения и сводки его материалов выражаются прежде всего в абсолютных величинах (показателях). Абсолютные величины показывают размеры общественного явления в данных условиях места и времени, например, количество совершенных преступлений или число лиц, их совершивших, фактическая численность личного состава или количество единиц автотранспорта. Абсолютные величины подразделяются на индивидуальные и суммарные (т.е. итоговые). Индивидуальными называются абсолютные величины, выражающие размеры количественных признаков у отдельных единиц той или иной совокупности объектов (например, число потерпевших или материальный ущерб по конкретному уголовному делу, возраст или выслуга лет данного сотрудника, его денежное содержание и т.п.). Они получаются непосредственно в процессе статистического наблюдения и фиксируются в первичных учетных документах. Индивидуальные абсолютные величины служат основой любого статистического исследования.

В отличие от индивидуальных суммарные абсолютные величины характеризуют итоговую величину признака по определенной совокупности объектов, охваченных статистическим наблюдением. Они получаются либо путем прямого подсчета числа единиц наблюдения (например, числа преступлений определенного вида), либо в результате суммирования значений признака у отдельных единиц совокупности (например, ущерб, нанесенный всеми преступлениями).

Однако абсолютные величины, взятые сами по себе, далеко не всегда дают надлежащее представление об изучаемых явлениях и процессах. Поэтому наряду с абсолютными величинами большое значение в статистике имеют относительные величины.

Сравнение является основным приемом оценки статистических данных и составной частью всех методов их анализа. Однако простое сопоставление двух величин недостаточно для точной оценки их соотношения. Это соотношение нужно также измерить. Роль меры такого соотношения и выполняют относительные величины.

В отличие от абсолютных, относительные величины представляют собой производные показатели. Они получаются не в результате простого суммирования, а путем относительного (кратного) сравнения между собой абсолютных величин.

В зависимости от характера изучаемого явления и конкретных задач исследования относительные величины могут иметь различную форму (внешний вид) выражения. Наиболее простой формой выражения относительной величины является число (целое или дробное), показывающее, во сколько раз одна величина больше другой, принятой за базу сравнения, или какую часть ее составляет.

Чаще всего, в аналитической деятельности органов внутренних дел применяется другая форма представления относительных чисел, процентное отношение, при которой основная величина принимается за 100. Для определения процентного отношения необходимо результат деления одной абсолютной величины на другую (базовую) умножить на 100.

Важная роль в сводной обработке статистических данных принадлежит средней величине. Поскольку каждая отдельно взятая единица статистической совокупности обладает индивидуальными особенностями, отличаясь от любой другой количественным значением, для характеристики свойств всей статистической совокупности в целом используется средняя величина . Под средней величиной в статистике понимают показатель, который отражает уровень меняющегося по величине признака в расчете на единицу однородной совокупности.

Для характеристики однородности статистической совокупности

по соответствующему признаку используются различные показатели: вариация, дисперсия, среднеквадратическое отклонение. Эти показатели позволяют оценить, в какой степени соответствующая средняя величина отражает свойства всей совокупности в целом, может ли она вообще использоваться в качестве обобщающей характеристики данной статистической совокупности. Подробное рассмотрение перечисленных показателей является самостоятельным вопросом.

Случайные величины.

В математике величина – это общее название различных количественных характеристик предметов и явлений. Длина, площадь, температура, давление и т. д. – примеры различных величин.

Величина, которая принимает различные числовые значения под влия­нием случайных обстоятельств, называется случайной величиной . Примеры случайных величин: 1) число больных, ожидающих приема у врача, 2) точные размеры внутренних органов людей и т. д.

Различают дискретные и непрерывные случайные величины.

Случайная величина называется дискретной , если она принимает только определенные отделенные друг от друга значения, которые можно установить и перечислить.

Примеры :

1) число студентов в аудитории – может быть только целым положительным числом:

0,1,2,3,4….. 20…..

2) цифра, которая появляется на верхней грани при бросании игральной кости – может принимать лишь целые значения от 1 до 6.

3) относительная частота попадания в цель при 10 выстрелах - ее значения:

0; 0,1; 0,2; 0,3 ….. 1

4) число событий, происходящих за одинаковые промежутки времени: частота пульса, число вызовов скорой помощи за час, количество операций в месяц с летальным исходом и т. д.

Случайная величина называется непрерывной , если она может принимать любые значения внутри некоторого интервала, который иногда имеет резко выраженные границы, а есди они не известны, то считают, что значения случайной величины Х лежат в интервале (-¥; ¥).. К непрерывным случайным величинам относятся, например, температура, давление, вес и рост людей, размеры форменных элементов крови, рН крови и т. п.


Понятие случайной величины играет определяющую роль в современной теории вероятностей, разработавшей специальные приемы перехода от случайных событий к случайным величинам.

Если случайная величина зависит от времени, то можно говорить о случайном процессе.

3.1. Закон распределения дискретной случайной величины

Чтобы дать полную характеристику дискретной случайной величины необходимо указать все ее возможные значения и их вероятности.

Соответствие между возможными значениями дискретной случайной величины и их вероятностями называется законом распределения этой величины .

Обозначим возможные значения случайной величины Х через хi, а соответствующие им вероятности через рi* . Тогда закон распределения дискретной случайной величины можно задать тремя способами: в виде таблицы, графика или формулы.

1. В таблице , которая называется рядом распределения, перечисляются все возможные значения дискретной случайной величины Х и соответствующие этим значениям вероятности Р(Х):

Таблица 3.1.

Х

При этом сумма всех вероятностей рi должна быть равна единице (условие нормировки ):

рi = p1 + p2 +...+pn=

2. Графически – в виде ломаной линии, которую принято называть многоугольником распределения (рис.3.1). Здесь по горизонтальной оси откладывают все возможные значения случайной величины Хi, а по вертикальной оси – соответствующие им вероятности рi.

3. Аналитически - в виде формулы: Например, если вероятность попадания в цель при одном выстреле равна р, то вероятность промаха при одном выстреле q = 1 – р, а.вероятность поражения цели 1 раз при n выстрелах дается формулой: Р(n) = qn-1×p,

3.2. Закон распределения непрерывной случайной величины. Плотность распределения вероятности.

Для непрерывных случайных величин невозможно применить закон распределения в формах, приведенных выше, т. к. непрерывная величина имеет бесчисленное («несчетное») множество возможных значений, сплошь заполняющих некоторый интервал. Поэтому составить таблицу, в которой были бы перечислены все ее возможные значения, или построить многоугольник распределения нельзя. Кроме того, вероятность какого-либо ее конкретного значения очень мала (близка к 0). Вместе с тем, различные области (интервалы) возможных значений непрерывной случайной величины обычно не являются одинаково вероятными. Таким образом, и здесь есть некий закон распределения, хотя и не в прежнем смысле.

Рассмотрим непрерывную случайную величину Х, возможные значения которой сплошь заполняют некоторый интервал (а, b)*. Закон распределения вероятностей такой величины должен позволить найти вероятность попадания ее значения в любой заданный интервал (х1, х2), лежащий внутри (а, b*) (рис.3.2.)

Эту вероятность обозначают Р(х1 <Х< х2), или Р(х1 £ Х £ х2).

Рассмотрим сначала очень малый интервал значений от х до (х + Dх) (см. рис.3.2.) Малая вероятность dР того, что случайная величина Х примет какое-то значение из этого малого интервала (х, х + Dх), будет пропорциональной величине этого интервала Dх: dР ~ Dх, или, вводя коэффициент пропорциональности f, который сам может зависеть от х, получаем:

dР = f(х) × Dх. (3.2)


Введенная нами здесь функция f(х) называется плотностью распределения вероятностей случайной величины Х или, короче, плотностью вероятности (плотностью распределения). Уравнение (3.2) можно рассматривать как дифференциальное уравнение и тогда вероятность попадания вели. чины Х в интервал (х1, х2) равна:

Р (х1< Х < х2) = f(х) dх. (3.3)

Графически эта вероятность Р (х1< Х < х2) равна площади криволинейной трапеции, ограниченной осью абсцисс, кривой f(х) и прямыми Х = х1 и Х = х2 (см. Рис.3.3), что следует из геометрического смысла определенного интеграла (3.3). Кривая f(х) при этом называется кривой распределения.

Из (3.3) видно, что если известна функция f(х), то изменяя пределы интегрирования, можно найти вероятность для любых интересующих интервалов. Поэтому именно задание функции f(х) полностью определяет закон распределения для непрерывных случайных величин Х.

Для плотности распределения вероятности f(х) должно выполняться условие нормировки в виде:

f(х) = 1, (3.4)

если известно, что все значения Х лежат в интервале (а, b), или в виде:

f(х) dх = 1, (3.5)

если границы интервала для значений Х точно неизвестны. Условия нормировки плотности вероятности (3.4) или (3.5) являются следствием того, что значения случайной величины Х достоверно лежат в пределах (а, b) или (-¥, +¥). Из (3.4) и (3.5) следует, что площадь фигуры, ограниченной кривой распределения и осью абсцисс, всегда равна 1.

3.3. Числовые характеристики случайных величин.

Результаты, изложенные в параграфах 3.1 и 3.2, показывают, что полную характеристику о дискретной или непрерывной случайных величинах дают законы их распределения.

Однако во многих практически значимых ситуациях пользуются так называемыми числовыми характеристиками случайных величин, главное назначение которых – выразить в сжатой форме наиболее существенные особенности их распределения. Важно, что эти параметры представляют собой конкретные (постоянные) значения , которые можно оценивать с помощью полученных в опытах данных. Этими оценками занимается так называемая «Описательная статистика».

В теории вероятностей и математической статистике используется достаточно много различных характеристик, здесь мы рассматриваем наиболее часто употребляемые. Лишь для части из них приведены формулы, по которым рассчитываются их значения, в остальных случаях вычисления оставим компьютеру.

3.3.1.Характеристики положения : математическое ожидание, мода, медиана.

Именно они характеризуют положение случайной величины на числовой оси, т. е. указывают некоторые важные ее значения, которые характеризуют распределение остальных значений. Среди них важнейшую роль играет математическое ожидание М(Х).

а). Математическое ожидание М(Х) случайной величины Х является вероятностным аналогом ее среднего арифметического .

Для дискретной случайной величины оно вычисляется по формуле:

М(Х) = х1р1 + х2р2 + … + хnрn = = , (3.6)

а в случае непрерывной случайной величины М(Х) определяются формулами:

М(Х) = или М(Х) = (3.7)

где f(x) – плотность вероятности, dP= f(x)dx – элемент вероятности (аналог pi) для малого интервала Dx (dx).

Пример. Вычислите среднее значение непрерывной случайной величины, имеющей на отрезке (a, b) равномерное распределение.

Решение : При равномерном распределении плотность вероятности на интервале (a, b) постоянна, т. е. f(х) = fo = const, а вне (a, b) равна нулю, и из условия нормировки (4.3) найдем значение f0:

F0= f0 × x | = (b-a)f0 , откуда

M(X) = | = = (a + b).

Таким образом, математическое ожидание М(Х) совпадает с серединой интервала (a, b), определяющей , т. е. = M(X) = .


Б). Модой Мо(Х) дискретной случайной величины называют ее наиболее вероятное значение (рис.3.4, а), а непрерывной – значение Х , при котором плотность вероятности максимальна (рис.3.4,б).

в). Еще одна характеристика положения – медиана (Ме ) распределения случайной величины.

Медианой Ме(Х) случайной величины называют такое ее значение Х , которое делит все распределение на две равновероятные части. Другими словами для случайной величины одинаково вероятно принять значения меньше Ме (Х) или больше Ме(Х) : Р(Х < Ме) = Р(Х > Ме) = .

Поэтому медиану можно вычислить из уравнения:

(3.8)

Графически медиана – это значение случайной величины, ордината которой делит площадь , ограниченную кривой распределения, пополам (S1 = S2) (рис.3.4,в). Этой характеристикой обычно пользуются только для непрерывных случайных величин, хотя формально ее можно определить и для дискретных Х.

Если М(Х), Мо(Х) и Ме(Х) совпадают, то распределение случайной величины называют симметричным , в противном случае – асимметричным .

Характеристики рассеяния – дисперсия и стандартное отклонение (среднее квадратичное отклонение).

Дисперсия D (X ) случайной величины Х определяется как математическое ожидание квадрата отклонения случайной Х от ее математического ожидания М(Х):

D (X) = M 2 , (3.9)

или D (X) = M (X2) – а)

Поэтому для дискретной случайной величины диперсия вычисляется по формулам:

D(X) = [хi – М(Х)]2 рi, или D(X) = хi2 рi –

а для непрерывной величины, распределенной в интервале (a, b):

a для интервала (-∞,∞):

D (X) = 2 f(x)dx, или D (X) =х2 f(x)dx –

Дисперсия характеризует среднее рассеяние, разбросанность значений случайной величины Х относительно ее математического ожидания. Само слово «дисперсия» означает «рассеяние».

Но дисперсия D(Х) имеет размерность квадрата случайной величины, что весьма неудобно при оценке разброса в физических, биологических, медицинских и др. приложениях. Поэтому обычно пользуются другим параметром, размерность которого совпадает с размерностью Х. Это среднее квадратичное отклонение случайной величины Х, которое обозначают s (Х) :

s (Х) = (3.13)

Итак, математическое ожидание, мода, медиана, дисперсия и среднее квадратичное отклонение являются наиболее употребляемыми числовыми характеристиками распределений случайных величин, каждая из которых, как было показано, выражает какое-нибудь характерное свойство этого распределения.

3.4. Нормальный закон распределения случайных величин

Нормальный закон распределения (закон Гаусса) играет исключительно важную роль в теории вероятностей. Во-первых, это наиболее часто встречающийся на практике закон распределения непрерывных случайных величин. Во-вторых, он является предельным законом, в том смысле, что к нему при определенных условиях приближаются другие законы распределения.

Нормальный закон распределения характеризуется следующей формулой для плотности вероятности:

, (3.13)

Здесь х - текущие значения случайной величины X, а М(X) и s - ее математическое ожидание и стандартное отклонение, которые полностью определяют функцию f(x). Таким образом, если случайная величина распределена по нормальному закону, то достаточно знать только два числовых параметра: М(Х) и s , чтобы полностью знать закон ее распределения (3.13). График функции (3.13) называется нормальной кривой распределения (кривой Гаусса). Он имеет симметричный вид относительно ординаты х = М(Х). Максимальная плотность вероятности, равная » , соответствует математическому ожиданию `Х=М(Х), и по мере удаления от нее плотность вероятности f(х) симметрично спадает, постепенно приближась к нулю (рис. Изменение значения М(Х) в (3.13) не меняет форму нормальной кривой, а приводит лишь к ее сдвигу вдоль оси абсцисс. Величина М(Х) называется также центром рассеяния, а среднеквадратичное отклонение s характеризует ширину кривой распределения (см. Рис.3.6) .

С возрастанием s максимальная ордината кривой убывает, а сама кривая становится более пологой, растягиваясь вдоль оси абсцисс, тогда как при уменьшении s кривая вытягивается вверх, одновременно сжимаясь с боков (рис. 6).

Естественно, что при любых значениях М(Х) и s площадь, ограниченная нормальной кривой и осью Х, остается равной 1 (условие нормировки):

f(х) dх = 1, или f(х) dх =

Нормальное распределение симметрично, поэтому М(Х) = Мо(Х) = Ме(Х).

Вероятность попадания значений случайной величины Х в интервал (x1,x2), т. е. Р (x1 < Х< x2) равна

Р (x1 < Х < x2) = . (3.15)

На практике часто встречается задача нахождения вероятности попадания значений нормально распределенной случайной величины в интервал, симметричный относительно М(Х). В частности, рассмотрим следующую, важную в прикладном отношении задачу. Отложим от М(Х) вправо и влево отрезки равные s, 2s и 3s (рис. 7) и рассмотрим результат вычисления вероятности попадания Х в соответствующие интервалы:

Р (М(Х) - s < Х < М(Х) + s ) = 0,6827 = 68,27%. (3.16)

Р (М(Х) - 2s < Х < М(Х) + 2s) = 0,9545 = 95,45 %. (3.17)

Р (М(Х) - 3s < Х < М(Х) + 3s) = 0,9973 = 99,73 %. (3.18)

Из (3.18) следует, что значения нормально распределенной случайной величины Х с параметрами М(Х) и s с вероятностью Р = 99,73% лежат в интервале М(Х) ± 3s, иначе в этот интервал попадают практически все возможные значения данной случайной величины. Такой способ оценки диапазона возможных значений случайной величины известен как «правило трех сигм».

Пример. Известно, что для человека рН крови является нормально распределенной величиной со средним значением (математическим ожиданием) 7,4 и стандартным отклонением 0,2. Определите диапазон возможных значений этого параметра.

Решение: Для ответа на этот вопрос воспользуемся “правилом трех сигм”. С вероятностью равной 99,73% можно утверждать, что диапазон значений рН для человека составляет 7,4 ± 3·0,2, т. е 6,8÷8.

* Если точные значения границ интервала неизвестны, то рассматривают интервал (-¥, + ¥).

Определение . Случайной величиной называется числовая величина, значение которой зависит от того, какой именно элементарный исход произошел в результате эксперимента со случайным исходом. Множество всех значений, которые случайная величина может принимать, называют множеством возможных значений этой случайной величины.

Случайные величины обозначают: X , Y 1 , Z i ; ξ , η 1 , μ i , а их возможные значения - x 3 , y 1k , z ij .

Пример . В опыте с однократным бросанием игральной кости случайной величины является число X выпавших очков. Множество возможных значений случайной величины X имеет вид

{x 1 =1, x 2 =2, …, x 6 =6 }.

Имеем следующее соответствие между элементарными исходами ω и значениями случайной величины X :

То есть каждому элементарному исходу ω i , i=1, …, 6 , ставится в соответствие число i .

Пример . Монету подбрасывают до первого появления «герба». В этом опыте можно ввести, например, такие случайные величины: X - число бросаний до первого появления «герба» с множеством возможных значений {1, 2, 3, … } и Y - число «цифр», выпавших до первого появления «герба», с множеством возможных значений {0, 1, 2, …} (ясно, что X=Y+1 ). В данном опыте пространство элементарных исходов Ω можно отождествить с множеством

{Г, ЦГ, ЦЦГ, …, Ц…ЦГ, … },

причем элементарному исходу {Ц … ЦГ } ставится в соответствие число m+1 или m , где m - число повторений буквы «Ц».

Определение . Скалярную функцию X(ω) , заданную на пространстве элементарных исходов, называют случайной величиной, если для любого x∈ R {ω:X(ω) < x} является событием.

Функция распределения случайной величины

Для исследования вероятностных свойств случайной величины необходимо знать правило, позволяющее находить вероятность того, что случайная величина примет значение из подмножества ее значений. Любое такое правило называют законом распределения вероятностей или распределением случайной величины.

Общим законом распределения, присущим всем случайным величинам, является функция распределения.

Определение . Функция распределения (вероятностей) случайной величины X называют функцию F(x) , значение которой в точке x равно вероятности события {X < x} , то есть события, состоящего из тех и только тех элементарных исходов ω , для которых X(ω) < x :

F(x) = P{X < x} .

Обычно говорят, что значение функции распределения в точке x равно вероятности того, что случайная величина X примет значение, меньшее x .

Теорема . Функция распределения удовлетворяет следующим свойствам:

Типичный вид функции распределения.

Дискретные случайные величины

Определение . Случайную величину X называют дискретной, если множество ее возможных значений конечно или счетно.

Определение . Рядом распределения (вероятностей) дискретной случайной величины X называют таблицу, состоящую из двух строк: в верхней строке перечислены все возможные значения случайной величины, а в нижней - вероятности p i =P\{X=x i \} того, что случайная величина примет эти значения.

Для проверки правильности составления таблицы рекомендуется просуммировать вероятности p i . В силу аксиомы нормированности:

По ряду распределения дискретной случайной величины можно построить ее функцию распределения F(x) . Пусть X - , заданная своим рядом распределения, причем x 1 < x 2 < … < x n . Тогда для всех x ≤ x 1 событие {X < x} является невозможным, следовательно, по определению F(x)=0 . Если x 1 < x≤ x 2 , то событие {X < x} состоит из тех и только тех элементарных исходов, для которых X(ω)=x 1 . Следовательно, F(x)=p 1 . Аналогично, при x 2 < x ≤ x 3 событие {X < x} состоит из элементарных исходов ω , для которых либо X(ω)=x 1 , либо X(ω)=x 2 , то есть {X < x}={X=x 1 }+{X=x 2 } . Следовательно, F(x)=p 1 +p 2 и т.д. При x > x n событие {X < x} достоверно, тогда F(x)=1 .

Закон распределения дискретной случайной величины можно задать также аналитически в виде некоторой формулы или графически. Например, распределение игральной кости описывается формулой

P{X=i} = 1/6 , i=1, 2, …, 6 .

Некоторые дискретные случайные величины

Биномиальное распределение. Дискретная случайная величина X распределена по биномиальному закону, если она принимает значения 0, 1, 2, …, n в соответствии с распределением, заданным формулой Бернулли:

Это распределение является не чем иным, как распределения числа успехов X в n испытаниях по схеме Бернулли с вероятностью успеха p и неудачи q=1-p .

Распределение Пуассона. Дискретная случайная величина X распределена по закону Пуассона, если она принимает целые неотрицательные значения с вероятностями

где λ > 0 - параметр распределения Пуассона.

Распределение Пуассона также называют законом редких событий, так как оно всегда проявляется там, где производится большое число испытаний, в каждом из которых с малой вероятностью происходит «редкое» событий.

В соответствие с законом Пуассона распределены, например, число вызовов, поступивших в течение суток на телефонную станцию; число метеоритов, упавших в определенном районе; число распавшихся частиц при радиоактивном распаде вещества.

Геометрическое распределение. Снова рассмотрим схему Бернулли. Пусть X - число испытаний, которое необходимо провести прежде, чем появится первый успех. Тогда X - дискретная случайная величина, принимающая значения 0, 1, 2, …, n , … Определим вероятность события {X=n} .

  • X=0 , если в первом испытании произойдет успех, следовательно, P{X=0}=p .
  • X=1 , если в первом испытании произойдет неудача, а во втором - успех, то P{X=1}=qp .
  • X=2 , если в первых двух испытаниях - неудача, а в третьем - успех, то P{X=2}=q 2 p .
  • Продолжая процедуру, получим P{X=i}=q i p , i=0, 1, 2, …

      Случайную величину с таким рядом распределения называют распределенной согласно геометрическому закону.


Top