Дискретная случайная величина определяется законом распределения

Вероятностная теория Не все явления измеряются на количественной шкале, например 1, 2, 3 ... .... Не всегда явление может принимать бесконечное или большое количество различных состояний. Например, пол человека может быть либо М, либо Ж.

Стрелок либо попадает в цель, либо промахивается. Голосование может быть либо "За", либо "Против" и т.д. Другими словами, эти данные показывают альтернативный признак - либо "да" событие произошло, либо "нет" событие не произошло.

Положительный исход события также называется "успехом". Эксперименты с такими данными называют схемой Бернулли, в честь известного швейцарского математика, который обнаружил, что при проведении большого количества испытаний отношение числа положительных исходов к общему числу испытаний стремится к вероятности того, что событие произойдет.

Альтернативная переменная признака Для того чтобы привлечь к анализу математический аппарат, результаты таких наблюдений должны быть записаны в числовой форме.

Для этого мы присваиваем положительному исходу число 1, а отрицательному - число 0. Другими словами, мы имеем дело с переменной, которая может иметь только два значения: 0 или 1.

Какую пользу это может принести? На самом деле, столько же, сколько и от обычных данных. Например, легко подсчитать количество положительных исходов - достаточно сложить все значения, то есть все 1. Можно пойти и дальше, но для этого придется ввести несколько обозначений.

Первое, что следует отметить, это то, что положительные исходы, равные 1, имеют некоторую вероятность возникновения.

Эту вероятность традиционно обозначают латинской буквой p. Приведенные выше обозначения можно четко систематизировать в виде таблицы распределения переменной X. Мы получили список возможных значений и их вероятностей. Можно рассчитать математическое ожидание и дисперсию. Математическое ожидание - это сумма произведений всех возможных значений на соответствующие им вероятности: давайте вычислим матожидание, используя обозначения, приведенные в таблице выше.

Оказывается, что ожидание альтернативного признака равно вероятности этого события, p. Теперь определим, что такое дисперсия альтернативного признака. Дисперсия - это средний квадрат отклонений от математического ожидания. Стандартное отклонение - это корень из дисперсии: Максимальное значение не превышает 0,5. Как видите, и математическое ожидание, и дисперсия альтернативного признака имеют очень компактную форму.

Биномиальное распределение случайной величины Рассмотрим ситуацию под другим углом. Действительно, кого волнует, что среднее выпадение орла за один бросок составляет 0,5? Это даже невозможно представить.

Более интересным представляется вопрос о количестве орлов для данного числа бросков. Другими словами, исследователя часто интересует вероятность того, что произойдет некоторое количество удачных событий. Это может быть число дефектных изделий в тестируемой партии 1 - дефектное, 0 - годное, или число выздоровлений 1 - здоровое, 0 - больное и т.д. Количество таких "успехов" будет равно сумме всех значений переменной X, т.е. количеству единичных исходов.

Предполагается, что все значения x независимы друг от друга. Рассмотрим основные характеристики биномиальной переменной, то есть установим ее матожидание, дисперсию и распределение. Математическое ожидание биномиальной переменной получить очень просто. Теперь давайте выведем формулу для дисперсии биномиальной переменной. Дисперсия суммы независимых случайных величин равна сумме их дисперсий.

Для монеты эта задача может звучать следующим образом: Какова вероятность того, что при подбрасывании выпадет 40 "орлов"? Чтобы понять метод расчета, предположим, что монету подбрасывают всего 4 раза. Каждый раз может выпасть любая сторона. Мы спросим: какова вероятность получить 2 орла из 4 бросков?

Каждый бросок независим друг от друга. Поэтому вероятность любой комбинации будет равна произведению вероятностей данного исхода для каждого отдельного броска. Пусть О - голова, Р - решка.

Это вероятность одной из комбинаций, которая нам нравится. Но вопрос был об общем количестве орлов, а не о каком-то конкретном порядке. Тогда нам нужно сложить вероятности всех комбинаций, в которых есть ровно 2 орла. Очевидно, что все они одинаковы, потому что произведение не меняется, когда множители меняются местами. Поэтому нам нужно подсчитать их количество, а затем умножить на вероятность любой такой комбинации. Всего существует 6 возможностей. Однако подсчет таким способом утомителен. Уже для 10 монет получить общее количество вариантов методом перебора будет очень сложно.

Умные люди давно придумали формулу, по которой они подсчитывают количество различных комбинаций из n элементов по k, где n - общее количество элементов, k - количество элементов, варианты которых подсчитываются. Формула для комбинации n элементов по k выглядит следующим образом: Такой вид имеет место в разделе комбинаторики. Всем, кто хочет улучшить свои знания, стоит обратиться туда. Отсюда, кстати, и название биномиальное распределение, а формула выше - это коэффициент в разложении бинома Ньютона.

Формулу для определения вероятности легко обобщить на любое число n и k. В результате формула биномиального распределения выглядит следующим образом. Умножьте число комбинаций, подходящих под условие, на вероятность одной из них. Для практического использования достаточно просто знать формулу биномиального распределения. Или даже не обязательно ее знать - вот как найти вероятность с помощью Excel.

Но лучше знать. Максимальная вероятность бинома принадлежит значению, соответствующему математическому ожиданию.

Вычисление вероятностей биномиального распределения в Excel Если вы пользуетесь только бумагой и калькулятором, то вычисление биномиальных распределений, даже несмотря на отсутствие интегралов, довольно сложно.

Например, значение ! В прошлом, да и сейчас тоже, для вычисления таких значений использовались приближенные формулы. Таким образом, любой пользователь, даже выпускник гуманитарного вуза, может легко вычислить вероятность биномиально распределенной случайной величины. Для закрепления материала давайте пока воспользуемся Excel как обычным калькулятором, то есть выполним пошаговый расчет по формуле для биномиального распределения.

Вычислите, например, вероятность найти 50 орлов. Ниже показаны этапы расчета и конечный результат. Как видите, промежуточные результаты настолько велики, что не помещаются в ячейку, несмотря на то, что везде используются такие простые функции, как ФАКТОР, экспоненция, умножение и деление.

Действительно, этот расчет довольно громоздкий и, по крайней мере, не компактный, поскольку в нем задействовано много ячеек. К тому же в нем трудно разобраться сразу.

В общем, в Excel есть готовая функция для вычисления вероятностей биномиального распределения. Синтаксис функции состоит из 4 аргументов: Поля имеют следующее назначение: Number of Successes - количество успешных испытаний. Количество испытаний - количество бросков: раз. Вероятность успеха - вероятность выпадения орла при одном броске 0,5. Интеграл - указывается либо 1, либо 0.

Нажимаем OK и получаем тот же результат, что и выше, только все вычисляется одной функцией. Это очень удобно. В качестве эксперимента заменим последний параметр 0 на 1. Получим 0. В общем, вычисления быстрые и простые. Настоящий аналитик должен понимать, как ведет себя функция, каково ее распределение, поэтому давайте рассчитаем вероятности для всех значений от 0 до следующего: какова вероятность, что не упадет ни один орел, что будет 1 орел, 2, 3, 50, 90, или расчет показан на следующем рисунке?

Синяя линия - само биномиальное распределение, красная точка - вероятность для определенного числа успехов k. Можно спросить, похоже ли биномиальное распределение на... Да, очень похоже. Только Гаусс, а затем и Лаплас много лет спустя заново открыли и тщательно проанализировали нормальный закон распределения.

На приведенном графике прекрасно видно, что максимальная вероятность находится на математическом ожидании, а по мере отклонения от него она резко уменьшается. Точно так же, как и нормальный закон. Биномиальное распределение имеет большое практическое значение, встречаясь довольно часто. С помощью Excel вычисления производятся быстро и легко.


Навигация

Comments

  1. В этом что-то есть. Раньше я думал иначе, благодарю за помощь в этом вопросе.

  2. Присоединяюсь. Я согласен со всем выше сказанным. Можем пообщаться на эту тему. Здесь или в PM.