Загрузил svchernov

PDF-Функция Плотности Вероятности

реклама
Функция плотности вероятности
В теории вероятностей функция плотности вероятности (PDF), функция плотности или
плотность абсолютно непрерывной случайной величины - это функция, значение которой в любой
заданной выборке (или точке) в пространстве выборки (набор возможных значений, принимаемых
случайной величиной) может быть интерпретировано как обеспечивающее относительную
вероятность того, что значение случайной величины будет равно этой выборке.[2][3] Плотность
вероятности - это вероятность на единицу длины, другими словами, в то время как абсолютная
вероятность того, что непрерывная случайная величина примет какое-либо конкретное значение,
равна 0 (поскольку для начала существует бесконечный набор возможных значений), значение PDF в
двух разных выборках можно использовать для определения того, насколько более вероятно, что
случайная величина будет близка к одной выборке по сравнению с другой выборкой.
В более точном смысле PDF используется для указания вероятности того, что случайная величина
попадет в определенный диапазон значений, в отличие от принятия какого-либо одного значения. Эта
вероятность определяется интегралом от PDF этой переменной в этом диапазоне, то есть она
определяется площадью под функцией плотности, но выше горизонтальной оси и между наименьшим
и наибольшим значениями диапазона. Функция плотности вероятности везде неотрицательна, а
площадь под всей кривой равна 1.
Термины функция распределения вероятностей и функция вероятности также иногда
использовались для обозначения функции плотности вероятности. Однако такое использование не
является стандартным среди вероятностников и статистиков. В других источниках "функция
Прямоугольный график и функция плотности
распределения вероятности" может использоваться, когда распределение вероятности определяется
как функция по общим наборам значений, или это может относиться к кумулятивной функции
вероятности нормального распределения N(0, σ2).
распределения, или это может быть функция массы вероятности (PMF), а не плотность. Сама
"функция плотности" также используется для функции массы вероятности, что приводит к
дальнейшей путанице.[4] Однако в целом PMF используется в контексте дискретных случайных величин (случайных величин,
которые принимают значения в счетном множестве), в то время как PDF используется в контексте непрерывных случайных
величин.
Пример
Предположим, что бактерии определенного вида обычно живут от 4 до 6 часов. Вероятность того, что бактерия живет ровно 5
часов, равна нулю. Многие бактерии живут примерно 5 часов, но нет никаких шансов, что какая-либо данная бактерия погибнет
ровно в 5.00... часов. Однако вероятность того, что бактерия погибнет между 5 и 5,01 часами, поддается количественной оценке.
Предположим, что ответ равен 0,02 (т.е. 2%). Тогда вероятность того, что бактерия погибнет между 5 и 5,001 часами, должна
составлять около 0,002, поскольку этот временной интервал на одну десятую длиннее предыдущего. Вероятность того, что
бактерия погибнет между 5 часами и 5.0001 часами, должна составлять около 0.0002, и так далее.
В этом примере отношение (вероятность смерти в течение интервала) / (продолжительность интервала) приблизительно
постоянно и равно 2 в час (или 2 часа-1). Например, существует 0,02 вероятности смерти в 0,01-часовом интервале между 5 и 5,01
часами, и (0,02 вероятности / 0,01 часа) = 2 часа-1. Эта величина 2 часа-1 называется плотностью вероятности смерти примерно
через 5 часов. Следовательно, вероятность того, что бактерия погибнет через 5 часов, можно записать как (2 часа-1) dt. Это
вероятность того, что бактерия погибнет в течение бесконечно малого промежутка времени, около 5 часов, где dt продолжительность этого промежутка. Например, вероятность того, что он живет дольше 5 часов, но короче (5 часов + 1
наносекунда), равна (2 часа-1) ×(1 наносекунда) ≈ 6 × 10-13 (используя преобразование единиц 3,6 × 1012 наносекунд = 1 час).
Геометрическая
визуализация моды,
медианы и среднего
произвольной
унимодальной
функции плотности
вероятности.[1]
Существует функция плотности вероятности f с f(5 часов) = 2 часа-1. Интеграл от f за любой промежуток времени (не
только бесконечно малые окна, но и большие окна) - это вероятность того, что бактерия погибнет в этом окне.
Абсолютно непрерывные одномерные распределения
Функция плотности вероятности чаще всего ассоциируется с
распределениями. Случайная величина
имеет плотность
, где
функция, если:
абсолютно непрерывными одномерными
неотрицательная интегрируемая по Лебегу
Примеры четырех непрерывных
функций плотности вероятности.
Следовательно, если
и (если
является кумулятивной функцией распределения от
, то:
непрерывна при )
Интуитивно можно думать о
вероятности
попадания в бесконечно малый интервал
Формальное определение
(Это определение может быть распространено на любое распределение вероятностей, используя .,,,)
.
Случайная величина со значениями в измеримом пространстве
(обычно
с множествами Бореля в качестве измеримых подмножеств) имеет
в качестве распределения вероятностей меру X*P on
: плотность
относительно эталонной меры on
является производной Радона–
Никодима:
То есть, f - это любая измеримая функция, обладающая свойством, которое:
для любого измеримого набора
Обсуждение
В непрерывном одномерном случае, приведенном выше, эталонной мерой является мера Лебега. Функция массы вероятности дискретной случайной
величины - это плотность относительно меры подсчета в пространстве выборки (обычно это набор целых чисел или некоторое их подмножество).
Невозможно определить плотность со ссылкой на произвольную меру (например, нельзя выбрать счетную меру в качестве эталона для непрерывной
случайной величины). Более того, когда она существует, плотность почти уникальна, что означает, что любые две такие плотности совпадают почти
везде.
Дополнительные сведения
В отличие от вероятности, функция плотности вероятности может принимать значения, большие единицы; например, непрерывное равномерное
распределение на интервале [0, 1/2] имеет плотность вероятности f(x) = 2 для 0 ≤ x ≤ 1/2 и ) = 0 в других местах.
Стандартное нормальное распределение имеет плотность вероятности
Если задана случайная величина X и ее распределение допускает функцию плотности вероятности f, то ожидаемое значение X (если ожидаемое
значение существует) может быть рассчитано как
Не каждое распределение вероятностей имеет функцию плотности: распределения дискретных случайных величин этого не делают; также как и
распределение Кантора, хотя оно не имеет дискретной составляющей, т. Е. Не присваивает положительную вероятность какой-либо отдельной точке.
Распределение имеет функцию плотности тогда и только тогда, когда его кумулятивная функция распределения F(x) абсолютно непрерывна. В данном
случае: F почти везде дифференцируема, и ее производная может использоваться как плотность вероятности:
Если распределение вероятностей допускает плотность, то вероятность каждого одноточечного множества {a} равна нулю; то же самое справедливо для
конечных и счетных множеств.
Две плотности вероятности f и g точно представляют одно и то же распределение вероятностей, если они различаются только на множестве нулевой по
Лебегу.
В области статистической физики в качестве определения функции плотности вероятности обычно используется неформальная переформулировка
приведенного выше соотношения между производной кумулятивной функции распределения и функцией плотности вероятности. Это альтернативное
определение следующее:
Если dt бесконечно малое число, вероятность того, что X включено в интервал (t, t + dt) равна f(t) dt, или:
Связь между дискретным и непрерывным распределениями
Можно представить определенные дискретные случайные величины, а также случайные величины, включающие как непрерывную, так и дискретную
части, с помощью обобщенной функции плотности вероятности, используя дельта-функцию Дирака. (Это невозможно с помощью функции плотности
вероятности в смысле, определенном выше, это может быть сделано с помощью распределения.) Например, рассмотрим двоичную дискретную
случайную величину, имеющую распределение Радемахера, то есть принимающую значения -1 или 1 с вероятностью 1⁄2 каждый. Плотность вероятности,
связанная с этой переменной, равна:
В более общем плане, если дискретная переменная может принимать n различных значений среди действительных чисел, то соответствующая функция
плотности вероятности равна:
где
- дискретные значения, доступные для переменной, и
- вероятности, связанные с этими значениями.
Это существенно унифицирует обработку дискретных и непрерывных распределений вероятностей. Приведенное выше выражение позволяет
определять статистические характеристики такой дискретной переменной (такие как среднее, дисперсия и эксцесс), исходя из формул, приведенных для
непрерывного распределения вероятности.
Семейства плотностей
Обычно функции плотности вероятности (и функции массы вероятности) параметризуются, то есть характеризуются неопределенными параметрами.
Например, нормальное распределение параметризуется в терминах среднего и дисперсии, обозначаемых
и
соответственно, что дает семейство
плотностей
Разные значения параметров описывают разные распределения разных случайных величин в одном и том же выборочном пространстве (один и тот же
набор всех возможных значений переменной); это выборочное пространство является областью семейства случайных величин, которые описывает это
семейство распределений. Данный набор параметров описывает единое распределение внутри семейства, разделяющее функциональную форму
плотности. С точки зрения данного распределения параметры являются константами, а члены в функции плотности, которые содержат только
параметры, но не переменные, являются частью коэффициента нормализации распределения (мультипликативный коэффициент, который гарантирует,
что область под плотностью — вероятность того, что что-то произойдет в области — равна 1). Этот коэффициент нормализации находится за пределами
ядра распределения.
Поскольку параметры являются константами, повторная параметризация плотности в терминах различных параметров для характеристики другой
случайной величины в семействе означает простую замену новых значений параметров в формуле вместо старых.
Плотности , связанные с несколькими переменными
Для непрерывных случайных величин X1, ..., Xn также можно определить функцию плотности вероятности, связанную с набором в целом, часто
называемую совместной функцией плотности вероятности. Эта функция плотности определяется как функция от n переменных, такая, что для
любой области D в n-мерном пространстве значений переменных X1, ..., Xn вероятность того, что реализация заданных переменных попадает внутрь
области D, равна
Если Ф(Х1, ..., хп) = пр(х -1 ≤ х1, ..., хп ≤ хП) является кумулятивная функция распределения вектора (х1, ..., хп), то совместная функция плотности
вероятностей может быть вычислено как частную производную
Предельные плотности
Для in, пусть ) будет функцией плотности вероятности, связанной только с переменной i,. Это называется функцией предельной плотности и
может быть выведено из плотности вероятности, связанной со случайными переменными X1, ..., Xn путем интегрирования по всем значениям других
n − 1 переменных:
Независимость
Непрерывные случайные величины X1, ..., Xn, допускающие совместную плотность, все независимы друг от друга тогда и только тогда, когда
Следствие
Если совместную функцию плотности вероятности вектора из n случайных величин можно разложить на произведение n функций одной переменной
(где каждое fi не обязательно является плотностью), тогда все n переменных в наборе независимы друг от друга, и предельная функция плотности
вероятности каждой из них задается формулой
Пример
Этот элементарный пример иллюстрирует приведенное выше определение многомерных функций плотности вероятности в простом случае функции от
набора двух переменных. Давайте вызовем
двумерный случайный вектор координат (X, Y): вероятность получения
в четверти плоскости
положительных x и y равна
Функция случайных величин и изменение переменных в функции плотности
вероятности
Если функция плотности вероятности случайной величины (или вектора) X задается как fX(x), возможно (но часто не обязательно; см. Ниже) вычислить
функцию плотности вероятности некоторой переменной Y = g(X). Это также называется "изменением переменной" и на практике используется для
генерации случайной величины произвольной формы fg(X) = fY с использованием известного (например, единообразного) генератора случайных чисел.
Заманчиво думать, что для того, чтобы найти ожидаемое значение E(g(X)), сначала нужно найти плотность вероятности fg(X) новой случайной
величины Y = g(X). Однако вместо вычисления
вместо этого можно найти
Значения двух интегралов одинаковы во всех случаях, когда и X, и g(X) на самом деле имеют функции плотности вероятности. Необязательно, чтобы g
была однозначной функцией. В некоторых случаях последний интеграл вычисляется гораздо проще, чем первый. Смотрите Закон бессознательного
статистика.
От скалярного к скалярному
Пусть
- монотонная функция, тогда результирующая функция плотности[5]
Здесь g-1 обозначает обратную функцию.
Это следует из того факта, что вероятность, содержащаяся в дифференциальной области, должна быть инвариантной при изменении переменных. То
есть,
или
Для функций, которые не являются монотонными, функция плотности вероятности для y равна
где n(y) - количество решений в x для уравнения
,и
являются ли эти решения.
От вектора к вектору
Предположим, что x является n-мерной случайной величиной с совместной плотностью f. Если y = G(x), где G - биективная, дифференцируемая
функция, то y имеет плотность pY:
с дифференциалом, рассматриваемым как якобиан обратной к G(⋅), оцениваемой через y.[6]
Например, в двумерном случае x = (x1, x2), предположим, что преобразование G задается как y1 = G1(x1, x2), y2 = G2(x1, x2) с обратными x1 = G1-), ).
Совместное распределение для y = (y1, y2) имеет плотность[7]
Вектора на скаляр
Пусть
- дифференцируемая функция и - случайный вектор, принимающий значения в
,
- функция плотности вероятности в и
- дельта-функция Дирака. Можно использовать приведенные выше формулы для определения
функции плотности вероятности
, которая
будет задана
Этот результат приводит к закону бессознательного статистика:
Доказательство:
Пусть - свернутая случайная величина с функцией плотности вероятности
преобразование определяются как
Ясно, что
является биективным отображением, а якобиан из
(т.Е. константа, равная нулю). Пусть случайный вектор
и
задается формулой:
которая представляет собой верхнюю треугольную матрицу с единицами на главной диагонали, следовательно, ее определитель равен 1. Применяя
теорему об изменении переменной из предыдущего раздела, мы получаем, что
которая, если ее исключить,
приводит к желаемой функции плотности вероятности.
Суммы независимых случайных величин
Функция плотности вероятности суммы двух независимых случайных величин U и V, каждая из которых имеет функцию плотности вероятности,
является сверткой их отдельных функций плотности:
Предыдущее соотношение можно обобщить на сумму N независимых случайных величин с плотностями U1, ..., UN:
Это может быть получено из двустороннего изменения переменных, включающего Y = U + V и Z = V, аналогично приведенному ниже примеру для
частного независимых случайных величин.
Произведения и частные независимых случайных величин
Учитывая две независимые случайные величины U и V, каждая из которых имеет функцию плотности вероятности, плотность произведения Y = UV и
частное Y = U/V можно вычислить путем изменения переменных.
Пример: Частное распределение
Чтобы вычислить частное Y = U/V двух независимых случайных величин U и V, определите следующее преобразование:
Тогда плотность соединения p(y,z) может быть вычислена путем изменения переменных с U,V на Y,Z, а Y может быть получен путем исключения Z из
плотности соединения.
Обратное преобразование является
Абсолютное значение определителя матрицы Якоби
Якобиевой матрицы этого преобразования равно:
Таким образом:
И распределение Y может быть вычислено путем маргинализации Z:
Этот метод принципиально требует, чтобы преобразование из U,V в Y,Z было биективным. Приведенное выше преобразование соответствует этому,
потому что Z может быть отображено непосредственно обратно в V, а для данного V частное U/V является монотонным. Аналогично обстоит дело с
суммой U + V, разностью U − V и произведением UV.
Точно такой же метод можно использовать для вычисления распределения других функций множества независимых случайных величин.
Пример: Частное от двух стандартных нормалей
Учитывая две стандартные переменные U и V, частное можно вычислить следующим образом. Во-первых, переменные имеют следующие функции
плотности:
Мы преобразуем, как описано выше:
Это приводит к:
Это плотность стандартного распределения Коши.
Смотри также
Оценка плотности – Оценка ненаблюдаемой базовой функции плотности вероятности
Оценка плотности ядра – Оценщик
Функция правдоподобия – функция, связанная со статистикой и теорией вероятностей
Список распределений вероятностей
Амплитуда вероятности - Комплексное число, квадрат абсолютного значения которого является вероятностью
Функция массы вероятности – Распределение вероятностей с дискретной переменной
Вторичная мера
Используется как плотность вероятности положения:
Атомная орбиталь – функция , описывающая электрон в атоме
Домашний ареал – Территория, в которой животное живет и периодически перемещается
Ссылки
1. "Обзор статистики AP - кривые плотности и нормальные распределения" (https://web.archive.org/web/20150402183703/http://apstatsreview.tumblr.com/po
st/50058615236/density-curves-and-the-normal-distributions). Архивировано с оригинала (https://apstatsreview.tumblr.com/post/50058615236/density-curvesand-the-normal-distributions) 2 апреля 2015 г.. Проверено 16 марта 2015.
2. Гринстед, Чарльз М.; Снелл, Дж. Лори (2009). "Условная вероятность - дискретное условие" (https://www.dartmouth.edu/~chance/teaching_aids/books_arti
cles/probability_book/Chapter4.pdf) (PDF). Введение Гринстеда и Снелла в теорию вероятностей. Тексты Orange Grove. ISBN 978-1616100469.
Заархивировано (https://web.archive.org/web/20030425090244/http://www.dartmouth.edu/~chance/teaching_aids/books_articles/probability_book/Chapter4.pd
f) (PDF) с оригинала 2003-04-25. Проверено 2019-07-25.
3. "вероятность - является ли равномерно случайное число на действительной прямой допустимым распределением?" (https://stats.stackexchange.com/q/
541479). Перекрестная проверка. Проверено 2021-10-06.
4. Орд, Дж.К. (1972) Семейства частотных распределений, Гриффин. 0-85264-137-0 ISBN (например, таблица 5.1 и пример 5.4)
5. Сигрист, Кайл. "Преобразования случайных величин" (https://stats.libretexts.org/Bookshelves/Probability_Theory/Probability_Mathematical_Statistics_and_S
tochastic_Processes_%28Siegrist%29/03%3A_Distributions/3.07%3A_Transformations_of_Random_Variables#The_Change_of_Variables_Formula).
Статистика LibreTexts. Проверено 22 декабря 2023 года.
6. Девор, Джей Л.; Берк, Кеннет Н. (2007). Современная математическая статистика с приложениями (https://books.google.com/books?id=3X7Qca6Ccf
kC&pg=PA263). Cengage. стр. 263. ISBN 978-0-534-40473-4.
7. Дэвид, Стирзакер (2007-01-01). Элементарная вероятность. Издательство Кембриджского университета. ISBN 978-0521534284. OCLC 851313783 (ht
tps://www.worldcat.org/oclc/851313783).
Читать далее
Биллингсли, Патрик (1979). Вероятность и мера. Нью-Йорк, Торонто, Лондон: Джон Уайли и сыновья. ISBN 0-471-00710-2.
Казелла, Джордж; Бергер, Роджер Л. (2002). Статистический вывод (Второе изд.).). Обучение по Томсону. стр. 34-37. ISBN 0-534-24312-6.
Стирзакер, Дэвид (2003). Элементарная вероятность (https://archive.org/details/elementaryprobab0000stir). Издательство Кембриджского
университета. ISBN 0-521-42028-8. Главы с 7 по 9 посвящены непрерывным переменным.
Внешние ссылки
Ушаков, Н.Г. (2001) [1994], "Плотность распределения вероятностей" (https://www.encyclopediaofmath.org/index.php?title=Density_of_a_probability_distrib
ution), Математическая энциклопедия, Пресс EMS
Вайнштейн, Эрик У. "Функция плотности вероятности" (https://mathworld.wolfram.com/ProbabilityDensityFunction.html). Математический мир.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Probability_density_function&oldid=1204301029"
Скачать