Library
|
Your profile |
Cybernetics and programming
Reference:
Golik F.V.
Pearson distributions of sum of single distributed independent random variables.
// Cybernetics and programming.
2017. № 2.
P. 17-41.
DOI: 10.7256/2306-4196.2017.2.22583 URL: https://en.nbpublish.com/library_read_article.php?id=22583
Pearson distributions of sum of single distributed independent random variables.
DOI: 10.7256/2306-4196.2017.2.22583Received: 05-04-2017Published: 28-05-2017Abstract: The article is devoted to working out the constructive method of approximation the sum of independent random variables with the same distribution by Pearson curves. The summation theory was and still is one of the key parts of the theory of probability. The limiting theorems are proven within this theory, and they allow one to understand which frequencies may be used for the approximation for the sum so random values with large m. At the same time the approximation error is evaluated by the admissible error. However, in most practical cases the number of the summed values is not large, so the admissible error evaluation may not be sufficiently precise. The purpose of the study is to develop a constructive method for the approximation of the frequency function for the spread of the final sum of the independent random values with the same frequency. The Pearson curves are then used as approximative frequencies. Such an approximation lacks the defects related to the application of limiting theorems. It is applicable for any number of summed accidental frequencies m>1. The calculated ratios for the initial moments of the final sum of independent random variables are obtained. It is shown that the parameters of the Pearson curves for the sum m of random variables are related by simple ratios with the corresponding parameters of the summed value. The solution used in order to achieve the goal is based upon the moments method. Thе author offers a recursion formula for calculating the starting moments of for the sum of independent random values, allowing to find the central moments of the sum, as well as the parameters for the Pearson curves. It is proven that there's a dependency between the distance from the point of The exact expression for the distance from the point, corresponding to the distribution of the sum of the random variables in the coordinate system of Pearson parameters to the point (0, 3), corresponding to the normal distribution is found. By the distance value, one can indirectly assess the possibility of applying normal approximation. The author studies the possibility for the approximation of Pearson curves with normal distribution. An approximate formula for estimating the error in approximating the sum of random variables by normal distribution is given. The author provides examples of approximations for the distribution of the sum of random variables are found, which are often met in statistical radio engineering tasks. The reference materials include complete formulae for the key types of Pearson curves. All the obtained results are applicable for any random variables having finite first four initial moments. The correctness of the conclusions is confirmed by numerical calculations performed in the MathCad program. Keywords: random variable, Pearson curve, density function, moments of a random variable, normal distribution, sum of random variables, recursive algorithm, probability measure, approximation error, method of the momentsВведение Исследование вероятностных характеристик сумм независимых случайных величин на протяжении длительного времени является одной из ключевых проблем теории вероятностей. И до сих пор анализу различных стохастических эффектов суммы случайных величин посвящается большое число исследований. Исторически интерес к схеме суммирования появился в связи с созданием и развитием теории ошибок измерений, когда возникло понимание, что ошибки наблюдения некоторой величины формируются под влиянием многих факторов. При этом предполагается, что вклады этих факторов в результат измерения малы и аддитивны, а сами факторы действуют независимо. В рамках этих допущений разработаны классическая и современная теории предельных теорем для сумм независимых случайных величин. Предельные теоремы указывают на возможную аппроксимацию и дают погрешность приближения в виде неравенств. Такие результаты обычно достаточны для решения практических задач, связанных с оценкой погрешности измерения. Однако существует множество задач, в которых число суммируемых величин конечно. В этом случае оценка погрешности аппроксимации оказывается недостаточно точной. Поэтому задачи с конечным числом суммируемых случайных величин решаются путем непосредственного нахождения законов распределения прямыми методами, а предельные теоремы используются в качестве подтверждения правильности полученного результата. Известно [1, с. 89], что распределение суммы независимых случайных величин можно найти одним из следующих способов: 1) путем вычисления свертки распределений отдельных слагаемых; 2) через характеристические функции; 3) с помощью моментов. Первые два похода дают точное решение. Однако чаще всего они сопряжены со значительными вычислительными трудностями. Исключение составляют лишь безгранично делимые распределения, перечень которых ограничен. Метод моментов дает приближенный результат, то есть некоторую аппроксимацию распределения суммы случайных величин. Но при этом расчеты сводятся к достаточно простым вычислениям. Аппроксимация в этом случае выполняется с помощью: 1) полиномов, 2) нормального распределения с поправками в виде полинома (метод Крамера) или производных от нормальной плотности распределения (ряды Шарлье), 3) кривых Пирсона. Методы Шарлье и Крамера пригодны лишь для приближенно нормальных распределений. Полиномиальная аппроксимация не имеет связи с природой случайной величины. Метод Пирсона лишен этих недостатков. Система кривых Пирсона достаточно универсальна. Существует простой алгоритм определения типа кривой [2, с. 65]. Эти обстоятельства и определили выбор метода аппроксимации, реализованный в настоящей работе. Целью исследования является разработка конструктивного метода аппроксимации кривыми Пирсона распределения вероятностей конечной суммы независимых одинаково распределенных случайных величин. В ходе работы над статьей выяснилось, что, несмотря на обилие литературы, найти полное и точное описание уравнений кривых Пирсона не просто. Например, в [1, с. 133] приведены уравнения кривых, а параметры рекомендуется находить через решение вспомогательных уравнений. В других источниках ограничиваются ссылкой на результаты исследования У. Элдертона (W. Elderton), опубликованные в 1938 г. В этой связи считаем целесообразным привести точные и полные (с параметрами) уравнения кривых Пирсона основных типов. Моменты суммы одинаково распределенных независимых случайных величин Для определения параметров кривых Пирсона необходимо знание центральных моментов суммы случайных величин. Рассмотрим процедуру их расчета через начальные моменты. Начальные моменты где Основная трудность, возникающая при вычислениях моментов, связана с необходимостью раскрытия суммы В общем случае при Искомые начальные моменты суммы случайных величин найдем, усреднив выражения (1)…(3). Так, для начального момента Здесь угловыми скобками обозначена операция математического ожидания, а Очевидно, что при При решении задачи аппроксимации законов распределения методом моментов, используются центральные моменты, связанные с начальными соотношением [1]: где В дальнейшем нам понадобятся моменты не выше четвертого порядка, которые удобней рассчитывать по развернутым формулам: Подставив в формулы (8…10) выражения для начальных моментов из (4) и (6) с учетом (5) получим более простые соотношения для центральных моментов суммы Здесь Кривые Пирсона Кривые Пирсона (распределения Пирсона) широко используются при аппроксимации распределений случайных величин. Они позволяют аппроксимировать практически все известные статистические распределения. Пирсон предложил для описания статистического распределения случайной величины использовать решения дифференциального уравнения [3, с. 63]: Коэффициенты в уравнении (11) могут быть вычислены с помощью центральных моментов. Они находятся из соотношений: где Дискриминант знаменателя в уравнении (11) равен: где Общий интеграл уравнения (11) зависит от вида корней квадратного уравнения В табл. 1 приведены типы кривых Пирсона и соответствующие им критерии, а так же границы области кривых Пирсона. Граница 1 – это верхняя граница всех распределений, а граница 0 – граница кривых Пирсона. Таблица 1
На рис. 1 приведен график областей кривых Пирсона, построенный по уравнениям, приведенным в [2, с. 278]. Рис. 1 График для определения типа кривой Пирсона в зависимости от Область кривых типа I состоит из смежных областей типа I(U) (U-образные кривые плотности распределения) и типа I(J) (J-образные кривые). Точка с координатами (0;3) соответствует нормальному распределению. Параметры и характеристики кривых Пирсона для суммы случайных величин Найдем коэффициенты Коэффициенты Здесь где Подставив в (15) выражения (16, 17) получим формулу для критерия Аналогично преобразуем формулы для дополнительных параметров: Таким образом, коэффициенты При выборе распределения обычно представляет интерес информация о том, насколько сильно аппроксимирующее распределение отличается от нормального и нельзя ли нормальное распределение использовать для аппроксимации. Косвенно о близости распределений можно судить по расстоянию в системе координат После подстановки в эту формулу выражений (16), (17) получим: Можно показать, что точки В заключение отметим, что все расчетные соотношения этого параграфа получены для суммы независимых одинаково распределенных случайных величин и справедливы для любого исходного распределения с конечными начальными моментами На рис. 2 и 3 для примера приведены результаты расчета для суммы независимых случайных величин Рис. 2. Траектория точек Рис. 3. Характеристики суммы случайных величин, распределенных по закону Фишера: а) зависимость типа кривой Пирсона от количества Примечание. На рис. 2а номера типов кривых обозначены латинскими, а не римскими цифрами вследствие ограничений, накладываемых программой MathCad, в которой проводились расчеты. Рисунок 2 позволяет визуально оценить тип аппроксимирующего распределения в зависимости от Аппроксимация нормальным распределением Функции распределения Пирсона практически всех типов выражаются через специальные функции и не табулированы. При этом квантили приходится находить численными методами. Это затрудняет решение многих прикладных задач, особенно связанных с проверкой статистических гипотез. Ситуация существенно упрощается, если в качестве аппроксимирующего распределения используется нормальное. Предпосылкой для такого решения служит тот факт, что расстояние Оценка точности приближения одних случайных величин другими определяется расстоянием между ними в предварительно заданной вероятностной метрике. В настоящей работе в качестве метрики выбрано расстояние полной вариации Привлекательность Расстояние полной вариации задается соотношением: где В нашем случае плотности распределения существуют и Здесь Примечание. В социологии и экономике для оценки структурных сдвигов совокупностей используют дискретный аналог формулы (24), который называют индексом Лузмора-Хэнби [5]. Численные расчеты где Отметим, что выражение (25) с точностью до постоянного множителя совпадает с границей неравенства Бери-Эссеена [6, с. 155]. Некоторые плотности распределения Пирсона заданы в интервале ограниченной длины. В этом случае важным критерием качества аппроксимации является вероятность Очевидно, что вероятность Далее приведены уравнения основных типов кривых Пирсона и примеры распределения суммы случайных величин, чаще всего встречающихся в задачах статистической радиотехники. Кривая I типа Ограничение: κ < 0. Уравнение: Примечание. В дальнейшем для сокращения записи в формулах не указывается область нулевых значений плотности вероятности. Если приводится функция с указанием ограничений ее аргумента, то это означает, что в области, где ограничения не выполняются, функция тождественно равна нулю. Параметры: при Нормирующий множитель Коэффициенты Пример 1 Квадрат нормальной случайной величины Плотность распределения [7, с. 105]: Примечание. В формуле (3.10) [7, с. 105] допущена опечатка: в показателе степени экспоненты вместо y2 следует читать y. Рис. 4 Графики плотности распределения Начальные моменты рассчитываются численно в среде MathCad: Рис. 5 Области кривых Пирсона: а) Распределение типа I. При Пример 2 Квадрат случайной величины с равномерным распределением Плотность распределения можно найти по общей формуле распределения квадрата случайной величины, приведенной в [7, с. 107]. Плотность вероятностей квадрата равномерно распределенной случайной величины зависит от соотношения между границами интервала Рис. 6 Графики плотности распределения: а) Можно показать, что начальные моменты равны: Рис. 7 Области кривых Пирсона: а) Распределение типа I(J) с переходом в I. Пример 3 Распределение Релея Распределение огибающей узкополосного нормального процесса. Плотность распределения [7, с. 423] Рис. 8 Графики плотности распределения Релея Начальные моменты [7, с. 97] Рис. 9 Области кривых Пирсона: а) Распределение типа I. Параметры Пример 4 Распределение Релея-Райса(Обобщенное распределение Релея [7, с.123]) Распределение огибающей суммы узкополосного нормального процесса и гармонического сигнала. Плотность распределения [7, с. 121] где Рис. 10 Графики плотности распределения Релея-Райса Начальные моменты [7, с. 424] где Рис. 11 Области кривых Пирсона: Распределение типа I. Пример 5 Распределение Накагами ( Распределение огибающей гармонического сигнала со случайной амплитудой и фазой [8, с. 59]. Плотность распределения Частные случаи:
Рис. 12 Графики плотности распределения Накагами. Начальные моменты Рис. 13 Области кривых Пирсона: Распределение типа I. Кривая II типа Ограничения: Параметры:
Коэффициент Пример 6 Распределение арксинуса По закону арксинуса распределено гармоническое колебание Плотность распределения [8, с. 184] Рис. 14 График плотности распределения арксинуса Можно показать, что первые четыре начальных момента равны Рис. 15 Области кривых Пирсона Сумма случайных величин аппроксимируется кривой типа II. Погрешность аппроксимации ( Примечание. В [9, с. 80] приведена формула для плотности распределения суммы гармонических колебаний с неодинаковыми амплитудами и случайными равномерно распределенными фазами. Пример 7 Распределение гармонического сигнала со случайной амплитудой и фазой Случайный сигнал Плотность распределения мгновенного значения сигнала Рис. 16 Графики плотности распределения Можно показать, что начальные моменты равны: Рис. 17 Области кривых Пирсона Погрешность аппроксимации ( Пример 8 Распределение суммы гармонического сигнала со случайной начальной фазой и нормального шума Сумма Плотность распределения нормированной по где Рис. 18 Графики плотности распределения Начальные моменты рассчитываются численно по формуле Рис. 19 Области кривых Пирсона: а) Пример 9 Равномерное распределение Плотность распределения Рис. 20 График плотности равномерного распределения Начальные моменты [1, с. 117] Рис. 21 Области кривых Пирсона Погрешность аппроксимации ( Кривая III типа. Ограничения: Параметры:
Пример 10 Гамма-распределение Плотность распределения [1, с. 121] Частные случаи: при при при при При фиксированном Рис. 22 Графики плотности гамма-распределения: а) 1 - показательное распределение с параметрами Начальные моменты [1, с. 121]: Рис. 23 Области кривых Пирсона: а) показательное распределение с параметрами Кривая IV типа где Знак параметра Кривая V типа Параметры Кривая VI типа Здесь
Пример 11 Распределение Вейбулла Описывает случайную наработку до отказа, при которой интенсивность отказов пропорциональна времени. Плотность распределения Стандартная форма плотности распределения при
Рис. 24 Графики плотности распределения Вейбулла, Начальные моменты Рис. 25 Области кривых Пирсона Распределение типа VI. Кривая VII типа Параметры: Распределение симметрично относительно Заключение Получены расчетные соотношения (4) для начальных моментов суммы независимых случайных величин. Показано, что параметры Приведено точное выражение для расстояния Получена приближенная формула (25) для оценки погрешности аппроксимации суммы Приведены точные и полные уравнения кривых Пирсона. В качестве примеров найдены аппроксимации распределения суммы случайных величин, часто встречающихся в задачах статистической радиотехники. Все полученные результаты применимы для любых случайных величин, имеющих конечные первые четыре начальных момента. Корректность выводов подтверждена численными расчетами. Результаты настоящей работы могут найти применение при исследовании и проектировании каналов связи с
References
1. Spravochnik po teorii veroyatnostei i matematicheskoi statistike/ V. S. Korolyuk, N. I. Portenko, A. V. Skorokhod, A. F. Turbin. – M.: Nauka. Gl. red. fiz.-mat. lit., 1985. – 640 s.
2. Tablitsy matematicheskoi statistki/ Bol'shev L. N., Smirnov N. V.-M.: Nauka. Gl. red. fiz.-mat. lit.. 1983. – 416 s. 3. Ryzhikov Yu. I. Upravlenie zapasami. – M.: Nauka. Gl. red. fiz.-mat. lit., – 1969.-344 s. 4. Zolotarev V. M. Sovremennaya teoriya summirovaniya nezavisimykh sluchainykh velichin. – M.: Nauka. Gl. red. fiz.-mat. lit., 1986. – 416 s. 5. Kazinets L.S. Tempy rosta i strukturnye sdvigi v ekonomike (Pokazateli planirovaniya i analiza).-M.: Ekonomika, 1981. 6. Petrov V. V. Summy nezavisimykh sluchainykh velichin. – M.: Nauka. Gl. red. fiz.-mat. lit., 1972. – 416 s. 7. Levin B. R. Teoreticheskie osnovy statisticheskoi radiotekhniki, kn. 1. – M.: Sov. radio, 1966. – 728 s. 8. Tikhonov V. I. Statisticheskaya radiotekhnika. – M.: Sov. radio, 1966. – 680 s. 9. Levin B. R. Teoreticheskie osnovy statisticheskoi radiotekhniki. – 3-e izd. pererab. i dop. – M.: Radio i svyaz', 1986. – 656 s.: il.: ISBN 5-256-00264-3. 10. Mtropol'skii A. K. Tekhnika statisticheskikh vychislenii. – M.: Nauka. Gl. red. fiz.-mat. lit., 1971.-576 s. |