НОУ ИНТУИТ | Лекция | Элементы математической статистики
Аннотация: Лекция посвящена описанию средств пакета MathCAD для решения основных задач математической статистики, в том числе методам генерации псевдослучайных последовательностей с заданным распределением, вычислению числовых характеристик случайных величин, определению закона распределения случайной величины.
Ключевые слова: значение, множества, вероятность, функция, дисперсия, среднеквадратичное отклонение, вектор, программа, меню, поле ввода, целое число, график, процент, сегменты
Цель лекции. Показать методику и инструменты MathCAD для работы со случайными величинами.
5.1. Функции для решения задач математической статистики
Случайной величиной (СВ) называется величина, которая в результате опыта может принять только одно из множества значений, причем заранее, до опыта, неизвестно, какое именно.
Случайная величина (СВ) может быть дискретной, в этом случае она принимает значение из дискретного числового множества M={1, 2, 3, 4, 5} [10,12]. Случайная величина может быть непрерывной, тогда принимает значения из непрерывного числового множества. Каждая СВ полностью определяется своей функцией распределения. Если X — СВ, возможные значения которой x1,x2,.. Функцией распределения F(x), или интегральным законом распределения, случайной величины X называется зависимость вероятности P выполнения неравенства X < х от возможных значений х
| ( 5.1) |
где P — вероятность.
Функция распределения СВ содержит о ней всю информацию, поэтому важно изучение и исследование функции распределения СВ, которую часто называют просто распределением.
Непрерывную СВ можно также задать, используя другую функцию — плотность распределения или плотность вероятности или дифференциальную функцию.
Плотностью распределения вероятностей непрерывной случайной величины X называется функция f(x), являющаяся первой производной от функции распределения F(x) — .
Из определения следует, что функция распределения является первообразной для плотности распределения. Если функция f(x) — плотность распределения непрерывной СВ, то для любых a < b
| ( 5.2) |
Зная плотность вероятности, можно найти функцию распределения [10,12].
Функции для генерации последовательности случайных величин (СВ)
Функции распределения случайной величины находятся в категории Probaility distribution; имена функций начинаются на p, далее следует сокращённое название закона. Например: – рассчитывает в точке x значение функции распределения вероятности для нормального закона с средним m и среднеквадратичным отклонением ppois (n,p) – рассчитывает в точке x значение функции распределения вероятности для закона Пуассона с параметром p.
Функции плотности распределения случайной величины находятся в категории Probability density; имена функций начинаются на d, далее следует сокращённое название закона. Например: dunif (x, a, b). – значение функции плотности вероятности в точке x для равномерного закона на интервале [a,b], a < b, — dpois (x,p) – значение функции плотности вероятности в точке x для закона Пуассона с параметром p.
Функции для расчёта числовых характеристик случайных величин. При решении практических задач важно числовые параметры СВ — количественные критерии, которые позволяют дать оценку наиболее существенным признакам случайной величины. К таким величинам относятся: математическое ожидание (или среднее), дисперсия, среднеквадратическое отклонение и т.д. [10, 12]. Функции для расчёта числовых характеристик находятся в категории Statistics
д. Здесь v — вектор значений случайной величины.Все функции приведены в приложении.
5.2. Генерация случайных чисел
При генерации программа создаёт последовательность псевдослучайных чисел. Псевдослучайные величины вырабатываются алгоритмически и представляют последовательность чисел, обладающих свойствами случайных чисел. Псевдослучайные числа связаны с некоторым задаваемым стартовым значением. Для того, чтобы поменять саму последовательность сгенерированных случайным датчиком чисел, в MathCAD предусмотрена возможность определения начального – стартового значения. В меню Tools/ Worksheet Options (Инструменты/ Опции листа), на вкладке Built-in Variables (Встроенные переменные) в поле ввода Seed value for random устанавливается начальное (стартовое) значение для генератора псевдослучайных чисел. Альтернативный способ: использование встроенной функции seed(x) прямо в документе:
intuit.ru/2010/edi»>seed(x) — функция установки нового начального значения для генератора псевдослучайных чисел, х — новое начальное значение для генератора псевдослучайных чисел (целое число от 1 до 2147483647) [3, 4].Равномерное распределение — распределение с постоянной вероятностью
Пример 5.1
Построим 8000 чисел равномерно распределенной СВ в интервале от 0 до 10 и ее график.
Используем функцию rnd(x) из категории Random numbers.
Функция rnd(x) генерирует равномерно распределенное случайное число между 0 и x . [4, 9].
Для генерации массива используем ранжированную переменную. MathCAD создает массив СВ в виде вектора, значения которого представляются в виде таблицы, 1 столбец которой – номер, 2 столбец — значение случайной величины. Если массив большой, чтобы просмотреть все значения СВ – надо щелкнуть по таблице и использовать линейку прокрутки.
Можно представить СВ в виде одномерной индексной переменной. На листинге решения (Рис.5.1) R – вектор случайной величины. График СВ построен на плоскости для индексной переменной и трехмерный для вектора R. Графики построены в виде точек.
— генерирует одно число, равномерно распределенное от 0 до x.
— равномерно распределенное случайное число в интервале [0;2]
— равномерно распределенное в интервале [0;3]
Рис. 5.1. Листинг решения примера 5.1. Графики СВ одномерной индндексной переменной Rk и матрицы R
Нормальное распределение
Пример 5.
2Построим 1000 элементов СВ, распределенных по нормальному закону со средним среднеквадратичным отклонением .
Для генерации используем функцию rnorm () из категории Random numbers.
Функция — генерирует вектор n независимых случайных чисел, каждое из которых имеет нормальное распределение с средним m и среднеквадратичным отклонением ;.
Функция rnorm() также создает массив СВ в виде вектора. . На листинге (Рис.5.2) NR – -вектор случайной величины. Как и в примере 5.1. построим график СВ на плоскости для индексной переменной в виде точек и линий и трехмерный точечный для матрицы NR.
intuit.ru/2010/edi»>увеличить изображение
Рис.
5.2. Листинг решения примера 5.2. Вектор СВ NR и графики вектора NR .на плоскости и в простанстве
Числовые характеристики
Рассчитаем числовые характеристики СВ: среднее, минимальное, максимальное значение, дисперсию, среднеквадратичное отклонение . Используем функции из категории Statistics.
Числовые характеристики СВ с равномерным распределением для примера 5.1 .
— среднее
— минимальное
— максимальное
— дисперсия
— среднеквадратичное отклонение
Числовые характеристики СВ с нормальным распределением для примера 5.
2
— среднее
— минимальное
— максимальное
— дисперсия
— среднеквадратичное отклонение
4.2.1. Лабораторная работа 1. Статистическое оценивание параметров плотности вероятности
Целью работы является изучение методики статистического оценивания параметров плотности вероятности, освоение инструментов системы MathCAD.
Порядок выполнения лабораторной работы
Лабораторная работа состоит из двух частей. Первая часть включает в себя выполнение заданий 1 и 2 и представляет собой контрольный пример, решение которого приведено ниже. Во второй части самостоятельно выполняется индивидуальное задание, включающее задания 3 и 4.
Задание 1
1.1. Получить с использованием системы MathCAD выборку объема N = 30 из генеральной совокупности, в которой случайная величина ξ имеет нормальную плотность вероятности с параметрами M = 0 и s = 2.
1.2. Найти точечные оценки математического ожидания, дисперсии, стандартного отклонения, а также стандартную ошибку оценки математического ожидания:
А) по данным малой выборки ;
Б) по данным большой выборки используя, возможности системы MathCAD.
Выполнение задания 1.1. Для выполнения задания необходимо запустить программу MathCAD, для чего следует в подменю Программы главного меню Пуск Панели задач найти группу MathSoft
Apps, которая содержит пункт MathCAD 2000 Professional либо более старшие версии MathCAD, именно он и запускает саму программу MathCAD. Если на рабочем столе экрана присутствует ярлык MathCAD (MCAD в некоторых версиях), то запуск MathCAD осуществляется с рабочего стола щелчками левой клавиши мыши. На экране появится чистый рабочий лист, над которым находится панель управления, причем первая, третья и четвертая строки аналогичны строкам редактора Word, например строка меню с пунктами File,Edit И т.
д. либо «Файл», «Правка» и т. д., если MathCAD руссифицирован, а также панель инструментов MathCAD во второй строке, содержащая различные меню: “Арифметика” для создания уравнений, меню простых операторов, меню создания графиков, меню работы с матрицами, меню для использования дифференциальных и интегральных соотношений, меню программирования, а также меню печати букв греческого алфавита. Четвертая строка панели служит для работы с текстами и позволяет печатать комментарии. Существует возможность загрузить ранее сохраненный рабочий лист, выбрав в меню
При обращении к этой функции образуется выборка случайных чисел Xi заданного объема, символ «:=» образуется при наборе символа «: », либо этот символ можно выбрать из меню простых операторов, индексация конкретного случайного числа образуется путем введения символа «[» после введения «Х». При этом следует учесть, что I Î [0,n-1] в силу специфики функции «Rnorm». Как видно из распечатки программы с комментариями на листе Документа 1, сначала задаются значения параметров N, M, s, после чего вводится функция «». Следует просмотреть некоторые значения выборки, используя выражение «Xi=», значение индекса I Необходимо задать конкретное. При введении символа «X=» система MathCAD выводит таблицу первых значений выборки и их номера, как это показано на странице, обозначенной как Документ 1. Для удаления ненужных символов в математических выражениях можно использовать клавишу [Bksp]. Для этого с помощью мыши курсор устанавливается правее символа, который нужно удалить.
Нажав [Bksp], удаляем ненужный символ.Выполнение задания 1.2. Задание 1.2 можно выполнить, если использовать оператор математического анализа на панели инструментов, обозначенный как (использование дифференциальных и интегральных соотношений), а также меню «Арифметика» и др. панели для ввода символов вида «S», «Ö», «/», возведение выражения в степень осуществляется с помощью символа «Ù». Формулы, используемые при выполнении задания 1.2, приведены в Документе 1, полученном путем распечатки программы MathCAD, снабженной соответствующими комментариями. Для ввода символов греческого алфавита используется меню «Символы греческого алфавита». При желании, для печати комментариев, можно использовать пункт меню «Вставка», далее «Текстовая область», после чего в текстовой рамке печатается комментарий. После набора текста вне текстовой рамки следует щелкнуть левой клавишей мыши, рамка исчезнет. Удаление символов осуществляется либо клавишей [Bksp] слева от курсора, либо [Del] справа от курсора.
Оценка математического ожидания выборки может быть получена с использованием функции «Mean( )» MathCAD. Используя функцию «Var( )», можно получить асимптотически несмещенную оценку дисперсии выборки случайной величины.
Задание 2
Найти доверительные интервалы для оценок математического ожидания, полученного в задании 1.2, соответствующие доверительной вероятности
β = 0,95.
Выполнение задания 2. Задача о нахождении доверительного интервала для математического ожидания случайной величины с нормальной плотностью вероятности решена в примере, который рассмотрен в разделе 3 п. 3.4 опорного конспекта. В расчетах следует использовать вычисленные при выполнении задания 1 значения точечных оценок математического ожидания. В Документе 2 приведен пример расчета доверительного интервала.
Задание 3
3.1. Смоделировать выборку случайной величины ξ , с нормальной плотностью вероятности с параметрами и σ.
Значения параметров и объема выборки следует выбрать в соответствии с последней цифрой шифра из табл.4.9 (случайное рассеивание возьмите равным предпоследней цифре шифра). Таблица 4.9
|
Послед-няя цифра шифра |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
, |
1; 0,4 |
1;0,5 |
2;0,5 |
2; 0,4 |
3;0,5 |
3; 0,6 |
5; 0,6 |
6; 0,7 |
7; 0,6 |
8; 0,7 |
|
30 |
29 |
28 |
27 |
30 |
29 |
28 |
27 |
30 |
29 |
3.
2. Выполнить с использованием системы MathCAD точечное и интервальное оценивание математического ожидания генеральной совокупности по данным выборки, полученной в п. 3.1. Значение доверительной вероятности возьмите равным 0,90.
Задание 4
По результатам выполнения заданий 1 и 2 сформулировать и обосновать выводы о том, как изменяется точность найденных параметров в зависимости от объема выборки.
Просмотр отдельных значений выборки случайной величины:
Х15 = 0,138; х23 = -0,49; Х29 = 1.785.
Оценка математического ожидания выборки вычисляется по формуле:
M1 = , получим M1 = 0,17.
Оценка математического ожидания выборки с Использованием функции MathCad осуществляется командой M1 = Mean(X ). В результате получим значение M1 = 0,17, совпадающее с предыдущим значением.![]()
Несмещенная оценка дисперсии и среднего квадратического отклонения выборки будут таковы:
D = , D = 2,84; σ = , σ = 1,685.
| < Предыдущая | Следующая > |
|---|
Дисперсия Matlab | Как работает дисперсия в Matlab?
Matlab предоставляет пользователю различные функциональные возможности; в дисперсии Matlab мы можем вернуть первый элемент массива, размер которого не равен 1. В основном дисперсия используется для финансовых временных рядов. Дисперсия, которую мы можем использовать в многомерном массиве, чтобы вернуть первый элемент массива, который не равен 1 как вектор. Если мы заметим, что массив является вектором, то мы можем рассматривать дисперсию как скаляр. По умолчанию размер дисперсии равен 1. Если у нас есть матрица, в которой каждый столбец является случайной величиной, а все строки, наблюдаемые в это время, представляют собой вектор-строку, содержащий дисперсию, которая соответствует каждому столбцу матрицы.
Синтаксис:
Существует несколько вариантов синтаксиса, как показано ниже.
дисперсия = var (массив)
дисперсия = var (массив, вес)
дисперсия = var (массив, вес, все)
дисперсия = var (массив, вес, размер)
Пояснение
3 9 выше синтаксиса, мы используем различные параметры следующим образом.
В первом синтаксисе мы указываем, что дисперсия равна массиву, что означает, что возвращается первое измерение массива, размер которого не равен 1. Если массив находится в состоянии наблюдения, то дисперсия является скалярной.
В синтаксисе мы передаем два параметра: массив и вес; если вес = 0, то нормируется дисперсия, и для этого требуется -1 наблюдение, а если вес = 1, то дисперсия нормируется по номеру наблюдения. По сути, вес — это вектор, и он содержит неотрицательные элементы.
В третьем синтаксисе мы передаем три разных параметра, таких как массив, вес и все остальное, как показано в приведенном выше синтаксисе.
Здесь all используется для вычисления элемента all, когда вес равен 0 или 1, и этот синтаксис подходит только для определенных версий Matlab.
В четвертом синтаксисе мы передаем три разных параметра: массив, вес и размерность. В этом синтаксисе мы передаем массив с весом и размером. Он используется для поддержания нормализации размеров массива.
Как работает дисперсия в Matlab?
Теперь давайте посмотрим, как работает дисперсия в Matlab.
Теперь давайте посмотрим, какие входные аргументы необходимы для дисперсии, как показано ниже.
В качестве входных данных используются разные параметры. Во-первых, это массив. Массив может быть вектором, может быть матрицей или может быть многомерным массивом, и он использует одиночные или двойные типы данных.
Следующим входным параметром является этот вес, и мы можем указать либо 0, либо 1; когда вес равен 0, то требуемое количество наблюдений равно -1, а когда вес равен 1, то это необходимое количество наблюдений.
Он также использует тип данных single или double.
Следующий параметр — это размерность. Используя размерность, мы можем указать положительный целочисленный скаляр. Предположим, что для измерения нет значения, тогда оно принимает значение по умолчанию для измерения массива. Он использует типы данных single, double, int8 и int16 и т. д.
Следующий входной параметр — размер вектора; он также указывает положительный целочисленный вектор и представляет входной массив каждого измерения. Длина выходного параметра равна 1, и она остается неизменной для других измерений.
Следующий входной параметр — это порт сброса. Порт сброса используется для указания транзакции, которая вызывает прерывание во время выполнения для сброса текущей дисперсии. Обычно время RST всегда является положительным целым числом.
Теперь давайте посмотрим на выходной аргумент для дисперсии следующим образом.
Если опция Running variance не выбрана, блок вычисляет дисперсию в каждой строке или столбце ввода или вдоль векторов данного входного измерения.
Он также имеет возможность вычислить дисперсию полного ввода в каждом периоде выборки. Дисперсия связанного столбца, строки или полного ввода представлена каждым элементом выходного массива y. Параметр Find the variance value over определяет размер выходного массива y.
Существуют и другие свойства, которые мы также можем учитывать, когда нам нужно выполнить дисперсию в Matlab.
Примеры
Теперь давайте посмотрим на различные примеры дисперсии в Matlab для лучшего понимания следующим образом. Давайте посмотрим, как мы можем реализовать дисперсию в матрицах следующим образом.
Во-первых, нам нужно создать матрицу, используя следующую инструкцию.
М = [3 -9 2; 2 6 -4; 1 4 5];
Объяснение
Используя приведенное выше утверждение, мы создали матрицу 1 на 3. Теперь выполните следующую инструкцию, чтобы вычислить дисперсию матрицы следующим образом.
var(M)
Объяснение
Конечный результат, который мы проиллюстрировали с помощью следующего снимка экрана, выглядит следующим образом.
Теперь давайте посмотрим, как мы можем вычислить дисперсию для весовых векторов следующим образом.
Во-первых, нам нужно создать матрицу, используя следующую инструкцию следующим образом.
М = [3 -1 8; 4 5 7; -2 2 3];
вм = [0,4 0,15 0,15];
вар(M.wm)
Пояснение
С помощью приведенного выше оператора мы создали матрицу, а также предоставили вес для вычисления дисперсии по отношению к весу. После этого мы пишем оператор var для вычисления дисперсии матрицы, как показано в приведенном выше примере. Окончательный результат, который мы проиллюстрировали с помощью следующего снимка экрана, выглядит следующим образом.
Теперь давайте посмотрим, как мы можем указать размер дисперсии следующим образом.
М = [2 -3 4; 8 4 3];
вар(М,1,2)
Объяснение
В приведенном выше примере мы сначала создали матрицу, а затем указываем вес с размерностью, как показано в приведенном выше примере, здесь мы присваиваем весу 1.
Окончательный результат мы проиллюстрировали с помощью следующий скриншот выглядит следующим образом.
Когда мы указываем, что вес равен 0, то видим вывод следующим образом.
Таким образом, здесь мы можем выполнять различные операции с помощью различных входных параметров с дисперсией, здесь мы также можем выполнять различные операции в соответствии с нашими требованиями к финансовым рядам.
Заключение
Мы надеемся, что из этой статьи вы узнали дисперсию Matlab. Из приведенной выше статьи мы узнали основной синтаксис вариации, а также видим различные примеры вариации. Из этой статьи мы узнали, как и когда мы используем дисперсию Matlab.
Рекомендуемые статьи
Это руководство по Matlab Variance. Здесь мы обсуждаем определение, синтаксис, как работает дисперсия в Matlab? примеры с реализацией кода. Вы также можете ознакомиться со следующими статьями, чтобы узнать больше –
- Матлаб впа
- Булево значение Matlab
- Модификация Matlab
- Комментарий блока Matlab
Дисперсия вектора задержки (DVV) MATLAB Toolbox ∴ Dr.
Danilo P. MandicВведение
Метод дисперсии вектора задержки (DVV) использует предсказуемость сигнала в фазовом пространстве для характеристики временного ряда. Используя методологию суррогатных данных, так называемые графики DVV и диаграммы рассеяния DVV могут быть сгенерированы с использованием метода DVV в качестве тестовой статистики для одновременного изучения детерминизма/стохастичности и линейности/нелинейности сигнала. На диаграмме рассеяния DVV целевые значения дисперсии исходного сигнала нанесены на график относительно усредненных значений дисперсии, рассчитанных по ряду суррогатов iAAFT. В результате для линейных сигналов диаграмма рассеяния совпадает с биссектрисой и, наоборот, для нелинейных сигналов диаграмма рассеяния отклоняется от биссектрисы, как показано в прикрепленном документе. Метод DVV успешно применяется для анализа характера биометрических сигналов (ЭЭГ и фМРТ).
Набор инструментов DVV
Предоставляется набор инструментов DVV для MATLAB, который можно загрузить в виде zip-архива.
Код предоставляется под Стандартной общественной лицензией GNU (GPL).
- Дисперсия вектора задержки (DVV) MATLAB Toolbox (zip)
- Также доступна документация по набору инструментов.
Благодарности: Тэмуджин Гаутама, Марк Ван Халле, Мо Чен, Навид Ур Рехман
Дополнительная литература + ссылки
- Т. Гаутама, Д.П. Мандич и М. М. Ван Халле, 9 лет.0007 «Метод дисперсии вектора задержки для обнаружения детерминизма и нелинейности во временных рядах», Physica D, vol. 190, нет. 3-4, стр. 167-176, 2004. [pdf]
- Т. Гаутама, Д.П. Мандич и М.М. Van Hulle, «Признаки нелинейных структур в электрической активности мозга», Phys. Преп. E, том. 67, 2003. [pdf]
- Т. Гаутама, Д.П. Мандич и М.М. Van Hulle, «Нелинейность сигнала в фМРТ: сравнение BOLD и MION», IEEE Transactions in Medical Imaging, vol. 22, 2003. [pdf]
- Д.П. Мандич, М. Чен, Т. Гаутама, М.

