Расчет дисперсии в microsoft excel

Как работает стандартное отклонение в Excel


      Добрый день!

     В статье я решил рассмотреть, как работает стандартное отклонение в Excel с помощью функции СТАНДОТКЛОН. Я просто очень давно не описывал и не комментировал статистические функции, а еще просто потому что это очень полезная функция для тех, кто изучает высшую математику.

А оказать помощь студентам – это святое, по себе знаю, как трудно она осваивается.

В реальности функции стандартных отклонений можно использовать для определения стабильности продаваемой продукции, создания цены, корректировки или формирования ассортимента, ну и других не менее полезных анализов ваших продаж.

В Excel используются несколько вариантов этой функции отклонения:

  • Функция СТАНДОТКЛОНА – вычисляется отклонение по выборке текстовых и логических значений. При этом ложные логические и текстовые значения формула приравнивает к 0, а 1 будут равняться только истинные логические значения;
  • Функция СТАНДОТКЛОН.В – производит оценку стандартного отклонения по выборке, при этом текстовые и логические значения игнорирует;
  • Функция СТАНДОТКЛОН.Г – делает оценку отклонения по некой генеральной совокупности и как в предыдущей функции игнорируются текстовые и логические значения;
  • Функция СТАНДОТКЛОНПА – также вычисляет по генеральной совокупности стандартное отклонение, но с учетом текстовых и логических значений. Равняться 1 будут только истинные логические значения, а ложные логические и текстовые значения будут приравнены к 0.

Математическая теория

      Для начала немножко о теории, как математическим языком можно описать функцию стандартного отклонения для применения ее в Excel, для анализа, к примеру, данных статистики продаж, но об этом дальше. Предупреждаю сразу, буду писать очень много непонятных слов… )))), если что ниже по тексту смотрите сразу практическое применение в программе.

     Что же собственно делает стандартное отклонение? Оно производит оценку среднеквадратического отклонения случайной величины Х относительно её математического ожидания на основе несмещённой оценки её дисперсии. Согласитесь, звучит запутанно, но я думаю учащиеся поймут о чём собственно идет речь!

     Теперь можно дать определение и стандартному отклонению – это анализ среднеквадратического отклонения случайной величины Х сравнительно её математической перспективы на основе несмещённой оценки её дисперсии. Формула записывается так:      Отмечу, что все две оценки предоставляются смещёнными. При общих случаях построить несмещённую оценку не является возможным. Но оценка на основе оценки несмещённой дисперсии будет состоятельной.

Практическое воплощение в Excel

     Ну а теперь отойдём от скучной теории и на практике посмотрим, как работает функция СТАНДОТКЛОН. Я не буду рассматривать все вариации функции стандартного отклонения в Excel, достаточно и одной, но в примерах. А для примера рассмотрим, как определяется статистика стабильности продаж.

      Для начала посмотрите на орфографию функции, а она как вы видите, очень проста:

        =СТАНДОТКЛОН.Г(_число1_;_число2_; ….), где:

Число1, число2, … — являют собой генеральную совокупность значений и имеют только числовые значения или же ссылки на них. Формула поддерживает до 255 числовых значений.

      Теперь создадим файл примера и на его основе рассмотрим работу этой функции.

     Так как для проведения аналитических вычислений необходимо использовать не меньше трёх значений, как в принципе в любом статистическом анализе, то и я взял условно 3 периода, это может быть год, квартал, месяц или неделя. В моем случае – месяц.

Для наибольшей достоверности рекомендую брать как можно большое количество периодов, но никак не менее трёх. Все данные в таблице очень простые для наглядности работы и функциональности формулы.

    Для начала нам необходимо посчитать среднее значение по месяцам. Будем использовать для этого функцию СРЗНАЧ и получится формула: =СРЗНАЧ(C4:E4).       Теперь собственно мы и можем найти стандартное отклонение с помощью функции СТАНДОТКЛОН.Г в значении которой нужно проставить продажи товара каждого периода.

Получится формула следующего вида: =СТАНДОТКЛОН.Г(C4;D4;E4).      Ну вот и сделана половина дел. Следующим шагом мы формируем «Вариацию», это получается делением на среднее значение, стандартного отклонения и результат переводим в проценты.

Получаем такую таблицу:        Ну вот основные расчёты окончены, осталось разобраться как идут продажи стабильно или нет. Возьмем как условие что отклонения в 10% это считается стабильно, от 10 до 25% это небольшие отклонения, а вот всё что выше 25% это уже не стабильно.

Для получения результата по условиям воспользуемся логической функцией ЕСЛИ и для получения результата напишем формулу:

                =ЕСЛИ(H4

Расчет дисперсии, среднеквадратичного (стандартного) отклонения, коэффициента вариации в Excel

Проведение любого статистического анализа немыслимо без расчетов. В это статье рассмотрим, как рассчитать дисперсию, среднеквадратичное отклонение, коэффиент вариации и другие статистические показатели в Excel.

Максимальное и минимальное значение

Начнем с формул максимума и минимума. Максимум – самое большое значение из анализируемого набора данных, минимум – самое маленькое. Это крайние значения в совокупности данных, обозначающие границы их вариации. Например, минимальные/максимальные цены на что-нибудь, выбор наилучшего или наихудшего решения задачи и т.д.


Для расчета этих показателей есть специальные функции — МАКС и МИН соответственно. Доступ есть прямо из ленты, в выпадающем списке авосумммы.

Если использовать вставку функций, то следует обратиться к категории «Статистические».

В общем, для вызова функции максимума или минимума действий потребуется не больше, чем для расчета средней арифметической.

Среднее линейное отклонение

Среднее линейное отклонение представляет собой среднее из абсолютных (по модулю) отклонений от средней арифметической в анализируемой совокупности данных. Математическая формула имеет вид:

где

a – среднее линейное отклонение,

X – анализируемый показатель,

X̅ – среднее значение показателя,

n – количество значений в анализируемой совокупности данных.

В Эксель эта функция называется СРОТКЛ.

После выбора функции СРОТКЛ указываем диапазон данных, по которому должен произойти расчет. Нажимаем «ОК».

Среднеквадратичное отклонение

Среднеквадратичное отклонение (СКО) – это корень из дисперсии. Этот показатель также называют стандартным отклонением и рассчитывают по формуле:

по генеральной совокупности

по выборке

Можно просто извлечь корень из дисперсии, но в Excel для среднеквадратичного отклонения есть готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).

Стандартное и среднеквадратичное отклонение, повторюсь, — синонимы.

Далее, как обычно, указываем нужный диапазон и нажимаем на «ОК». Среднеквадратическое отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными. Об этом ниже.

Коэффициент вариации

Все показатели, рассмотренные выше, имеют привязку к масштабу исходных данных и не позволяют получить образное представление о вариации анализируемой совокупности.

Для получения относительной меры разброса данных используют коэффициент вариации, который рассчитывается путем деления среднеквадратичного отклонения на среднее арифметическое.

Формула коэффициента вариации проста:

Для расчета коэффициента вариации в Excel нет готовой функции, что не есть большая проблема. Расчет можно произвести простым делением стандартного отклонения на среднее значение. Для этого в строке формул пишем:

=СТАНДОТКЛОН.Г()/СРЗНАЧ()

Коэффициент вариации обычно выражается в процентах, поэтому ячейку с формулой можно обрамить процентным форматом. Нужная кнопка находится на ленте на вкладке «»:

Изменить формат также можно, выбрав «Формат ячеек» из контекстного меню после выделения нужной ячейки и нажатия правой кнопкой мышки.


Коэффициент вариации, в отличие от других показателей разброса значений, используется как самостоятельный и весьма информативный индикатор вариации данных. В статистике принято считать, что если коэффициент вариации менее 33%, то совокупность данных является однородной, если более 33%, то – неоднородной.

Эта информация может быть полезна для предварительного описания данных и определения возможностей проведения дальнейшего анализа. Кроме того, коэффициент вариации, измеряемый в процентах, позволяет сравнивать степень разброса различных данных независимо от их масштаба и единиц измерений. Полезное свойство.

Коэффициент осцилляции

Еще один показатель разброса данных на сегодня — коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.

Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.

В целом, с помощью Excel многие статистические показатели рассчитываются очень просто. Если что-то непонятно, всегда можно воспользоваться окошком для поиска во вставке функций. Ну, и Гугл в помощь.

А сейчас предлагаю посмотреть видеоурок.

Легкой работы в Excel и до встречи на блоге statanaliz.info.

Значения показателя VAR в инвестиционном анализе

CV – показатель, который можно считать более универсальным, чем дисперсия или среднее квадратичное отклонение: на его основе можно сопоставлять риски и доходности двух и более активов, существенно отличающихся друг от друга.

Нормативного значения этого показателя не существует. Однако имеются некоторые опорные критерии, которые помогают при его анализе и интерпретации.

Таблица 2. Значения Coefficient of variation

Значение VAR

Интерпретация

До 10%

Степень риска – несущественна; вложения крайне желательны.

10-20%

Средняя степень риска.

20-30%

Высокая степень риска.

Более 30%

Модель крайне неустойчива, инвестиции не обоснованы.

Важный момент! Коэффициент CV имеет несколько недостатков – он не учитывает величины первоначальных вложений, предполагает симметричность разбросанных значений по отношению к среднему, а также не может использоваться для опционов, доходность которых может быть меньше 0. Оттого при наличии сомнений стоит дополнительно использовать показатели IRR и NPV.

Свойства дисперсии

Свойство 1. Дисперсия постоянной величины A равна (нулю).

D(A) = 0

Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.

D(AX) = А2 D(X)

Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.

D(A + X) = D(X)

Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.

D(X+Y) = D(X) + D(Y)

Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.


D(X-Y) = D(X) + D(Y)

Примеры методов анализа числовых рядов в Excel

Смысл данной функции становится предельно ясен после рассмотрения примера. Допустим, на протяжении суток каждые 3 часа фиксировались показатели температуры воздуха. Был получен следующий ряд значений: 16, 14, 17, 21, 25, 26, 22, 18. С помощью функции СРЗНАЧ можно определить среднее значение температуры – 19,88 (округлим до 20). Для определения отклонения каждого значения от среднего необходимо вычесть из него полученное среднее значение. Например, для первого замера температуры это будет равно 16-20=-4. Получаем ряд значений: -4, -6, -3, 1, 5, 6, 2, -2. Поскольку СРОТКЛ по определению работает с модулями отклонений, итоговый ряд значений имеет вид: 4, 6, 3, 1, 5, 6, 2, 2. Теперь нужно получить среднее значение для данного ряда с помощью функции СРЗНАЧ – примерно 3,63. Именно таков алгоритм работы рассматриваемой функции.

Таким образом, значение, вычисляемое функцией СРОТКЛ, можно рассчитать с помощью формулы массива без использования этой функции. Допустим, перечисленные результаты замеров температур записаны в столбец (ячейки A1:A8). Тогда для определения среднего значения отклонений можно использовать формулу =СРЗНАЧ(ABS(A1:A8-СРЗНАЧ(A1:A8))). Однако, рассматриваемая функция значительно упрощает расчеты.

Пример 1. Имеются два ряда значений, представляющих собой результаты наблюдений одного и того же физического явления, сделанные в ходе двух различных экспериментов. Определить, среднее отклонение от среднего значения результатов для какого эксперимента является максимальным?

Вид таблицы данных:

Используем следующую формулу:

Сравниваем результаты, возвращаемые функцией СРОТКЛ для первого и второго ряда чисел с использованием функции ЕСЛИ, возвращаем соответствующий результат.

В результате мы получили среднее отклонение от среднего значения. Это весьма интересная функция для технического анализа финансовых рынков, прогнозов курсов валют и даже позволяет повысить шансы выигрышей в лотереях.

Понимание коэффициента вариации

Коэффициент вариации показывает степень изменчивости некоторой выборки данных по отношению к среднему их значению. В финансах данный коэффициент позволяет инвесторам определить, насколько велика волатильность, или риск, по сравнению с величиной ожидаемой прибыли от инвестиций.

Чем меньше значение CV, тем лучший компромисс наблюдается между риском и доходностью

Обратите внимание, что если ожидаемая доходность в знаменателе отрицательна или равна нулю, полученное значение коэффициента может ввести вас в заблуждение

Коэффициент вариации может быть весьма полезен при использовании соотношения риск/прибыль для выбора объекта инвестиций. Например, инвестор не склонный к риску будет рассматривать активы с исторически низкой степенью волатильности и высокой степенью доходности по отношению к общему рынку (или к отдельной отрасли). И наоборот, инвесторы склонные к риску, будут стремиться инвестировать в активы с исторически высокой степенью волатильности.

Формула CV может использоваться для определения дисперсии между исторической средней ценой и текущими показателями цены акции, товара или облигации.

Обычно данный коэффициент используют в таких целях как:

  • Для сравнения нескольких различных рядов данных или показателей;
  • Для оценки потенциальных объектов инвестирования;
  • Для проведения XYZ-анализа.

КЛЮЧЕВЫЕ МОМЕНТЫ

  • CV – это статистическая мера дисперсии в ряду данных вокруг среднего значения;
  • В финансах CV позволяет инвесторам определить, насколько велика волатильность, или риск, по сравнению с величиной ожидаемой прибыли от инвестиций;
  • Чем ниже величина отношения стандартного отклонения к средней доходности,тем лучше соотношение риска и доходности.

Как рассчитывается коэффициент вариации и как его проанализировать

Коэффициент вариации, VAR или CV, – ключевой показатель в оценке риска проектов и доходности ценных бумаг. Он позволяет заранее проанализировать сразу два показателя, которые обладают меняющимися во времени значениями. Если показатель оказывается менее 0,1, направление инвестирования характеризуется низким уровнем риска. При показателе свыше 0,3 уровень риска необоснованно высок. Для расчета удобнее всего использовать функции СТАНДОТКЛОН и СРЗНАЧ табличного редактора Excel.

Для того чтобы сформировать качественный инвестиционный портфель, инвесторам порой приходится прибегать к оценке входящих в него активов, которые обладают разным уровнем риска и доходности. Для этой цели используется широко известный в инвестиционном анализе и эконометрике показатель.

Коэффициент вариации (Coefficient of variation – CV, VAR) – относительный финансовый показатель, который демонстрирует сравнение рассеивания значений двух случайных показателей, которые имеют разные единицы измерения относительно ожидаемого значения.

Справка! Поскольку коэффициент вариации позволяет получить сопоставимые результаты, то его применение оптимально в рамках портфельного анализа. В ней он позволяет эффективно объединить значения риска и доходности и вывести результирующее значение.

Coefficient of variation – показатель из числа относительных методов статистики, который, как NPV и IRR, применяется в рамках инвестиционного анализа. Он измеряется в процентах и может применяться для сравнения вариаций двух несвязанных между собой критериев. Его чаще всего используют финансовые и инвестиционные аналитики.

Справка! На базе коэффициента вариации оценивается так называемый «унифицированный риск» (unitized risk), поскольку он оценивает относительный разброс двух показателей по отношению к прогнозному значению.

Для чего используют показатель VAR:

  • в целях сравнения двух разных показателей;
  • для определения степени устойчивости прогнозных моделей (в основном по инвестициям и портфельному инвестированию);
  • для осуществления XYZ-анализа.

Справка! XYZ-анализ – аналитический инструмент, в рамках которого продукция компании оценивается по двум параметрам: стабильность потребления и продаж.


С этим читают