🗊Презентация Статистический анализ результатов моделирования

Категория: Математика
Нажмите для полного просмотра!
Статистический анализ результатов моделирования, слайд №1Статистический анализ результатов моделирования, слайд №2Статистический анализ результатов моделирования, слайд №3Статистический анализ результатов моделирования, слайд №4Статистический анализ результатов моделирования, слайд №5Статистический анализ результатов моделирования, слайд №6Статистический анализ результатов моделирования, слайд №7Статистический анализ результатов моделирования, слайд №8Статистический анализ результатов моделирования, слайд №9Статистический анализ результатов моделирования, слайд №10Статистический анализ результатов моделирования, слайд №11Статистический анализ результатов моделирования, слайд №12Статистический анализ результатов моделирования, слайд №13Статистический анализ результатов моделирования, слайд №14Статистический анализ результатов моделирования, слайд №15Статистический анализ результатов моделирования, слайд №16Статистический анализ результатов моделирования, слайд №17Статистический анализ результатов моделирования, слайд №18Статистический анализ результатов моделирования, слайд №19Статистический анализ результатов моделирования, слайд №20Статистический анализ результатов моделирования, слайд №21Статистический анализ результатов моделирования, слайд №22Статистический анализ результатов моделирования, слайд №23Статистический анализ результатов моделирования, слайд №24Статистический анализ результатов моделирования, слайд №25Статистический анализ результатов моделирования, слайд №26Статистический анализ результатов моделирования, слайд №27Статистический анализ результатов моделирования, слайд №28Статистический анализ результатов моделирования, слайд №29Статистический анализ результатов моделирования, слайд №30Статистический анализ результатов моделирования, слайд №31Статистический анализ результатов моделирования, слайд №32Статистический анализ результатов моделирования, слайд №33Статистический анализ результатов моделирования, слайд №34Статистический анализ результатов моделирования, слайд №35Статистический анализ результатов моделирования, слайд №36Статистический анализ результатов моделирования, слайд №37Статистический анализ результатов моделирования, слайд №38Статистический анализ результатов моделирования, слайд №39Статистический анализ результатов моделирования, слайд №40Статистический анализ результатов моделирования, слайд №41Статистический анализ результатов моделирования, слайд №42Статистический анализ результатов моделирования, слайд №43Статистический анализ результатов моделирования, слайд №44Статистический анализ результатов моделирования, слайд №45Статистический анализ результатов моделирования, слайд №46Статистический анализ результатов моделирования, слайд №47Статистический анализ результатов моделирования, слайд №48Статистический анализ результатов моделирования, слайд №49Статистический анализ результатов моделирования, слайд №50Статистический анализ результатов моделирования, слайд №51Статистический анализ результатов моделирования, слайд №52Статистический анализ результатов моделирования, слайд №53Статистический анализ результатов моделирования, слайд №54

Содержание

Вы можете ознакомиться и скачать презентацию на тему Статистический анализ результатов моделирования. Доклад-сообщение содержит 54 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Тема лекции №5
Статистический анализ результатов моделирования.
Описание слайда:
Тема лекции №5 Статистический анализ результатов моделирования.

Слайд 2





Цель лекции – изучить особенности статистического анализа результатов моделирования.
План лекции.
Особенности фиксации и статистической обработки результатов моделирования транспортных процессов.
Требования к оценкам характеристик.
Построение гистограммы.
Элементы дисперсионного анализа. Критерий Фишера.
Однофакторный дисперсионный анализ.
Выявление несущественных факторов.
Сущность корреляционного анализа.
Обработка результатов эксперимента на основе регрессии.
Описание слайда:
Цель лекции – изучить особенности статистического анализа результатов моделирования. План лекции. Особенности фиксации и статистической обработки результатов моделирования транспортных процессов. Требования к оценкам характеристик. Построение гистограммы. Элементы дисперсионного анализа. Критерий Фишера. Однофакторный дисперсионный анализ. Выявление несущественных факторов. Сущность корреляционного анализа. Обработка результатов эксперимента на основе регрессии.

Слайд 3





1. Особенности фиксации и статистической обработки результатов моделирования транспортных процессов.
При выборе методов обработки существенную роль играют три особенности компьютерного эксперимента с моделью системы S:
1. Возможность получать при моделировании системы S на компьютере большие выборки позволяет количественно оценить характеристики процесса функционирования системы, но превращает в серьезную проблему хранение промежуточных результатов моделирования. Эту проблему можно решить, используя рекуррентные алгоритмы обработки, когда оценки вычисляют по ходу моделирования.
Описание слайда:
1. Особенности фиксации и статистической обработки результатов моделирования транспортных процессов. При выборе методов обработки существенную роль играют три особенности компьютерного эксперимента с моделью системы S: 1. Возможность получать при моделировании системы S на компьютере большие выборки позволяет количественно оценить характеристики процесса функционирования системы, но превращает в серьезную проблему хранение промежуточных результатов моделирования. Эту проблему можно решить, используя рекуррентные алгоритмы обработки, когда оценки вычисляют по ходу моделирования.

Слайд 4





2. Сложность исследуемой системы S при ее моделировании на компьютере часто приводит к тому, что априорное суждение о характеристиках процесса функционирования системы, например о типе ожидаемого распределения выходных переменных, является невозможным. Поэтому при моделировании систем широко используются непараметрические оценки и оценки моментов распределения.
2. Сложность исследуемой системы S при ее моделировании на компьютере часто приводит к тому, что априорное суждение о характеристиках процесса функционирования системы, например о типе ожидаемого распределения выходных переменных, является невозможным. Поэтому при моделировании систем широко используются непараметрические оценки и оценки моментов распределения.
3. Блочность конструкции машинной модели Мм и раздельное исследование блоков связаны с программной имитацией входящих переменных для одной частичной модели по оценкам выходных переменных, полученных на другой частичной модели. Если компьютер (программа), используемый для моделирования, не позволяет воспользоваться переменными, записанными на внешние носители, то следует представить эти переменные в форме, удобной для построения алгоритма их имитации.
Описание слайда:
2. Сложность исследуемой системы S при ее моделировании на компьютере часто приводит к тому, что априорное суждение о характеристиках процесса функционирования системы, например о типе ожидаемого распределения выходных переменных, является невозможным. Поэтому при моделировании систем широко используются непараметрические оценки и оценки моментов распределения. 2. Сложность исследуемой системы S при ее моделировании на компьютере часто приводит к тому, что априорное суждение о характеристиках процесса функционирования системы, например о типе ожидаемого распределения выходных переменных, является невозможным. Поэтому при моделировании систем широко используются непараметрические оценки и оценки моментов распределения. 3. Блочность конструкции машинной модели Мм и раздельное исследование блоков связаны с программной имитацией входящих переменных для одной частичной модели по оценкам выходных переменных, полученных на другой частичной модели. Если компьютер (программа), используемый для моделирования, не позволяет воспользоваться переменными, записанными на внешние носители, то следует представить эти переменные в форме, удобной для построения алгоритма их имитации.

Слайд 5





Современные системы имитационного моделирования предоставляют возможность выполнять автоматически стандартную обработку результатов моделирования:
Современные системы имитационного моделирования предоставляют возможность выполнять автоматически стандартную обработку результатов моделирования:
определение характеристик случайных параметров, главным образом, их матожиданий и дисперсий;
фиксация минимальных и максимальных значений исследуемых величин;
частотное распределение результатов измерений (построение гистограмм);
расчет коэффициентов использования объектов модели.
Часто  приходится выполнять более сложную обработку:
определение функциональных или статистических зависимостей между исследуемыми величинами;
выявление существенных или несущественных факторов, участвующих в эксперименте;
сравнение случайных параметров процесса с целью определения значимости расхождения или совпадения их характеристик и др.
Описание слайда:
Современные системы имитационного моделирования предоставляют возможность выполнять автоматически стандартную обработку результатов моделирования: Современные системы имитационного моделирования предоставляют возможность выполнять автоматически стандартную обработку результатов моделирования: определение характеристик случайных параметров, главным образом, их матожиданий и дисперсий; фиксация минимальных и максимальных значений исследуемых величин; частотное распределение результатов измерений (построение гистограмм); расчет коэффициентов использования объектов модели. Часто приходится выполнять более сложную обработку: определение функциональных или статистических зависимостей между исследуемыми величинами; выявление существенных или несущественных факторов, участвующих в эксперименте; сравнение случайных параметров процесса с целью определения значимости расхождения или совпадения их характеристик и др.

Слайд 6





Характеристики случайных величин и процессов
В результате эксперимента с имитационной статистической моделью, состоящего из N наблюдений, мы получаем  N значений исследуемой случайной величины a:
По этим данным нужно дать всестороннее описание величины a. Определить случайную величину - это значит определить ее характеристики. В общем случае:
где      - оценка характеристики случайной величины (СВ).
Описание слайда:
Характеристики случайных величин и процессов В результате эксперимента с имитационной статистической моделью, состоящего из N наблюдений, мы получаем N значений исследуемой случайной величины a: По этим данным нужно дать всестороннее описание величины a. Определить случайную величину - это значит определить ее характеристики. В общем случае: где - оценка характеристики случайной величины (СВ).

Слайд 7





Под характеристикой СВ понимают следующее.
Под характеристикой СВ понимают следующее.

Во-первых, это характеристики величины:
матожидание (среднее арифметическое);
медиана (срединное значение);
мода (наиболее вероятное значение);
среднее геометрическое и др.
В рамках задач, характерных для нашей специальности, наиболее актуальным является матожидание. Как известно, матожидание определяет центр рассеивания случайной величины, наиболее полно отмечающее ее положение на числовой оси. Будем обозначать матожидание случайной величины а так:  М(а).
Во-вторых, это характеристики рассеивания:
дисперсия (матожидание квадрата отклонения случайной величины a );
среднее квадратическое отклонение (квадратный корень из дисперсии); иногда целесообразно пользоваться этой характеристикой, так как она имеет размерность самой случайной величины;
размах ( maxai - minai ).
Описание слайда:
Под характеристикой СВ понимают следующее. Под характеристикой СВ понимают следующее. Во-первых, это характеристики величины: матожидание (среднее арифметическое); медиана (срединное значение); мода (наиболее вероятное значение); среднее геометрическое и др. В рамках задач, характерных для нашей специальности, наиболее актуальным является матожидание. Как известно, матожидание определяет центр рассеивания случайной величины, наиболее полно отмечающее ее положение на числовой оси. Будем обозначать матожидание случайной величины а так:  М(а). Во-вторых, это характеристики рассеивания: дисперсия (матожидание квадрата отклонения случайной величины a ); среднее квадратическое отклонение (квадратный корень из дисперсии); иногда целесообразно пользоваться этой характеристикой, так как она имеет размерность самой случайной величины; размах ( maxai - minai ).

Слайд 8





В-третьих, это характеристика связи между случайными величинами (корреляция); степень связи определяется величиной коэффициента корреляции r.
В-третьих, это характеристика связи между случайными величинами (корреляция); степень связи определяется величиной коэффициента корреляции r.
 В случайном процессе связь между значениями случайной функции в моменты времени tk, ts, определяет коэффициент автокорреляции k(tk, ts).
 В-четвертых, это характеристика закона распределения вероятностей случайной величины в виде плотности или функции распределения:
  или 
Описание слайда:
В-третьих, это характеристика связи между случайными величинами (корреляция); степень связи определяется величиной коэффициента корреляции r. В-третьих, это характеристика связи между случайными величинами (корреляция); степень связи определяется величиной коэффициента корреляции r. В случайном процессе связь между значениями случайной функции в моменты времени tk, ts, определяет коэффициент автокорреляции k(tk, ts).  В-четвертых, это характеристика закона распределения вероятностей случайной величины в виде плотности или функции распределения:   или 

Слайд 9





2. Требования к оценкам характеристик 
Ограниченное число реализаций модели не позволяет точно определить значения этих характеристик, а только приближенно, то есть так называемые оценки характеристик. Степень приближения оценок      зависит от методов их вычислений (формул). 
Чтобы оценка наилучшим образом представляла искомую характеристику, нужно, чтобы она обладала следующими свойствами:
несмещенностью;
состоятельностью;
эффективностью.
Описание слайда:
2. Требования к оценкам характеристик Ограниченное число реализаций модели не позволяет точно определить значения этих характеристик, а только приближенно, то есть так называемые оценки характеристик. Степень приближения оценок   зависит от методов их вычислений (формул). Чтобы оценка наилучшим образом представляла искомую характеристику, нужно, чтобы она обладала следующими свойствами: несмещенностью; состоятельностью; эффективностью.

Слайд 10





Несмещенность. Это свойство означает, что оценка не содержит систематической ошибки. Т.е., математическое ожидание оценки совпадает с действительным значением характеристики    : 
Несмещенность. Это свойство означает, что оценка не содержит систематической ошибки. Т.е., математическое ожидание оценки совпадает с действительным значением характеристики    : 
Состоятельность. Это свойство означает, что оценка      приближается сколь угодно близко к истинному значению характеристики                  по мере увеличения объема выборки, т. е. увеличения числа реализаций модели. Формально это свойство записывают так: 
при                и любом
Описание слайда:
Несмещенность. Это свойство означает, что оценка не содержит систематической ошибки. Т.е., математическое ожидание оценки совпадает с действительным значением характеристики   : Несмещенность. Это свойство означает, что оценка не содержит систематической ошибки. Т.е., математическое ожидание оценки совпадает с действительным значением характеристики   : Состоятельность. Это свойство означает, что оценка    приближается сколь угодно близко к истинному значению характеристики    по мере увеличения объема выборки, т. е. увеличения числа реализаций модели. Формально это свойство записывают так: при и любом

Слайд 11





Именно это свойство являлось определяющим при нахождении количественной связи между точностью, достоверностью оценок и числом реализаций модели.
Именно это свойство являлось определяющим при нахождении количественной связи между точностью, достоверностью оценок и числом реализаций модели.
Эффективность. Это свойство означает, что из всех несмещенных и состоятельных оценок следует предпочесть ту, у которой разброс значений меньше. Иначе: эффективной оценкой характеристики случайной величины называют ту, которая имеет наименьшую дисперсию:
где k - число возможных оценок.
Описание слайда:
Именно это свойство являлось определяющим при нахождении количественной связи между точностью, достоверностью оценок и числом реализаций модели. Именно это свойство являлось определяющим при нахождении количественной связи между точностью, достоверностью оценок и числом реализаций модели. Эффективность. Это свойство означает, что из всех несмещенных и состоятельных оценок следует предпочесть ту, у которой разброс значений меньше. Иначе: эффективной оценкой характеристики случайной величины называют ту, которая имеет наименьшую дисперсию: где k - число возможных оценок.

Слайд 12





Таблица 2.1 - Характеристики случайных величин и их оценки
Описание слайда:
Таблица 2.1 - Характеристики случайных величин и их оценки

Слайд 13





3. Построение гистограммы
Одной из задач моделирования может быть определение закона распределения вероятностей исследуемой случайной величины и количественных значений его характеристик.
Аналогом, моделью плотности распределения вероятности случайной величины является гистограмма, которую можно построить (аналитически или графически) по данным имитационного моделирования.  Гистограмма (рис. 3.1) строится так.
Описание слайда:
3. Построение гистограммы Одной из задач моделирования может быть определение закона распределения вероятностей исследуемой случайной величины и количественных значений его характеристик. Аналогом, моделью плотности распределения вероятности случайной величины является гистограмма, которую можно построить (аналитически или графически) по данным имитационного моделирования. Гистограмма (рис. 3.1) строится так.

Слайд 14





В результате N реализаций модели получен ряд случайных значений исследуемого параметра a : 
В результате N реализаций модели получен ряд случайных значений исследуемого параметра a : 
Весь диапазон значений ai  разбивается на l интервалов (разрядов). Числовой диапазон каждого интервала обозначим  ∆j , j=1,l. Обычно все числовые диапазоны одинаковые: ∆l =∆.
Для каждого интервала подсчитываем число значений ai, попавших в него - mj.
На каждом интервале строят прямоугольник с высотой  hj:
По выбору числа интервалов   существуют разные эмпирические рекомендации. Чем больше N  и  l, а меньше ∆, тем ближе гистограмма совпадает с некоторым теоретическим распределением.
На основе очертания гистограммы делается предположение (выдвигается гипотеза) о совпадении полученного эмпирического распределения вероятностей с тем или иным теоретическим - нормальным, экспоненциальным, Вейбулла и т. д.
 Затем выполняется проверка этой гипотезы с помощью критериев согласия. Рассматриваются некоторые (критерий Колмогорова, критерий Смирнова и др.), наиболее популярными считают критерий хи-квадрат - критерий Пирсона.
Описание слайда:
В результате N реализаций модели получен ряд случайных значений исследуемого параметра a :  В результате N реализаций модели получен ряд случайных значений исследуемого параметра a :  Весь диапазон значений ai  разбивается на l интервалов (разрядов). Числовой диапазон каждого интервала обозначим  ∆j , j=1,l. Обычно все числовые диапазоны одинаковые: ∆l =∆. Для каждого интервала подсчитываем число значений ai, попавших в него - mj. На каждом интервале строят прямоугольник с высотой  hj: По выбору числа интервалов   существуют разные эмпирические рекомендации. Чем больше N  и  l, а меньше ∆, тем ближе гистограмма совпадает с некоторым теоретическим распределением. На основе очертания гистограммы делается предположение (выдвигается гипотеза) о совпадении полученного эмпирического распределения вероятностей с тем или иным теоретическим - нормальным, экспоненциальным, Вейбулла и т. д. Затем выполняется проверка этой гипотезы с помощью критериев согласия. Рассматриваются некоторые (критерий Колмогорова, критерий Смирнова и др.), наиболее популярными считают критерий хи-квадрат - критерий Пирсона.

Слайд 15





Оценки матожидания и дисперсии можно получить по данным гистограммы:
Оценки матожидания и дисперсии можно получить по данным гистограммы:
 
где      - среднее значение каждого интервала;
        - оценка по каждому интервалу;
        - поправка Шеппарда.
Описание слайда:
Оценки матожидания и дисперсии можно получить по данным гистограммы: Оценки матожидания и дисперсии можно получить по данным гистограммы: где - среднее значение каждого интервала; - оценка по каждому интервалу; - поправка Шеппарда.

Слайд 16





4. Элементы дисперсионного анализа. Критерий Фишера
Гипотезой называется предположение о:
законах распределения вероятностей случайных величин;
значениях характеристик случайных величин;
совпадении законов распределения двух и более случайных величин и др.
Обычно исходную гипотезу называют нулевой и обозначают H0.  Противоположное утверждение называют конкурирующей гипотезой и обозначают  H1.
Гипотеза подвергается проверке. Смысл этой проверки в том, чтобы принять или отклонить ее с допустимым минимальным риском. При этом возможны ошибки:
забраковать проверяемую гипотезу, если она верна, что соответствует так называемой ошибке первого рода;
принять проверяемую гипотезу, когда она не верна, значит совершить ошибку второго рода.
Правило, по которому принимается суждение об истинности или ложности основной гипотезы H0  называют критерием проверки или критерием согласия.
Описание слайда:
4. Элементы дисперсионного анализа. Критерий Фишера Гипотезой называется предположение о: законах распределения вероятностей случайных величин; значениях характеристик случайных величин; совпадении законов распределения двух и более случайных величин и др. Обычно исходную гипотезу называют нулевой и обозначают H0.  Противоположное утверждение называют конкурирующей гипотезой и обозначают  H1. Гипотеза подвергается проверке. Смысл этой проверки в том, чтобы принять или отклонить ее с допустимым минимальным риском. При этом возможны ошибки: забраковать проверяемую гипотезу, если она верна, что соответствует так называемой ошибке первого рода; принять проверяемую гипотезу, когда она не верна, значит совершить ошибку второго рода. Правило, по которому принимается суждение об истинности или ложности основной гипотезы H0  называют критерием проверки или критерием согласия.

Слайд 17





Сущность дисперсионного анализа состоит в проверке гипотезы о тождественности выборочных дисперсий одной и той же генеральной дисперсии. 
Сущность дисперсионного анализа состоит в проверке гипотезы о тождественности выборочных дисперсий одной и той же генеральной дисперсии. 
Также одновременно решает проблему проверки гипотезы о равенстве средних значений выборок.
Задача сравнения дисперсий сводится к проверке исходной гипотезы (нулевой гипотезы Н0 ) о принадлежности двух выборок одной и той же генеральной совокупности.
Описание слайда:
Сущность дисперсионного анализа состоит в проверке гипотезы о тождественности выборочных дисперсий одной и той же генеральной дисперсии. Сущность дисперсионного анализа состоит в проверке гипотезы о тождественности выборочных дисперсий одной и той же генеральной дисперсии. Также одновременно решает проблему проверки гипотезы о равенстве средних значений выборок. Задача сравнения дисперсий сводится к проверке исходной гипотезы (нулевой гипотезы Н0 ) о принадлежности двух выборок одной и той же генеральной совокупности.

Слайд 18





Для проверки гипотезы о равенстве дисперсий нужно иметь независимую функцию, вычислимую по данным эксперимента.
Для проверки гипотезы о равенстве дисперсий нужно иметь независимую функцию, вычислимую по данным эксперимента.
Такой функцией является функция Фишера (распределение Фишера, F -распределение), определяемая так:
где U и V - случайные величины, имеющие распределение χ2;
 k1 и k2 – соответствующие степени свободы случайных величин   U и V  соответственно:  k1 =N1 -1,  k2=N2-1;
N1 и  N2 – количество испытаний (объем выборки).
Описание слайда:
Для проверки гипотезы о равенстве дисперсий нужно иметь независимую функцию, вычислимую по данным эксперимента. Для проверки гипотезы о равенстве дисперсий нужно иметь независимую функцию, вычислимую по данным эксперимента. Такой функцией является функция Фишера (распределение Фишера, F -распределение), определяемая так: где U и V - случайные величины, имеющие распределение χ2; k1 и k2 – соответствующие степени свободы случайных величин   U и V  соответственно: k1 =N1 -1, k2=N2-1; N1 и N2 – количество испытаний (объем выборки).

Слайд 19





Почему χ2  является мерой сравнения дисперсий? А потому, что дисперсии, являясь суммой квадратов ошибок, имеют распределение χ2.
Почему χ2  является мерой сравнения дисперсий? А потому, что дисперсии, являясь суммой квадратов ошибок, имеют распределение χ2.
Распределение хи-квадрат определяется следующим образом:
где v – число степеней свободы;
Г – гамма-функция.
Описание слайда:
Почему χ2  является мерой сравнения дисперсий? А потому, что дисперсии, являясь суммой квадратов ошибок, имеют распределение χ2. Почему χ2  является мерой сравнения дисперсий? А потому, что дисперсии, являясь суммой квадратов ошибок, имеют распределение χ2. Распределение хи-квадрат определяется следующим образом: где v – число степеней свободы; Г – гамма-функция.

Слайд 20





Итак, случайная величина
Итак, случайная величина
 
где  S21 и S22     - несмещенные оценки дисперсий, полученные из независимых выборок, взятых из нормальных совокупностей, имеют распределение Фишера (F -распределение).
Величина F - случайна, поэтому судить однозначно по ее величине о подтверждении или опровержении гипотезы об однородности исследуемых выборок нельзя.
Поэтому вводится q  уровень значимости, численно равный вероятности неприемлемых отклонений от принятой гипотезы. Области неприемлемых значений F  показаны на рисунке штриховкой. Граничные точки допустимых значений  F определяются точками F1 и F2, соответствующих вероятностям q/2 .
Описание слайда:
Итак, случайная величина Итак, случайная величина где  S21 и S22  - несмещенные оценки дисперсий, полученные из независимых выборок, взятых из нормальных совокупностей, имеют распределение Фишера (F -распределение). Величина F - случайна, поэтому судить однозначно по ее величине о подтверждении или опровержении гипотезы об однородности исследуемых выборок нельзя. Поэтому вводится q  уровень значимости, численно равный вероятности неприемлемых отклонений от принятой гипотезы. Области неприемлемых значений F  показаны на рисунке штриховкой. Граничные точки допустимых значений  F определяются точками F1 и F2, соответствующих вероятностям q/2 .

Слайд 21





Если вычисленное по данным эксперимента значение F
Если вычисленное по данным эксперимента значение F
  попадает в область между точками  F1 и F2:
 
то принятая гипотеза не опровергается.
Заметим, что случайная величина


также имеет F -распределение со степенями свободы k1  и k2 соответственно. Следовательно, вероятность
 попадания числа F  в левую критическую область равна:
Описание слайда:
Если вычисленное по данным эксперимента значение F Если вычисленное по данным эксперимента значение F  попадает в область между точками  F1 и F2: то принятая гипотеза не опровергается. Заметим, что случайная величина также имеет F -распределение со степенями свободы k1 и k2 соответственно. Следовательно, вероятность  попадания числа F  в левую критическую область равна:

Слайд 22





Отсюда следует, что левая критическая точка F -распределения соответствует правой критической точке  F*-распределения. Т.е. правые точки распределений  F и  F* определяют левую и правую точки   F1 и F2. Поэтому в таблицах представлены только правые  F2 критические точки F -распределения.
Отсюда следует, что левая критическая точка F -распределения соответствует правой критической точке  F*-распределения. Т.е. правые точки распределений  F и  F* определяют левую и правую точки   F1 и F2. Поэтому в таблицах представлены только правые  F2 критические точки F -распределения.
В таблицах значения  F2  приведены в зависимости от q/2 , числа степеней свободы k1  и k2 .
Обычно при вычислении F  в числитель отношения
   ставят значение большей дисперсии.
Итак, при  F ≤  F2   принятая гипотеза не опровергается, при F > F2     - не подтверждается.
Описание слайда:
Отсюда следует, что левая критическая точка F -распределения соответствует правой критической точке  F*-распределения. Т.е. правые точки распределений  F и  F* определяют левую и правую точки   F1 и F2. Поэтому в таблицах представлены только правые  F2 критические точки F -распределения. Отсюда следует, что левая критическая точка F -распределения соответствует правой критической точке  F*-распределения. Т.е. правые точки распределений  F и  F* определяют левую и правую точки   F1 и F2. Поэтому в таблицах представлены только правые  F2 критические точки F -распределения. В таблицах значения  F2  приведены в зависимости от q/2 , числа степеней свободы k1 и k2 . Обычно при вычислении F  в числитель отношения    ставят значение большей дисперсии. Итак, при  F ≤ F2 принятая гипотеза не опровергается, при F > F2  - не подтверждается.

Слайд 23





Пример
Анализируем две хронометражные карточки наблюдения за временем погрузки. В первой карточке пять измерений значений, дисперсия которых составила S1=0,15ч., во второй – по семи значениям – S2=0,1ч. Однотипны ли измерения? Выдвинем и проверим гипотезу об их однотипности для уровня значимости q=10.
Решение.


По таблицу F -распределения для степеней свобод k2=6, соответствующей большей дисперсии, и k1=4, соответствующей меньшей дисперсии, и уровню значимости q/2, находим F2= 6,16.
Описание слайда:
Пример Анализируем две хронометражные карточки наблюдения за временем погрузки. В первой карточке пять измерений значений, дисперсия которых составила S1=0,15ч., во второй – по семи значениям – S2=0,1ч. Однотипны ли измерения? Выдвинем и проверим гипотезу об их однотипности для уровня значимости q=10. Решение. По таблицу F -распределения для степеней свобод k2=6, соответствующей большей дисперсии, и k1=4, соответствующей меньшей дисперсии, и уровню значимости q/2, находим F2= 6,16.

Слайд 24





Так как  F=1,5<F2=6,16, то для уровня значимости q=10  гипотеза об одинаковости результатов наблюдений не опровергается.
Так как  F=1,5<F2=6,16, то для уровня значимости q=10  гипотеза об одинаковости результатов наблюдений не опровергается.
Итак: чем меньше уровень значимости q, тем меньше вероятность забраковать проверяемую гипотезу, когда она верна, т. е. совершить ошибку первого рода.
Но с уменьшением уровня значимости
    (увеличения F2) расширяется область допустимых ошибок, что приводит к увеличению вероятности принятия неверного решения, т. е. совершения ошибки второго рода.
Описание слайда:
Так как  F=1,5<F2=6,16, то для уровня значимости q=10  гипотеза об одинаковости результатов наблюдений не опровергается. Так как  F=1,5<F2=6,16, то для уровня значимости q=10  гипотеза об одинаковости результатов наблюдений не опровергается. Итак: чем меньше уровень значимости q, тем меньше вероятность забраковать проверяемую гипотезу, когда она верна, т. е. совершить ошибку первого рода. Но с уменьшением уровня значимости (увеличения F2) расширяется область допустимых ошибок, что приводит к увеличению вероятности принятия неверного решения, т. е. совершения ошибки второго рода.

Слайд 25





5. Однофакторный дисперсионный анализ
Эксперимент для выполнения однофакторного дисперсионного анализа (ОДА) состоит в накоплении результатов измерений
 контролируемого параметра  при каждом варианте исследуемого фактора.
Введем обозначения:
n - число вариантов фактора;
m - число измерений при каждом варианте;
aij - результат каждого измерения;
 i=1,m - номер варианта фактора;
 j=1,n - номер измерения.
Схема эксперимента заключается в следующем.
Производится n измерений контролируемого параметра при 
     m вариантах фактора.
В принципе, число измерений может быть разным для каждого варианта фактора. Результаты эксперимента сводятся в табл.5.1.
Описание слайда:
5. Однофакторный дисперсионный анализ Эксперимент для выполнения однофакторного дисперсионного анализа (ОДА) состоит в накоплении результатов измерений  контролируемого параметра при каждом варианте исследуемого фактора. Введем обозначения: n - число вариантов фактора; m - число измерений при каждом варианте; aij - результат каждого измерения;  i=1,m - номер варианта фактора;  j=1,n - номер измерения. Схема эксперимента заключается в следующем. Производится n измерений контролируемого параметра при    m вариантах фактора. В принципе, число измерений может быть разным для каждого варианта фактора. Результаты эксперимента сводятся в табл.5.1.

Слайд 26





Таблица 5.1 – Результаты эксперимента
Описание слайда:
Таблица 5.1 – Результаты эксперимента

Слайд 27





Вопрос: влияют ли варианты фактора на точность измерений? Или, говоря языком математической статистики, являются результаты   измерений выборкой одной генеральной совокупности, или нет? Если да, то варианты фактора несущественны, если нет, то существенны.
Вопрос: влияют ли варианты фактора на точность измерений? Или, говоря языком математической статистики, являются результаты   измерений выборкой одной генеральной совокупности, или нет? Если да, то варианты фактора несущественны, если нет, то существенны.
Будем исходить из следующей нулевой гипотезы:
наблюдения каждого варианта независимы;
наблюдения каждого варианта имеют нормальное распределение;
имеют одинаковую дисперсию σ2;
имеют одинаковые центры рассеивания.
Описание слайда:
Вопрос: влияют ли варианты фактора на точность измерений? Или, говоря языком математической статистики, являются результаты   измерений выборкой одной генеральной совокупности, или нет? Если да, то варианты фактора несущественны, если нет, то существенны. Вопрос: влияют ли варианты фактора на точность измерений? Или, говоря языком математической статистики, являются результаты   измерений выборкой одной генеральной совокупности, или нет? Если да, то варианты фактора несущественны, если нет, то существенны. Будем исходить из следующей нулевой гипотезы: наблюдения каждого варианта независимы; наблюдения каждого варианта имеют нормальное распределение; имеют одинаковую дисперсию σ2; имеют одинаковые центры рассеивания.

Слайд 28





Очевидно, если систематические ошибки вариантов не одинаковы, следует ожидать повышенного рассеивания выборочных средних    .
Очевидно, если систематические ошибки вариантов не одинаковы, следует ожидать повышенного рассеивания выборочных средних    .
Для подтверждения или отрицания выдвинутой нулевой гипотезы об идентичности вариантов фактора проведем дисперсионный анализ.
Общее среднее арифметическое по всем
 m∙n  измерениям:
Сумма квадратов отклонений по всем  m∙n  измерений, то есть по данным всего эксперимента:
Описание слайда:
Очевидно, если систематические ошибки вариантов не одинаковы, следует ожидать повышенного рассеивания выборочных средних  . Очевидно, если систематические ошибки вариантов не одинаковы, следует ожидать повышенного рассеивания выборочных средних  . Для подтверждения или отрицания выдвинутой нулевой гипотезы об идентичности вариантов фактора проведем дисперсионный анализ. Общее среднее арифметическое по всем  m∙n  измерениям: Сумма квадратов отклонений по всем  m∙n  измерений, то есть по данным всего эксперимента:

Слайд 29





Эту сумму квадратов отклонений можно разложить на два независимых слагаемых:
Эту сумму квадратов отклонений можно разложить на два независимых слагаемых:
Обозначим:
где Q1 - сумма квадратов отклонений между вариантами фактора, так как  āi - среднее значение измеренного параметра  i-го варианта фактора;
Q2 - характеризует отклонения внутри каждого варианта.
Описание слайда:
Эту сумму квадратов отклонений можно разложить на два независимых слагаемых: Эту сумму квадратов отклонений можно разложить на два независимых слагаемых: Обозначим: где Q1 - сумма квадратов отклонений между вариантами фактора, так как  āi - среднее значение измеренного параметра  i-го варианта фактора; Q2 - характеризует отклонения внутри каждого варианта.

Слайд 30





Если принятая гипотеза о равенстве центров рассеивания ai и σ2 дисперсий  верна, тогда все  m∙n наблюдений значений aij можно рассматривать как выборку из одной и той же нормальной совокупности с очевидной несмещенной оценкой дисперсии:
Если принятая гипотеза о равенстве центров рассеивания ai и σ2 дисперсий  верна, тогда все  m∙n наблюдений значений aij можно рассматривать как выборку из одной и той же нормальной совокупности с очевидной несмещенной оценкой дисперсии:
 Можно показать, что величина
имеющая распределение χ2 со степенями свободы m-1, является оценкой дисперсии S2.  И величина
Описание слайда:
Если принятая гипотеза о равенстве центров рассеивания ai и σ2 дисперсий  верна, тогда все  m∙n наблюдений значений aij можно рассматривать как выборку из одной и той же нормальной совокупности с очевидной несмещенной оценкой дисперсии: Если принятая гипотеза о равенстве центров рассеивания ai и σ2 дисперсий  верна, тогда все  m∙n наблюдений значений aij можно рассматривать как выборку из одной и той же нормальной совокупности с очевидной несмещенной оценкой дисперсии: Можно показать, что величина имеющая распределение χ2 со степенями свободы m-1, является оценкой дисперсии S2.  И величина

Слайд 31





имеющая распределение χ2  со степенями свободы 
имеющая распределение χ2  со степенями свободы 
m(n-1), также является оценкой дисперсии.
	Из сказанного следует, что критерий 
при нашей гипотезе и независимости Q1 и Q2 (это можно доказать) имеет F -распределение с m-1 и 
m(n-1) степенями свободы.
А дальше мы уже знаем, как поступить:
выбираем уровень значимости q;
вычисляем число F;
из таблицы по величине q/2 находим F2.
Описание слайда:
имеющая распределение χ2  со степенями свободы  имеющая распределение χ2  со степенями свободы  m(n-1), также является оценкой дисперсии. Из сказанного следует, что критерий при нашей гипотезе и независимости Q1 и Q2 (это можно доказать) имеет F -распределение с m-1 и  m(n-1) степенями свободы. А дальше мы уже знаем, как поступить: выбираем уровень значимости q; вычисляем число F; из таблицы по величине q/2 находим F2.

Слайд 32





Пример
Необходимо проверить однотипность погрузчиков с одинаковыми характеристиками трех производителей. Осуществляется контрольные погрузки одного вида груза 30 раз каждым погрузчиком и замеряли время. Отклонение от нормативного времени занесли в таблицу 5.2.
Решение.
Проверяем исходную гипотезу: погрузчики по времени выполнения  операций одинаковы. 
При выборе уровня значимости q  исходим из того, что более опасна ошибка второго рода - подтвердить ошибочный выбор. Примем q =10.
Число вариантов фактора: m=3. 
Число измерений:  n=30.
Среднее отклонение времени по трем погрузчикам: ā1,ā2,ā3.
Среднее отклонение по 90 замерам: ā.
Средний квадрат расхождений между вариантами факторов:
Описание слайда:
Пример Необходимо проверить однотипность погрузчиков с одинаковыми характеристиками трех производителей. Осуществляется контрольные погрузки одного вида груза 30 раз каждым погрузчиком и замеряли время. Отклонение от нормативного времени занесли в таблицу 5.2. Решение. Проверяем исходную гипотезу: погрузчики по времени выполнения операций одинаковы. При выборе уровня значимости q  исходим из того, что более опасна ошибка второго рода - подтвердить ошибочный выбор. Примем q =10. Число вариантов фактора: m=3. Число измерений:  n=30. Среднее отклонение времени по трем погрузчикам: ā1,ā2,ā3. Среднее отклонение по 90 замерам: ā. Средний квадрат расхождений между вариантами факторов:

Слайд 33





Таблица 5.2 – Исходные данные
Описание слайда:
Таблица 5.2 – Исходные данные

Слайд 34





Число степеней свободы: m-1=
Число степеней свободы: m-1=
Средний квадрат расхождений внутри вариантов: 
Число степеней свободы: m(n-1)=
Расчет F -критерия: F=
По таблице определения критерия  F критерия, при  q/2=5 верхних пределах отклонения величины F  и имеющихся степенях свободы находим F2. 
Далее сравниваем F и F2 и если F ≤ F2 то делаем вывод, что выдвинутая гипотеза не опровергается.
Описание слайда:
Число степеней свободы: m-1= Число степеней свободы: m-1= Средний квадрат расхождений внутри вариантов: Число степеней свободы: m(n-1)= Расчет F -критерия: F= По таблице определения критерия F критерия, при  q/2=5 верхних пределах отклонения величины F  и имеющихся степенях свободы находим F2. Далее сравниваем F и F2 и если F ≤ F2 то делаем вывод, что выдвинутая гипотеза не опровергается.

Слайд 35





6. Выявление несущественных факторов
Большое количество факторов усложняет и снижает эффективность эксперимента. Среди этого множества могут быть и несущественные факторы. Исключение их упростило бы эксперимент, не снижая его информативности.
Несущественный фактор выявляется так.
Выполняются первый эксперимент из N наблюдений с учетом проверяемого фактора и второй эксперимент также из N наблюдений - без него. В обоих случаях фиксируются отклики y. Делается предположение, что обе выборки принадлежат одной генеральной совокупности, то есть, что проверяемый фактор - несущественный (это нулевая гипотеза). Дальнейшие рассуждения должны либо не опровергнуть эту гипотезу, либо посчитать ее недостаточно обоснованной.
Итак, получены две последовательности откликов, в которой y‘i и y“i - значения откликов в  i-м наблюдении при наличии и отсутствии проверяемого фактора соответственно:
Описание слайда:
6. Выявление несущественных факторов Большое количество факторов усложняет и снижает эффективность эксперимента. Среди этого множества могут быть и несущественные факторы. Исключение их упростило бы эксперимент, не снижая его информативности. Несущественный фактор выявляется так. Выполняются первый эксперимент из N наблюдений с учетом проверяемого фактора и второй эксперимент также из N наблюдений - без него. В обоих случаях фиксируются отклики y. Делается предположение, что обе выборки принадлежат одной генеральной совокупности, то есть, что проверяемый фактор - несущественный (это нулевая гипотеза). Дальнейшие рассуждения должны либо не опровергнуть эту гипотезу, либо посчитать ее недостаточно обоснованной. Итак, получены две последовательности откликов, в которой y‘i и y“i - значения откликов в  i-м наблюдении при наличии и отсутствии проверяемого фактора соответственно:

Слайд 36





Согласно принятой гипотезе эти последовательности имеют одинаковые матожидания  M(y) и дисперсии σ2y .
Согласно принятой гипотезе эти последовательности имеют одинаковые матожидания  M(y) и дисперсии σ2y .
 Рассмотрим случайную величину  Z, реализациями которой является последовательность случайных чисел 
При независимости zi и достаточно большом числе наблюдений N согласно центральной предельной теореме:
Очевидно:
Описание слайда:
Согласно принятой гипотезе эти последовательности имеют одинаковые матожидания  M(y) и дисперсии σ2y . Согласно принятой гипотезе эти последовательности имеют одинаковые матожидания  M(y) и дисперсии σ2y . Рассмотрим случайную величину  Z, реализациями которой является последовательность случайных чисел При независимости zi и достаточно большом числе наблюдений N согласно центральной предельной теореме: Очевидно:

Слайд 37





Как отделить случайные отклонения     от нуля от тех, которые мы будем считать не подтверждающими принятую гипотезу?
Как отделить случайные отклонения     от нуля от тех, которые мы будем считать не подтверждающими принятую гипотезу?
Такое разделение осуществляется по следующему правилу: если вычисленная величина    окажется маловероятной, в рамках нормального распределения и данном среднеквадратическом отклонении σz, то такое отклонение    от нуля считается не соответствующим принятой гипотезе.
Эту малую вероятность называют уровнем значимости и обозначают q. Обычно  q=2 - в зависимости от степени опасности совершения ошибки первого или второго рода.
На графике плотности распределения f(  ) уровень значимости q показан заштрихованным участком (рис.6.1).
Описание слайда:
Как отделить случайные отклонения   от нуля от тех, которые мы будем считать не подтверждающими принятую гипотезу? Как отделить случайные отклонения   от нуля от тех, которые мы будем считать не подтверждающими принятую гипотезу? Такое разделение осуществляется по следующему правилу: если вычисленная величина   окажется маловероятной, в рамках нормального распределения и данном среднеквадратическом отклонении σz, то такое отклонение   от нуля считается не соответствующим принятой гипотезе. Эту малую вероятность называют уровнем значимости и обозначают q. Обычно  q=2 - в зависимости от степени опасности совершения ошибки первого или второго рода. На графике плотности распределения f( ) уровень значимости q показан заштрихованным участком (рис.6.1).

Слайд 38





Для нормального закона распределения случайной величины    вероятность превышения    некоторого значения определяется известным выражением:
Для нормального закона распределения случайной величины    вероятность превышения    некоторого значения определяется известным выражением:
Следовательно:
граничное значение 
Аргумент функции Лапласа tα находим из соответствующего справочника согласно
 и, как было указано ранее,
Описание слайда:
Для нормального закона распределения случайной величины   вероятность превышения   некоторого значения определяется известным выражением: Для нормального закона распределения случайной величины   вероятность превышения   некоторого значения определяется известным выражением: Следовательно: граничное значение  Аргумент функции Лапласа tα находим из соответствующего справочника согласно  и, как было указано ранее,

Слайд 39





Из изложенного следует:
Из изложенного следует:
- если                              
принятая гипотеза о несущественности проверяемого фактора не подтверждается;
- если
принятая гипотеза не опровергается (в рамках принятого уровня значимости q).
Обычно величина σy неизвестна, поэтому следует использовать ее оценку Sy:
Оценку    и ряд значений yi можно получить из данных первого эксперимента (   ) или второго (   ), так как в силу рассматриваемой гипотезы они идентичны. Однако следует помнить, что если  N<100 то вместо аргумента функции Лапласа      надо брать        - аргумент функции Стьюдента.
Описание слайда:
Из изложенного следует: Из изложенного следует: - если  принятая гипотеза о несущественности проверяемого фактора не подтверждается; - если принятая гипотеза не опровергается (в рамках принятого уровня значимости q). Обычно величина σy неизвестна, поэтому следует использовать ее оценку Sy: Оценку   и ряд значений yi можно получить из данных первого эксперимента (   ) или второго (   ), так как в силу рассматриваемой гипотезы они идентичны. Однако следует помнить, что если  N<100 то вместо аргумента функции Лапласа  надо брать   - аргумент функции Стьюдента.

Слайд 40





Пример
Исследуется зависимость времени пребывания заявки в системе массового обслуживания от дисциплины выборки заявок из очереди: LIFO или FIFO. Проведены два эксперимента. Первый эксперимент из  N=100 наблюдений с дисциплиной FIFO и второй эксперимент также из N=100 наблюдений с дисциплиной LIFO. Результаты измерений и вычислений:    =1,8 мин., Sy=2мин. Для уровня значимости q=5, tα=1,96.
Решение.
Принимаем, что принятая гипотеза не опровергается, тогда:
Так как                                 то гипотеза не подтверждается. Для времени пребывания заявки в очереди в системе массового обслуживания не безразлично, какая дисциплина выборки заявок из очереди применена.
Описание слайда:
Пример Исследуется зависимость времени пребывания заявки в системе массового обслуживания от дисциплины выборки заявок из очереди: LIFO или FIFO. Проведены два эксперимента. Первый эксперимент из  N=100 наблюдений с дисциплиной FIFO и второй эксперимент также из N=100 наблюдений с дисциплиной LIFO. Результаты измерений и вычислений: =1,8 мин., Sy=2мин. Для уровня значимости q=5, tα=1,96. Решение. Принимаем, что принятая гипотеза не опровергается, тогда: Так как   то гипотеза не подтверждается. Для времени пребывания заявки в очереди в системе массового обслуживания не безразлично, какая дисциплина выборки заявок из очереди применена.

Слайд 41





7. Сущность корреляционного анализа
Часто при исследовании объекта или его модели необходимо наблюдать за характеристиками двух и более случайных величин. Например, за двумя откликами одного эксперимента. При этом может возникнуть вопрос: есть ли связь между этими случайными величинами? Существенна или несущественна эта связь, если она есть?
Корреляционный анализ - это совокупность методов обнаружения зависимости (корреляции) между двумя или более случайными признаками или процессами.
Под корреляцией будем понимать статистическую зависимость между двумя случайными величинами, не имеющую, вообще говоря, строго функционального характера.
Заметим, что корреляционный анализ не позволяет определить вид функциональной связи между случайными величинами, а только наличие или отсутствие предполагаемой связи, например, линейной, параболической, экспоненциальной и т.д.
Описание слайда:
7. Сущность корреляционного анализа Часто при исследовании объекта или его модели необходимо наблюдать за характеристиками двух и более случайных величин. Например, за двумя откликами одного эксперимента. При этом может возникнуть вопрос: есть ли связь между этими случайными величинами? Существенна или несущественна эта связь, если она есть? Корреляционный анализ - это совокупность методов обнаружения зависимости (корреляции) между двумя или более случайными признаками или процессами. Под корреляцией будем понимать статистическую зависимость между двумя случайными величинами, не имеющую, вообще говоря, строго функционального характера. Заметим, что корреляционный анализ не позволяет определить вид функциональной связи между случайными величинами, а только наличие или отсутствие предполагаемой связи, например, линейной, параболической, экспоненциальной и т.д.

Слайд 42





Название "корреляционный анализ" происходит от латинского слова correlatio - согласование, связь, соотношение, взаимосвязь.
Название "корреляционный анализ" происходит от латинского слова correlatio - согласование, связь, соотношение, взаимосвязь.
Обычно исследуют парную корреляцию, то есть зависимость между двумя случайными величинами (процессами), хотя возможны и более сложные ситуации, когда необходимо обнаружить наличие или отсутствие связей между тремя или более случайными величинами.
Мы ограничимся исследованием парной корреляции.
Как известно, связь между двумя случайными величинами можно описать с помощью двумерной функции распределения. Однако такое описание часто очень сложно, а для практических целей можно удовлетвориться определением зависимостей средних значений.
Описание слайда:
Название "корреляционный анализ" происходит от латинского слова correlatio - согласование, связь, соотношение, взаимосвязь. Название "корреляционный анализ" происходит от латинского слова correlatio - согласование, связь, соотношение, взаимосвязь. Обычно исследуют парную корреляцию, то есть зависимость между двумя случайными величинами (процессами), хотя возможны и более сложные ситуации, когда необходимо обнаружить наличие или отсутствие связей между тремя или более случайными величинами. Мы ограничимся исследованием парной корреляции. Как известно, связь между двумя случайными величинами можно описать с помощью двумерной функции распределения. Однако такое описание часто очень сложно, а для практических целей можно удовлетвориться определением зависимостей средних значений.

Слайд 43





Итак, целью имитационного эксперимента является определение характеристик двух случайных величин a и b.
Итак, целью имитационного эксперимента является определение характеристик двух случайных величин a и b.
Необходимо проверить: есть ли связь между величинами  a и b?
Проверка наличия (или отсутствия) связи - корреляции - между случайными величинами выполняется так.
Проводится два эксперимента, каждый - с соответствующей моделью. В каждом эксперименте -N наблюдений (напоминаем, что компьютерный эксперимент состоит из наблюдений, а наблюдение - из реализаций (прогонов) модели, число которых рассчитывается с учетом требуемой точности и достоверности получаемых результатов моделирования).
 В результате экспериментов получаются два множества значений измеряемых параметров  a и b:  ai и bi,
Описание слайда:
Итак, целью имитационного эксперимента является определение характеристик двух случайных величин a и b. Итак, целью имитационного эксперимента является определение характеристик двух случайных величин a и b. Необходимо проверить: есть ли связь между величинами  a и b? Проверка наличия (или отсутствия) связи - корреляции - между случайными величинами выполняется так. Проводится два эксперимента, каждый - с соответствующей моделью. В каждом эксперименте -N наблюдений (напоминаем, что компьютерный эксперимент состоит из наблюдений, а наблюдение - из реализаций (прогонов) модели, число которых рассчитывается с учетом требуемой точности и достоверности получаемых результатов моделирования). В результате экспериментов получаются два множества значений измеряемых параметров  a и b:  ai и bi,

Слайд 44





Из этих множеств формируются пары:
Из этих множеств формируются пары:
Каждая пара интерпретируется как координаты случайной точки в системе координат a, b. Первичное исследование можно провести графически. Возможны следующие варианты размещения точек на графиках (рисунок 7.1).
Описание слайда:
Из этих множеств формируются пары: Из этих множеств формируются пары: Каждая пара интерпретируется как координаты случайной точки в системе координат a, b. Первичное исследование можно провести графически. Возможны следующие варианты размещения точек на графиках (рисунок 7.1).

Слайд 45





Можно научиться  визуально определять по расположению данных, насколько тесно они коррелированны.
Можно научиться  визуально определять по расположению данных, насколько тесно они коррелированны.
Говорят, что две переменные положительно
 коррелированны, если при увеличении значений одной переменной увеличиваются значения другой переменной (рисунок 7.1-б).
Две переменные отрицательно коррелированны, если при увеличении одной переменной другая переменная уменьшается (рисунок 7.1-в).
Отсутствие корреляции - совместного поведения переменных - обнаруживается хаотическим нагромождением точек, исключающим проведение какой-либо аппроксимирующей линии (рисунок 7.1-г).
Но такое качественное исследование недостаточно. Необходимо иметь количественную оценку степени корреляции между величинами a и b.
Описание слайда:
Можно научиться визуально определять по расположению данных, насколько тесно они коррелированны. Можно научиться визуально определять по расположению данных, насколько тесно они коррелированны. Говорят, что две переменные положительно  коррелированны, если при увеличении значений одной переменной увеличиваются значения другой переменной (рисунок 7.1-б). Две переменные отрицательно коррелированны, если при увеличении одной переменной другая переменная уменьшается (рисунок 7.1-в). Отсутствие корреляции - совместного поведения переменных - обнаруживается хаотическим нагромождением точек, исключающим проведение какой-либо аппроксимирующей линии (рисунок 7.1-г). Но такое качественное исследование недостаточно. Необходимо иметь количественную оценку степени корреляции между величинами a и b.

Слайд 46





Если совместное распределение вероятностей случайных величин  и  нормальное, то количественной характеристикой степени линейной связи между ними является коэффициент корреляции r (введен Пирсоном):
Если совместное распределение вероятностей случайных величин  и  нормальное, то количественной характеристикой степени линейной связи между ними является коэффициент корреляции r (введен Пирсоном):
Если r=0, то между a и b линейная независимость.
Равенство r=±1 свидетельствует о наличии однозначной функциональной связи между  a и b, то есть b=f(a).
При -1<r<1 между a и b существует стохастическая связь, причем, чем ближе коэффициент корреляции |r| к единице, тем эта связь сильнее. Стохастическая связь означает, что при изменении a имеется лишь тенденция к изменению b.
Описание слайда:
Если совместное распределение вероятностей случайных величин  и  нормальное, то количественной характеристикой степени линейной связи между ними является коэффициент корреляции r (введен Пирсоном): Если совместное распределение вероятностей случайных величин  и  нормальное, то количественной характеристикой степени линейной связи между ними является коэффициент корреляции r (введен Пирсоном): Если r=0, то между a и b линейная независимость. Равенство r=±1 свидетельствует о наличии однозначной функциональной связи между  a и b, то есть b=f(a). При -1<r<1 между a и b существует стохастическая связь, причем, чем ближе коэффициент корреляции |r| к единице, тем эта связь сильнее. Стохастическая связь означает, что при изменении a имеется лишь тенденция к изменению b.

Слайд 47





Коэффициент корреляции r определяется по данным эксперимента, следовательно, можно определить только его оценку   . В качестве оценки    принят выборочный коэффициент корреляции:
Коэффициент корреляции r определяется по данным эксперимента, следовательно, можно определить только его оценку   . В качестве оценки    принят выборочный коэффициент корреляции:
где ā - оценки математических ожиданий и M(a) и M(b); 
Sa,Sb - оценки среднеквадратических отклонений σa,σb
Описание слайда:
Коэффициент корреляции r определяется по данным эксперимента, следовательно, можно определить только его оценку  . В качестве оценки   принят выборочный коэффициент корреляции: Коэффициент корреляции r определяется по данным эксперимента, следовательно, можно определить только его оценку  . В качестве оценки   принят выборочный коэффициент корреляции: где ā - оценки математических ожиданий и M(a) и M(b); Sa,Sb - оценки среднеквадратических отклонений σa,σb

Слайд 48





8.Обработка результатов эксперимента на основе регрессии
Часто целью исследования является определение 
функциональной связи между факторами и откликом (реакцией модели) по данным, полученным при экспериментах с моделью объекта или непосредственно с объектом. Такая цель достигается регрессионным анализом значений факторов x и отклика y.
Под регрессией в теории вероятностей и математической статистике понимают зависимость среднего значения какой-либо величины от некоторой другой (других) величины.
 Регрессионный анализ - это совокупность методов построения и исследования регрессионной зависимости между величинами (в нашем случае между факторами и откликом) по статистическим данным. Статистические данные накапливаются при проведении эксперимента.
Описание слайда:
8.Обработка результатов эксперимента на основе регрессии Часто целью исследования является определение  функциональной связи между факторами и откликом (реакцией модели) по данным, полученным при экспериментах с моделью объекта или непосредственно с объектом. Такая цель достигается регрессионным анализом значений факторов x и отклика y. Под регрессией в теории вероятностей и математической статистике понимают зависимость среднего значения какой-либо величины от некоторой другой (других) величины.  Регрессионный анализ - это совокупность методов построения и исследования регрессионной зависимости между величинами (в нашем случае между факторами и откликом) по статистическим данным. Статистические данные накапливаются при проведении эксперимента.

Слайд 49





Функциональную зависимость между факторами и откликом представим  в виде аппроксимирующего полинома:
Функциональную зависимость между факторами и откликом представим  в виде аппроксимирующего полинома:
Этот полином получил название уравнения регрессии, а коэффициенты βi - коэффициенты регрессии. От точности подбора коэффициентов регрессии
зависит точность представления f(x).
Коэффициенты βi  определяются путем обработки полученных в ходе эксперимента варьируемых значений факторов и откликов.
Однако из-за ограниченного числа наблюдений точные значения βi  получить нельзя, будут найдены их оценки bi:
Описание слайда:
Функциональную зависимость между факторами и откликом представим в виде аппроксимирующего полинома: Функциональную зависимость между факторами и откликом представим в виде аппроксимирующего полинома: Этот полином получил название уравнения регрессии, а коэффициенты βi - коэффициенты регрессии. От точности подбора коэффициентов регрессии зависит точность представления f(x). Коэффициенты βi  определяются путем обработки полученных в ходе эксперимента варьируемых значений факторов и откликов. Однако из-за ограниченного числа наблюдений точные значения βi  получить нельзя, будут найдены их оценки bi:

Слайд 50





Поэтому уравнение регрессии принимает вид:
Поэтому уравнение регрессии принимает вид:
В уравнении регрессии могут участвовать и так называемые "совместные эффекты" (x1x2, x1x2x3 и т. п.) или степени значений факторов (x21, x32 и т. п.). Совместные эффекты и степени факторов можно обозначать обобщенным фактором. Например, уравнение регрессии
можно представить так:
Описание слайда:
Поэтому уравнение регрессии принимает вид: Поэтому уравнение регрессии принимает вид: В уравнении регрессии могут участвовать и так называемые "совместные эффекты" (x1x2, x1x2x3 и т. п.) или степени значений факторов (x21, x32 и т. п.). Совместные эффекты и степени факторов можно обозначать обобщенным фактором. Например, уравнение регрессии можно представить так:

Слайд 51





Итак, для определения выражения f(x) надо:
Итак, для определения выражения f(x) надо:
выбрать степень аппроксимирующего полинома - уравнения регрессии;
определить коэффициенты регрессии.
Выбор уравнения регрессии обычно начинают с линейной модели. Например, для двухфакторного эксперимента ее вид:
Если окажется, что такая аппроксимация дает неприемлемые отклонения при сравнении с экспериментальными точками отклика y , то модель усложняется, например, так:
или
Описание слайда:
Итак, для определения выражения f(x) надо: Итак, для определения выражения f(x) надо: выбрать степень аппроксимирующего полинома - уравнения регрессии; определить коэффициенты регрессии. Выбор уравнения регрессии обычно начинают с линейной модели. Например, для двухфакторного эксперимента ее вид: Если окажется, что такая аппроксимация дает неприемлемые отклонения при сравнении с экспериментальными точками отклика y , то модель усложняется, например, так: или

Слайд 52





Коэффициенты регрессии bi для выбранного уравнения определяются из условия минимума суммы квадратов ошибок, вычисленных по всем экспериментальным точкам. Это делается так. Введем обозначения:
Коэффициенты регрессии bi для выбранного уравнения определяются из условия минимума суммы квадратов ошибок, вычисленных по всем экспериментальным точкам. Это делается так. Введем обозначения:
xil - значение i-го фактора в наблюдении номер l;
yl - значение отклика в l-м наблюдении;
    - значение отклика, вычисленное по принятому уравнению регрессии и данным xil.
Очевидно, сумма квадратов ошибок между экспериментальными значениями yl  и вычисленными по уравнению регрессии  yl  для всех N наблюдений равна:
Описание слайда:
Коэффициенты регрессии bi для выбранного уравнения определяются из условия минимума суммы квадратов ошибок, вычисленных по всем экспериментальным точкам. Это делается так. Введем обозначения: Коэффициенты регрессии bi для выбранного уравнения определяются из условия минимума суммы квадратов ошибок, вычисленных по всем экспериментальным точкам. Это делается так. Введем обозначения: xil - значение i-го фактора в наблюдении номер l; yl - значение отклика в l-м наблюдении;  - значение отклика, вычисленное по принятому уравнению регрессии и данным xil. Очевидно, сумма квадратов ошибок между экспериментальными значениями yl  и вычисленными по уравнению регрессии  yl  для всех N наблюдений равна:

Слайд 53





Для определения минимума ошибки возьмем частные производные от δ по всем неизвестным коэффициентам регрессии bj, j=1,n,  и приравняем их нулю:
Для определения минимума ошибки возьмем частные производные от δ по всем неизвестным коэффициентам регрессии bj, j=1,n,  и приравняем их нулю:
Это условие минимума, а не максимума. Очевидно:
Описание слайда:
Для определения минимума ошибки возьмем частные производные от δ по всем неизвестным коэффициентам регрессии bj, j=1,n,  и приравняем их нулю: Для определения минимума ошибки возьмем частные производные от δ по всем неизвестным коэффициентам регрессии bj, j=1,n,  и приравняем их нулю: Это условие минимума, а не максимума. Очевидно:

Слайд 54





Для лучшей наглядности выделим неизвестные коэффициенты регрессии и получим:
Для лучшей наглядности выделим неизвестные коэффициенты регрессии и получим:


Данное выражение  представляет собой систему из n+1  уравнений для нахождения  n+1 неизвестных коэффициентов регрессии bi, которые окончательно определят выбранное уравнение регрессии.
Нахождение коэффициентов регрессии справедливо при следующих допущениях:
Случайный фактор ξ имеет нормальное распределение с матожиданием M[ξ ]=0.
Результаты наблюдений yl - независимые нормально распределенные случайные величины. Если это не соблюдается, то следует измерять другой отклик, удовлетворяющий этому условию, но функционально связанный с исследуемым откликом y.
Точность наблюдений (количество реализаций модели) не меняется от наблюдения к наблюдению.
Точность наблюдения xil  должна быть выше точности yl.
Описание слайда:
Для лучшей наглядности выделим неизвестные коэффициенты регрессии и получим: Для лучшей наглядности выделим неизвестные коэффициенты регрессии и получим: Данное выражение  представляет собой систему из n+1  уравнений для нахождения  n+1 неизвестных коэффициентов регрессии bi, которые окончательно определят выбранное уравнение регрессии. Нахождение коэффициентов регрессии справедливо при следующих допущениях: Случайный фактор ξ имеет нормальное распределение с матожиданием M[ξ ]=0. Результаты наблюдений yl - независимые нормально распределенные случайные величины. Если это не соблюдается, то следует измерять другой отклик, удовлетворяющий этому условию, но функционально связанный с исследуемым откликом y. Точность наблюдений (количество реализаций модели) не меняется от наблюдения к наблюдению. Точность наблюдения xil  должна быть выше точности yl.



Похожие презентации
Mypresentation.ru
Загрузить презентацию