🗊Презентация Статистическая обработка результатов

Категория: Математика
Нажмите для полного просмотра!
Статистическая обработка результатов, слайд №1Статистическая обработка результатов, слайд №2Статистическая обработка результатов, слайд №3Статистическая обработка результатов, слайд №4Статистическая обработка результатов, слайд №5Статистическая обработка результатов, слайд №6Статистическая обработка результатов, слайд №7Статистическая обработка результатов, слайд №8Статистическая обработка результатов, слайд №9Статистическая обработка результатов, слайд №10Статистическая обработка результатов, слайд №11Статистическая обработка результатов, слайд №12Статистическая обработка результатов, слайд №13Статистическая обработка результатов, слайд №14Статистическая обработка результатов, слайд №15Статистическая обработка результатов, слайд №16Статистическая обработка результатов, слайд №17Статистическая обработка результатов, слайд №18Статистическая обработка результатов, слайд №19Статистическая обработка результатов, слайд №20Статистическая обработка результатов, слайд №21Статистическая обработка результатов, слайд №22Статистическая обработка результатов, слайд №23Статистическая обработка результатов, слайд №24Статистическая обработка результатов, слайд №25Статистическая обработка результатов, слайд №26Статистическая обработка результатов, слайд №27Статистическая обработка результатов, слайд №28Статистическая обработка результатов, слайд №29Статистическая обработка результатов, слайд №30Статистическая обработка результатов, слайд №31Статистическая обработка результатов, слайд №32Статистическая обработка результатов, слайд №33Статистическая обработка результатов, слайд №34Статистическая обработка результатов, слайд №35Статистическая обработка результатов, слайд №36Статистическая обработка результатов, слайд №37Статистическая обработка результатов, слайд №38Статистическая обработка результатов, слайд №39Статистическая обработка результатов, слайд №40Статистическая обработка результатов, слайд №41Статистическая обработка результатов, слайд №42Статистическая обработка результатов, слайд №43Статистическая обработка результатов, слайд №44

Содержание

Вы можете ознакомиться и скачать презентацию на тему Статистическая обработка результатов. Доклад-сообщение содержит 44 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Методология научных исследований
Лекции 3-4 Статистическая обработка результатов
Описание слайда:
Методология научных исследований Лекции 3-4 Статистическая обработка результатов

Слайд 2





План
1. Общее понятие о статистике
2. Представление данных
3. Описательная статистика
4. Индуктивная статистика
Описание слайда:
План 1. Общее понятие о статистике 2. Представление данных 3. Описательная статистика 4. Индуктивная статистика

Слайд 3





Литература
Руководство по проведению научных исследований в области биологии для студентов и аспирантов / сост. Л.А.Гайсина, А.И.Фазлутдинова, Ю.З.Габидуллин Уфа: Изд-во БГПУ, 2008. 72с.
 http://www.statsoft.ru.
Описание слайда:
Литература Руководство по проведению научных исследований в области биологии для студентов и аспирантов / сост. Л.А.Гайсина, А.И.Фазлутдинова, Ю.З.Габидуллин Уфа: Изд-во БГПУ, 2008. 72с. http://www.statsoft.ru.

Слайд 4





1. Общее понятие о статистике
Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формулами, требующими высокого уровня абстрагирования.
Статистика – это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статисти­кой.
Описание слайда:
1. Общее понятие о статистике Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формулами, требующими высокого уровня абстрагирования. Статистика – это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статисти­кой.

Слайд 5





Общее понятие о статистике
Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования. Они состоят в синтезе данных, в их сравнении и сопоставлении, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. 
Именно в этом заключается цель статистики в науке. Без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях (Годфруа, 1992).
Описание слайда:
Общее понятие о статистике Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования. Они состоят в синтезе данных, в их сравнении и сопоставлении, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науке. Без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях (Годфруа, 1992).

Слайд 6





Разделы статистики
Рассмотрим в самых общих чертах три главных раздела статистики.
1.	Описательная статистика, как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков данные того или иного распределения, вычислять среднее для данного распределения и его размах и дисперсию.
2.	Задача индуктивной статистики – проверка того, можно ли рас-пространить результаты, полученные на данной выборке, на всю популяцию, из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции экстраполировать на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают выводы и обобщения исходя из данных, полученных при изучении выборки.
Описание слайда:
Разделы статистики Рассмотрим в самых общих чертах три главных раздела статистики. 1. Описательная статистика, как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков данные того или иного распределения, вычислять среднее для данного распределения и его размах и дисперсию. 2. Задача индуктивной статистики – проверка того, можно ли рас-пространить результаты, полученные на данной выборке, на всю популяцию, из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции экстраполировать на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают выводы и обобщения исходя из данных, полученных при изучении выборки.

Слайд 7





Разделы статистики
3.	Наконец, измерение корреляции позволяет узнать, насколько связаны между собой две переменные, с тем, чтобы можно было предсказывать возможные значения одной из них, если мы знаем другую.
Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность – это наиболее широко применяемые параметрические методы, в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность – это непараметрические методы, оказывающие неоценимую услугу в том случае, если исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения (Год-фруа, 1992).
Описание слайда:
Разделы статистики 3. Наконец, измерение корреляции позволяет узнать, насколько связаны между собой две переменные, с тем, чтобы можно было предсказывать возможные значения одной из них, если мы знаем другую. Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность – это наиболее широко применяемые параметрические методы, в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность – это непараметрические методы, оказывающие неоценимую услугу в том случае, если исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения (Год-фруа, 1992).

Слайд 8





2. Представление данных
Одна из задач статистики состоит в том, чтобы анализировать данные, полученные на части популяции, а затем сделать выводы относительно популяции в целом. 
Популяция в статистике не обязательно означает какую-либо группу людей или естественное сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую совокуп­ность, будь то атомы или студенты, посещающие то или иное кафе.
 Выборка – это небольшое количество элементов, отобранных с помощью научных методов так, чтобы она была репрезентативной, т. е. отражала популяцию в целом.
Описание слайда:
2. Представление данных Одна из задач статистики состоит в том, чтобы анализировать данные, полученные на части популяции, а затем сделать выводы относительно популяции в целом. Популяция в статистике не обязательно означает какую-либо группу людей или естественное сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую совокуп­ность, будь то атомы или студенты, посещающие то или иное кафе. Выборка – это небольшое количество элементов, отобранных с помощью научных методов так, чтобы она была репрезентативной, т. е. отражала популяцию в целом.

Слайд 9





Представление данных
Данные в статистике – это основные элементы, подлежащие анализу. Данными могут быть какие-то количественные результаты, свойства, присущие определенным членам популяции, место в той или иной последовательности – в общем, любая информация, которая может быть классифицирована или разбита на категории с целью обработки.
 Построение распределения – это разделение первичных данных, полу­ченных на выборке, на классы или категории с целью получить обобщен­ную упорядоченную картину, позволяющую их анализировать.
Описание слайда:
Представление данных Данные в статистике – это основные элементы, подлежащие анализу. Данными могут быть какие-то количественные результаты, свойства, присущие определенным членам популяции, место в той или иной последовательности – в общем, любая информация, которая может быть классифицирована или разбита на категории с целью обработки. Построение распределения – это разделение первичных данных, полу­ченных на выборке, на классы или категории с целью получить обобщен­ную упорядоченную картину, позволяющую их анализировать.

Слайд 10





Представление данных
Существуют три типа данных:
Количественные данные, получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирова­ния и т.п.). Их можно распределить по шкале с равными интервалами.
Порядковые данные, соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастаю­щем порядке (1-й, ..., 7-й, ..., 100-й, ...; А, Б, В, ...).
Качественные данные, представляющие собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число лиц с голубыми или с зелеными глазами, курильщиков и не курильщиков утомленных и отдохнувших, сильных и слабых и т. п.).
Описание слайда:
Представление данных Существуют три типа данных: Количественные данные, получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирова­ния и т.п.). Их можно распределить по шкале с равными интервалами. Порядковые данные, соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастаю­щем порядке (1-й, ..., 7-й, ..., 100-й, ...; А, Б, В, ...). Качественные данные, представляющие собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число лиц с голубыми или с зелеными глазами, курильщиков и не курильщиков утомленных и отдохнувших, сильных и слабых и т. п.).

Слайд 11





Составление таблиц
Таблицы относятся к наиболее простому способу представления данных. Они состоят из колонок со значениями двух или более связанных переменных. 
С помощью этого метода трудно получить прямое и ясное указание на связь между переменными, но он часто является первым этапом регистрации информации и служит основой для выбора после­дующей формы графического представления дан­ных (Грин и др., 1996).
 
Описание слайда:
Составление таблиц Таблицы относятся к наиболее простому способу представления данных. Они состоят из колонок со значениями двух или более связанных переменных. С помощью этого метода трудно получить прямое и ясное указание на связь между переменными, но он часто является первым этапом регистрации информации и служит основой для выбора после­дующей формы графического представления дан­ных (Грин и др., 1996).  

Слайд 12





Графическое представление данных
График – это двухмерное изображение зависимости между двумя или более переменными. 
График самой простой формы строится на двух осях. 
По вертикальной оси (оси y) откладываются значения, называемые ординатами, которые показывают вели­чину зависимой переменной, т.е. функции. Это – «неизвестное количество», иными словами перемен­ная, значения которой не выбираются эксперимента­тором. 
Горизонтальная ось х несет значения, назы­ваемые абсциссами, которые показывают величину независимой переменной. Это – «известное количест­во», т. е. переменная, значения которой выбираются экспериментатором.
Описание слайда:
Графическое представление данных График – это двухмерное изображение зависимости между двумя или более переменными. График самой простой формы строится на двух осях. По вертикальной оси (оси y) откладываются значения, называемые ординатами, которые показывают вели­чину зависимой переменной, т.е. функции. Это – «неизвестное количество», иными словами перемен­ная, значения которой не выбираются эксперимента­тором. Горизонтальная ось х несет значения, назы­ваемые абсциссами, которые показывают величину независимой переменной. Это – «известное количест­во», т. е. переменная, значения которой выбираются экспериментатором.

Слайд 13





Пример графика
Описание слайда:
Пример графика

Слайд 14





Распределение частот
Существует множество отношений между перемен­ными, при которых каждое значение зависимой переменной, соответствующее значению независи­мой переменной, представляет собой число собы­тий, приходящихся на данное значение независимой переменной, т.е. ее частоту. Такие отношения можно описать функцией распределения частот, или просто распределением, например, дождевых червей по длине тела в популяции.
Если независимая переменная может принимать любые значения в пределах данного ряда, то распределение частот можно представить в виде обычного графика, как это описано выше. Такие графики называются кривыми распределения и в зависимости от рода данных могут иметь одну из форм, описанных ниже. Если данные представляют собой численность организмов в пределах опреде­ленного интервала, то распределение называется непрерывным, а все пространство под кривой составляет общую частоту событий.
Описание слайда:
Распределение частот Существует множество отношений между перемен­ными, при которых каждое значение зависимой переменной, соответствующее значению независи­мой переменной, представляет собой число собы­тий, приходящихся на данное значение независимой переменной, т.е. ее частоту. Такие отношения можно описать функцией распределения частот, или просто распределением, например, дождевых червей по длине тела в популяции. Если независимая переменная может принимать любые значения в пределах данного ряда, то распределение частот можно представить в виде обычного графика, как это описано выше. Такие графики называются кривыми распределения и в зависимости от рода данных могут иметь одну из форм, описанных ниже. Если данные представляют собой численность организмов в пределах опреде­ленного интервала, то распределение называется непрерывным, а все пространство под кривой составляет общую частоту событий.

Слайд 15





Распределение частот
Кривая нормального распределения.
В этом случае распределение частот симметрично относительно центрального значения, а рассматриваемые пере­менные относятся к физическим параметрам, таким, как рост или масса биологического объек­та. 
Этот тип распределения показан на рисунке
Описание слайда:
Распределение частот Кривая нормального распределения. В этом случае распределение частот симметрично относительно центрального значения, а рассматриваемые пере­менные относятся к физическим параметрам, таким, как рост или масса биологического объек­та. Этот тип распределения показан на рисунке

Слайд 16





Распределение частот
Положительный уклон.
Кривая распределения в этом случае несимметрична. Наибольшие частоты независимой переменной приходятся на ее более низкие значения, а по направлению к более высоким значениям кривая начинает «хвостить». В качестве примера такого распределения можно привести распределение числа детей, приходящихся на одну семью, размеров кладки у птиц, плотности фитопланктона с увеличением глубины (Грин и др., 1996).
Описание слайда:
Распределение частот Положительный уклон. Кривая распределения в этом случае несимметрична. Наибольшие частоты независимой переменной приходятся на ее более низкие значения, а по направлению к более высоким значениям кривая начинает «хвостить». В качестве примера такого распределения можно привести распределение числа детей, приходящихся на одну семью, размеров кладки у птиц, плотности фитопланктона с увеличением глубины (Грин и др., 1996).

Слайд 17





Распределение частот
Отрицательный уклон.
В этом случае наибольшие частоты независимой переменной приходятся на ее более высокие значения, а по направлению к более низким значениям кривая начинает «хвос­тить». Эта форма распределения встречается реже, чем предыдущая; она харак­терна для распределения некоторых форм смеще­ния. 
Например, распределение оптимальных тем­ператур ферментативных реакций и выработка стимулирующих гормонов щитовидной железы в ответ на действие тироксина.
Бимодальное распределение.
В этом случае на­блюдаются два максимума (или два пика), что обычно указывает на присутствие двух популяций, для каждой из которых характерно неполное нормальное распределение.
Описание слайда:
Распределение частот Отрицательный уклон. В этом случае наибольшие частоты независимой переменной приходятся на ее более высокие значения, а по направлению к более низким значениям кривая начинает «хвос­тить». Эта форма распределения встречается реже, чем предыдущая; она харак­терна для распределения некоторых форм смеще­ния. Например, распределение оптимальных тем­ператур ферментативных реакций и выработка стимулирующих гормонов щитовидной железы в ответ на действие тироксина. Бимодальное распределение. В этом случае на­блюдаются два максимума (или два пика), что обычно указывает на присутствие двух популяций, для каждой из которых характерно неполное нормальное распределение.

Слайд 18





Диаграмма
Если независимая переменная принимает дискрет­ные значения, например, целые числа 3 и 5 (как число лепестков у двудольных), или ею представлены физические признаки, такие, например, как группы крови, которые характеризуются дискретными значениями, то распределение не будет непрерывным. В этом случае нельзя начертить непрерывную кривую, поэтому используются другие, описанные ниже формы графического изображения данных (Грин и др., 1996).
Описание слайда:
Диаграмма Если независимая переменная принимает дискрет­ные значения, например, целые числа 3 и 5 (как число лепестков у двудольных), или ею представлены физические признаки, такие, например, как группы крови, которые характеризуются дискретными значениями, то распределение не будет непрерывным. В этом случае нельзя начертить непрерывную кривую, поэтому используются другие, описанные ниже формы графического изображения данных (Грин и др., 1996).

Слайд 19





Диаграмма
Диаграмма в виде вертикальных столбцов. Она показывает частоту, с которой определенные признаки встречаются внутри популяции. Напри­мер, при помощи такой диаграммы можно отобразить частоту групп крови у человека.
Гистограмма. Она строится на непрерывных значениях независимой переменной, сгруппиро­ванных в классы равной ширины. 
Когда классы равной ширины выбраны, например 0-5, 5-10, 10-15 и т.д., границы интервалов обычно прохо­дят по числам меньшим, чем указанные целые значения, т.е. 0-4,99; 5-9,99; 10-14,99 и т.д. 
В форме гистограммы удобно представлять дан­ные, характеризующие наибольшие выборки. Внешне гистограммы похожи на диаграммы в виде вертикальных столбцов.
Описание слайда:
Диаграмма Диаграмма в виде вертикальных столбцов. Она показывает частоту, с которой определенные признаки встречаются внутри популяции. Напри­мер, при помощи такой диаграммы можно отобразить частоту групп крови у человека. Гистограмма. Она строится на непрерывных значениях независимой переменной, сгруппиро­ванных в классы равной ширины. Когда классы равной ширины выбраны, например 0-5, 5-10, 10-15 и т.д., границы интервалов обычно прохо­дят по числам меньшим, чем указанные целые значения, т.е. 0-4,99; 5-9,99; 10-14,99 и т.д. В форме гистограммы удобно представлять дан­ные, характеризующие наибольшие выборки. Внешне гистограммы похожи на диаграммы в виде вертикальных столбцов.

Слайд 20





Описательная статистика
Описательная статистика позволяет обобщать первичные результа­ты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распреде­ления их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.
После того как данные записаны в виде ряда харак­теризующих переменные значений, например, таких, как рост или частота сокращений сердца, полезно подсчитать их среднее значение и разброс значений. Оценки среднего значения называются характеристиками расположения относительно центра. Они включают среднее, медиану и моду. Оценки разброса величин называются мерой рассеяния, они включают дисперсию и стандартное отклонение (Годфруа, 1992).
Описание слайда:
Описательная статистика Описательная статистика позволяет обобщать первичные результа­ты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распреде­ления их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции. После того как данные записаны в виде ряда харак­теризующих переменные значений, например, таких, как рост или частота сокращений сердца, полезно подсчитать их среднее значение и разброс значений. Оценки среднего значения называются характеристиками расположения относительно центра. Они включают среднее, медиану и моду. Оценки разброса величин называются мерой рассеяния, они включают дисперсию и стандартное отклонение (Годфруа, 1992).

Слайд 21





Характеристики расположения относительно центра. Среднее (среднее арифметическое)
Среднее (среднее арифметическое)
Это «средняя величина» группы значений, которую получают путем сложения всех значений и деления суммы на число сложенных значений. Например, среднее  для значений  , подсчитывается следующим образом:
Описание слайда:
Характеристики расположения относительно центра. Среднее (среднее арифметическое) Среднее (среднее арифметическое) Это «средняя величина» группы значений, которую получают путем сложения всех значений и деления суммы на число сложенных значений. Например, среднее для значений , подсчитывается следующим образом:

Слайд 22





Медиана
Описание слайда:
Медиана

Слайд 23





Мода
Это значение переменной, встречающееся наиболее часто. Например, если число детей в десядесяти семьях соответственно равно 1, 1, 1, 2, 2, 2, 2, 3, 4, то мода равна 2.
Описание слайда:
Мода Это значение переменной, встречающееся наиболее часто. Например, если число детей в десядесяти семьях соответственно равно 1, 1, 1, 2, 2, 2, 2, 3, 4, то мода равна 2.

Слайд 24





Соотношение средних величин
Каждое из трех значений, описанных выше, имеет свои преимущества и недостатки и применяется при решении определенных задач. Проиллюстрировать применение среднего или моды можно на примере с различным числом детей в семьях. Среднее число детей в семье составляет 2,4, но так как ребенок – величина дискретная, естественно описывать число детей в семье в целых числах, т. е. с помощью моды, которая равна 2.
В случае нормального распределения значения среднего, медианы и моды совпадают. В случае того или иного уклона частоты распределения их значения не совпадают (Грин и др., 1996).
Описание слайда:
Соотношение средних величин Каждое из трех значений, описанных выше, имеет свои преимущества и недостатки и применяется при решении определенных задач. Проиллюстрировать применение среднего или моды можно на примере с различным числом детей в семьях. Среднее число детей в семье составляет 2,4, но так как ребенок – величина дискретная, естественно описывать число детей в семье в целых числах, т. е. с помощью моды, которая равна 2. В случае нормального распределения значения среднего, медианы и моды совпадают. В случае того или иного уклона частоты распределения их значения не совпадают (Грин и др., 1996).

Слайд 25





Оценки дисперсии
Для того чтобы оценить, в какой мере значения признака отклоняются от среднего, вычисляют среднее и дисперсию. Для нормального распределе­ния это проиллюстрировано двумя кривыми на рисунке. При статистическом анализе данных очень информативной является оценка среднего квадратичного или стандартного отклонения; по этим показателям можно предсказать и распределе­ние значений вокруг среднего и ответить на вопрос, достоверна ли разница между двумя группами дан­ных.
Описание слайда:
Оценки дисперсии Для того чтобы оценить, в какой мере значения признака отклоняются от среднего, вычисляют среднее и дисперсию. Для нормального распределе­ния это проиллюстрировано двумя кривыми на рисунке. При статистическом анализе данных очень информативной является оценка среднего квадратичного или стандартного отклонения; по этим показателям можно предсказать и распределе­ние значений вокруг среднего и ответить на вопрос, достоверна ли разница между двумя группами дан­ных.

Слайд 26





Стандартное отклонение
Описание слайда:
Стандартное отклонение

Слайд 27





Стандартное отклонение
Описание слайда:
Стандартное отклонение

Слайд 28





Стандартное отклонение
В этой популяции имеющих общее происхождение блюдечек среднее максимальное значение диаметра раковины равно 38,3 мм, а стандартное отклонение равно 2,7 мм (округлили до одной десятой). Если эти значения применить к более крупной популяции блюдечек общего происхождения, то на основе статистики можно предположить, что приблизи­тельно 68% популяции будет иметь диаметр ра­ковины 38,3 мм плюс-минус одно стандартное отклонение (2,7 мм), т.е. размеры раковин будут лежать в интервале от 35,6 до 41,0 мм; прибли­зительно 95% популяции будут иметь диаметр раковины 38,3 мм плюс-минус два стандартных отклонения (5,4 мм), т. е. диаметры будут лежать в интервале 32,9-43,7 мм, а практически 100% будут лежать в интервале плюс-минус три стандартных отклонения от 38,3 мм.
Описание слайда:
Стандартное отклонение В этой популяции имеющих общее происхождение блюдечек среднее максимальное значение диаметра раковины равно 38,3 мм, а стандартное отклонение равно 2,7 мм (округлили до одной десятой). Если эти значения применить к более крупной популяции блюдечек общего происхождения, то на основе статистики можно предположить, что приблизи­тельно 68% популяции будет иметь диаметр ра­ковины 38,3 мм плюс-минус одно стандартное отклонение (2,7 мм), т.е. размеры раковин будут лежать в интервале от 35,6 до 41,0 мм; прибли­зительно 95% популяции будут иметь диаметр раковины 38,3 мм плюс-минус два стандартных отклонения (5,4 мм), т. е. диаметры будут лежать в интервале 32,9-43,7 мм, а практически 100% будут лежать в интервале плюс-минус три стандартных отклонения от 38,3 мм.

Слайд 29





Дисперсия
Описание слайда:
Дисперсия

Слайд 30





Дисперсия
Описание слайда:
Дисперсия

Слайд 31





Связь между переменными
Данные всегда необходимо представлять таким образом, чтобы можно было выявить связи между двумя или более их совокупностями. Проще всего это сделать с помощью графика или диаграммы, показывающих связь между переменными. Но это целесообразно только в том случае, если одна из переменных (независимая переменная) находится под контролем экспериментатора, как, например, в случае, приведенном на рисунке.
В других случаях, когда обе переменные являются независимыми, составляют таблицу, в которой значение одной помещают под соответствующим значением другой. На основе этих данных вычерчивают график, который называется диаграммой рассеяния.
Описание слайда:
Связь между переменными Данные всегда необходимо представлять таким образом, чтобы можно было выявить связи между двумя или более их совокупностями. Проще всего это сделать с помощью графика или диаграммы, показывающих связь между переменными. Но это целесообразно только в том случае, если одна из переменных (независимая переменная) находится под контролем экспериментатора, как, например, в случае, приведенном на рисунке. В других случаях, когда обе переменные являются независимыми, составляют таблицу, в которой значение одной помещают под соответствующим значением другой. На основе этих данных вычерчивают график, который называется диаграммой рассеяния.

Слайд 32





Линия регрессии
По внешнему виду графика видно, что эти две переменные связаны между собой некоторым образом, но эту связь невозможно описать более точно до тех пор, пока они не будут представлены в виде прямой линии, проходящей через точки графика.
Эта линия называется «линией наибольшего соответствия», или линией регрессии. Мера приближения точек к линии указывает на степень корреляции между двумя переменными. 
Линия наибольшего соответствия должна проходить через точку, соответствующую среднему значению массы и роста ( кг,  см), а число точек над и под линией должно быть приблизительно одинаковым. По этой линии можно подсчитать рост, соответствующий определенной массе (Грин и др., 1996).
Описание слайда:
Линия регрессии По внешнему виду графика видно, что эти две переменные связаны между собой некоторым образом, но эту связь невозможно описать более точно до тех пор, пока они не будут представлены в виде прямой линии, проходящей через точки графика. Эта линия называется «линией наибольшего соответствия», или линией регрессии. Мера приближения точек к линии указывает на степень корреляции между двумя переменными. Линия наибольшего соответствия должна проходить через точку, соответствующую среднему значению массы и роста ( кг, см), а число точек над и под линией должно быть приблизительно одинаковым. По этой линии можно подсчитать рост, соответствующий определенной массе (Грин и др., 1996).

Слайд 33





Индуктивная статистика
Задачи индуктивной статистики заключаются в том, чтобы опреде­лять, насколько вероятно, что две выборки принадлежат к одной популяции.
Для этого необходимо наложить друг на друга, с одной стороны, две кривые – до и после воздействия – для контрольной группы и, с другой стороны, две аналогичные кривые для опытной группы. При этом масштаб кривых должен быть одинаковым.
Описание слайда:
Индуктивная статистика Задачи индуктивной статистики заключаются в том, чтобы опреде­лять, насколько вероятно, что две выборки принадлежат к одной популяции. Для этого необходимо наложить друг на друга, с одной стороны, две кривые – до и после воздействия – для контрольной группы и, с другой стороны, две аналогичные кривые для опытной группы. При этом масштаб кривых должен быть одинаковым.

Слайд 34





Индуктивная статистика
Видно, что в контрольной группе разница между средними обоих распределений невелика, и поэтому можно предположить, что обе выборки принадлежат к одной и той же популяции. Напротив, в опытной группе большая разность между средними позволяет сделать вывод о том, что рас­пределения для фона и воздействия относятся к двум различным популяциям, разница между которыми обусловлена тем, что на одну из них повлияла независимая переменная (Годфруа, 1992).
Описание слайда:
Индуктивная статистика Видно, что в контрольной группе разница между средними обоих распределений невелика, и поэтому можно предположить, что обе выборки принадлежат к одной и той же популяции. Напротив, в опытной группе большая разность между средними позволяет сделать вывод о том, что рас­пределения для фона и воздействия относятся к двум различным популяциям, разница между которыми обусловлена тем, что на одну из них повлияла независимая переменная (Годфруа, 1992).

Слайд 35





Проверка гипотез
Как уже говорилось, задача индуктивной статистики – определять, достаточно ли велика разность между средними двух распределений для того, чтобы можно было объяснить ее действием независимой перемен­ной, а не случайностью, связанной с малым объемом выборки (как, по-видимому, обстоит дело в случае с опытной группой экспе­римента).
При этом возможны две гипотезы:
1) нулевая гипотеза (Н0), согласно которой разница между распреде­лениями недостоверна; предполагается, что различие недостаточно зна­чительно, и поэтому распределения относятся к одной и той же популя­ции, а независимая переменная не оказывает никакого влияния;
2) альтернативная гипотеза (Н1), какой является рабочая гипотеза данного исследования. В соответствии с этой гипотезой различия между обоими распределениями достаточно значимы и обусловлены влиянием независимой переменной.
Описание слайда:
Проверка гипотез Как уже говорилось, задача индуктивной статистики – определять, достаточно ли велика разность между средними двух распределений для того, чтобы можно было объяснить ее действием независимой перемен­ной, а не случайностью, связанной с малым объемом выборки (как, по-видимому, обстоит дело в случае с опытной группой экспе­римента). При этом возможны две гипотезы: 1) нулевая гипотеза (Н0), согласно которой разница между распреде­лениями недостоверна; предполагается, что различие недостаточно зна­чительно, и поэтому распределения относятся к одной и той же популя­ции, а независимая переменная не оказывает никакого влияния; 2) альтернативная гипотеза (Н1), какой является рабочая гипотеза данного исследования. В соответствии с этой гипотезой различия между обоими распределениями достаточно значимы и обусловлены влиянием независимой переменной.

Слайд 36





Проверка гипотез
Основной принцип метода проверки гипотез состоит в том, что выдвигается нулевая гипотеза Н0, с тем чтобы попытаться опровергнуть ее и тем самым подтвердить альтернативную гипотезу H1. Действитель­но, если результаты статистического теста, используемого для анализа разницы между средними, окажутся таковы, что позволят отбросить Н0, это будет означать, что верна Н1, т.е. выдвинутая рабочая гипотеза подтверждается.
Принято считать, что нулевую гипотезу можно отвергнуть в пользу альтернативной гипотезы, если по результа­там статистического теста вероятность случайного возникновения най­денного различия не превышает 5 из 100. Если же этот уровень достоверности не достигается, считают, что разница вполне может быть случайной и поэтому нельзя отбросить нулевую гипотезу (Годфруа, 1992).
Описание слайда:
Проверка гипотез Основной принцип метода проверки гипотез состоит в том, что выдвигается нулевая гипотеза Н0, с тем чтобы попытаться опровергнуть ее и тем самым подтвердить альтернативную гипотезу H1. Действитель­но, если результаты статистического теста, используемого для анализа разницы между средними, окажутся таковы, что позволят отбросить Н0, это будет означать, что верна Н1, т.е. выдвинутая рабочая гипотеза подтверждается. Принято считать, что нулевую гипотезу можно отвергнуть в пользу альтернативной гипотезы, если по результа­там статистического теста вероятность случайного возникновения най­денного различия не превышает 5 из 100. Если же этот уровень достоверности не достигается, считают, что разница вполне может быть случайной и поэтому нельзя отбросить нулевую гипотезу (Годфруа, 1992).

Слайд 37





Проверка гипотез
Для того чтобы судить о том, какова вероятность ошибиться, принимая или отвергая нулевую гипотезу, применяют статистические методы, соответствующие особенностям выборки.
Так, для количественных данных при распреде­лениях, близких к нормальным, используют параметрические методы, основанные на таких показателях, как средняя и стандартное отклоне­ние. В частности, для определения достоверности разницы средних для двух выборок применяют метод Стьюдента, а для того чтобы судить о различиях между тремя или большим числом выборок, – тест F, или дисперсионный анализ.
Если же мы имеем дело с неколичественными данными или выборки слишком малы для уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению, тогда используют непараметрические методы – критерии χ2 (хи) для качественных данных и критерии знаков, рангов, Манна-Уитни, Вилкоксона и другие для порядковых данных.
Описание слайда:
Проверка гипотез Для того чтобы судить о том, какова вероятность ошибиться, принимая или отвергая нулевую гипотезу, применяют статистические методы, соответствующие особенностям выборки. Так, для количественных данных при распреде­лениях, близких к нормальным, используют параметрические методы, основанные на таких показателях, как средняя и стандартное отклоне­ние. В частности, для определения достоверности разницы средних для двух выборок применяют метод Стьюдента, а для того чтобы судить о различиях между тремя или большим числом выборок, – тест F, или дисперсионный анализ. Если же мы имеем дело с неколичественными данными или выборки слишком малы для уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению, тогда используют непараметрические методы – критерии χ2 (хи) для качественных данных и критерии знаков, рангов, Манна-Уитни, Вилкоксона и другие для порядковых данных.

Слайд 38





Уровни достоверности (значимости)
Уровни достоверности (значимости)
Тот или иной вывод с некоторой вероятностью может оказаться ошибочным, причем эта вероятность тем меньше, чем больше имеется данных для обоснования этого вывода. Таким образом, чем больше получено результатов, тем в большей степени по различиям между двумя выборками можно судить о том, что действительно имеет место в той популяции, из которой взяты эти выборки.
Однако обычно используемые выборки относительно невелики, и в этих случаях вероятность ошибки может быть значительной. В гумани­тарных науках принято считать, что разница между двумя выборками отражает действительную разницу между соответствующими популя­циями лишь в том случае, если вероятность ошибки для этого утвержде­ния не превышает 5%, т.е. имеется лишь 5 шансов из 100 ошибиться, выдвигая такое утверждение. Это так называемый уровень достоверно­сти (уровень надежности, доверительный уровень) различия. Если этот уровень не превышен, то можно считать вероятным, что выявленная нами разница действительно отражает положение дел в популяции (отсюда еще одно название этого критерия – порог вероятности).
Описание слайда:
Уровни достоверности (значимости) Уровни достоверности (значимости) Тот или иной вывод с некоторой вероятностью может оказаться ошибочным, причем эта вероятность тем меньше, чем больше имеется данных для обоснования этого вывода. Таким образом, чем больше получено результатов, тем в большей степени по различиям между двумя выборками можно судить о том, что действительно имеет место в той популяции, из которой взяты эти выборки. Однако обычно используемые выборки относительно невелики, и в этих случаях вероятность ошибки может быть значительной. В гумани­тарных науках принято считать, что разница между двумя выборками отражает действительную разницу между соответствующими популя­циями лишь в том случае, если вероятность ошибки для этого утвержде­ния не превышает 5%, т.е. имеется лишь 5 шансов из 100 ошибиться, выдвигая такое утверждение. Это так называемый уровень достоверно­сти (уровень надежности, доверительный уровень) различия. Если этот уровень не превышен, то можно считать вероятным, что выявленная нами разница действительно отражает положение дел в популяции (отсюда еще одно название этого критерия – порог вероятности).

Слайд 39





Уровни достоверности (значимости)
Для каждого статистического метода этот уровень можно узнать из таблиц распределения критических значений соответствующих крите­риев (t, χ2 и т.д.); в этих таблицах приведены цифры для уровней 5% (0,05), 1% (0,01) или еще более высоких. 
Если значение критерия для данного числа степеней свободы оказывается ниже критического уровня, соответствующего порогу вероятности 5%, то нулевая гипотеза не может считаться опровергнутой, и это означает, что выявленная разница недостоверна (Годфруа, 1992).
Описание слайда:
Уровни достоверности (значимости) Для каждого статистического метода этот уровень можно узнать из таблиц распределения критических значений соответствующих крите­риев (t, χ2 и т.д.); в этих таблицах приведены цифры для уровней 5% (0,05), 1% (0,01) или еще более высоких. Если значение критерия для данного числа степеней свободы оказывается ниже критического уровня, соответствующего порогу вероятности 5%, то нулевая гипотеза не может считаться опровергнутой, и это означает, что выявленная разница недостоверна (Годфруа, 1992).

Слайд 40





Параметрические методы. Метод Стьюдента (t-тест)
Метод Стьюдента (t-тест)
Это параметрический метод, используемый для проверки гипотез о достоверности разницы средних при анализе количественных данных о популяциях с нормальным распределением и с одинаковой вариансой.
Метод Стьюдента различен для независимых и зависимых выборок. Независимые выборки получаются при исследовании двух различных групп испытуемых (в нашем эксперименте это контрольная и опытная группы).
Описание слайда:
Параметрические методы. Метод Стьюдента (t-тест) Метод Стьюдента (t-тест) Это параметрический метод, используемый для проверки гипотез о достоверности разницы средних при анализе количественных данных о популяциях с нормальным распределением и с одинаковой вариансой. Метод Стьюдента различен для независимых и зависимых выборок. Независимые выборки получаются при исследовании двух различных групп испытуемых (в нашем эксперименте это контрольная и опытная группы).

Слайд 41





Метод Стьюдента
Описание слайда:
Метод Стьюдента

Слайд 42





Метод Стьюдента
Если наш результат больше, чем значение для уровня достоверности 0,05 (вероятность 5%), найденное в таблице, то можно отбросить нулевую гипотезу (Н0) и принять альтернативную гипотезу (Н1), т.е. считать разницу средних достоверной.
Если же, напротив, полученный при вычислении результат меньше, чем табличный (для n – 2 степеней свободы), то нулевую гипотезу нельзя отбросить и, следовательно, разница средних недостоверна (Годфруа, 1992).
Описание слайда:
Метод Стьюдента Если наш результат больше, чем значение для уровня достоверности 0,05 (вероятность 5%), найденное в таблице, то можно отбросить нулевую гипотезу (Н0) и принять альтернативную гипотезу (Н1), т.е. считать разницу средних достоверной. Если же, напротив, полученный при вычислении результат меньше, чем табличный (для n – 2 степеней свободы), то нулевую гипотезу нельзя отбросить и, следовательно, разница средних недостоверна (Годфруа, 1992).

Слайд 43





Степени свободы
Для того чтобы свести к минимуму ошибки, в таблицах критических значений статистических критериев в общем количестве данных не учитывают те, которые можно вывести методом дедукции. Оставшиеся данные составляют так называемое число степеней свободы, т. е. то число данных из выборки, значения которых могут быть случайными.
Так, если сумма трех данных равна 8, то первые два из них могут принимать любые значения, но если они определены, то третье значение становится автоматически известным. Если, например, значение первого данного равно 3, а второго – 1, то третье может быть равным только 4. Таким образом, в такой выборке имеются только две степени свободы. В общем случае для выборки в n данных существует n – 1 степень свободы.
Описание слайда:
Степени свободы Для того чтобы свести к минимуму ошибки, в таблицах критических значений статистических критериев в общем количестве данных не учитывают те, которые можно вывести методом дедукции. Оставшиеся данные составляют так называемое число степеней свободы, т. е. то число данных из выборки, значения которых могут быть случайными. Так, если сумма трех данных равна 8, то первые два из них могут принимать любые значения, но если они определены, то третье значение становится автоматически известным. Если, например, значение первого данного равно 3, а второго – 1, то третье может быть равным только 4. Таким образом, в такой выборке имеются только две степени свободы. В общем случае для выборки в n данных существует n – 1 степень свободы.

Слайд 44





Степени свободы
Если у нас имеются две независимые выборки, то число степеней свободы для первой из них составляет n1 – 1, а для второй – n2 – 1. А поскольку при определении достоверности разницы между ними опираются на анализ каждой выборки, число степеней свободы, по которому нужно будет находить критерий t в таблице, будет составлять (n1 + n2) - 2.
Если же речь идет о двух зависимых выборках, то в основе расчета лежит вычисление суммы разностей, полученных для каждой пары результатов (т. е., например, разностей между результатами до и после воздействия на одного и того же испытуемого). Поскольку одну (любую) из этих разностей можно вычислить, зная остальные разности и их сумму, число степеней свободы для определения критерия t будет равно n – 1 (Годфруа, 1992).
Описание слайда:
Степени свободы Если у нас имеются две независимые выборки, то число степеней свободы для первой из них составляет n1 – 1, а для второй – n2 – 1. А поскольку при определении достоверности разницы между ними опираются на анализ каждой выборки, число степеней свободы, по которому нужно будет находить критерий t в таблице, будет составлять (n1 + n2) - 2. Если же речь идет о двух зависимых выборках, то в основе расчета лежит вычисление суммы разностей, полученных для каждой пары результатов (т. е., например, разностей между результатами до и после воздействия на одного и того же испытуемого). Поскольку одну (любую) из этих разностей можно вычислить, зная остальные разности и их сумму, число степеней свободы для определения критерия t будет равно n – 1 (Годфруа, 1992).



Похожие презентации
Mypresentation.ru
Загрузить презентацию