Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» icon

Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология»



НазваниеКурс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология»
Дата17.10.2016
Размер
ТипКурс лекций


МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ

УЧРЕЖДЕНИЯ ОБРАЗОВАНИЯ «МОГИЛЕВСКИЙ ГОСУДАРСТВЕННЫЙ

УНИВЕРСИТЕТ ИМЕНИ А.А. КУЛЕШОВА»

ИНСТИТУТ ПОВЫШЕНИЯ КВАЛИФИКАЦИИ И ПЕРЕПОДГОТОВКИ КАДРОВ


Курс лекций


«Обработка данных»

для специальности П.04.05.00. П «Практическая психология»


:


Авдеева Н.И.,

кандидат

физико-математических наук,

доцент


Могилев, 2001


Программа

Пояснительная записка


Курс «Основы матстатистики в психологи» разработан на основе образовательных стандартов высшее образование, специальность П.04.05.00 « Практическая психология», РД РБ 02100.5.100-98, высшее образование, специальность Г.07.01.00 « Психология» для переподготовки, по специальности П.04.05.00. П «Практическая психология»,

Цель: дать представление о методах математической статистики и возможности их применении для обработки экспериментальных данных.

Задача: формирование практических умений и навыков по овладению спектром методов математической статистики, используемых в психологии для обработки данных эксперимента.

Особенности:

  • данный курс предназначен для слушателей ИПК, имеющих высшее образование и желающих получить квалификацию «Педагог - психолог системы образования»;

  • с целью обеспечения изучения вопросов учебной программы в полном объеме часть материала выносится на самостоятельное изучение;

  • контроль за самостоятельной работой слушателей будет осуществляться на индивидуальных консультациях.




№ п/п

Содержание дисциплины

Кол-во час

Темы для сам-го изучения

Форма контроля

Лек

Пр.

1.


2.


3.


4.


5.


6.



Введение. Краткая историческая справка. Основные понятия теории вероятности и математической статистики.

Выборочный метод. Понятие генеральной и выборочной совокупности, варианты, вариационного ряда. Статистическое распределение выборки. Полигон и гистограмма. Характеристики вариационного ряда: выборочное среднее, выборочная дисперсия, мода, медиана, размах варьирования, среднее абсолютное отклонение.

^ Статистическая проверка статистических гипотез. Статистическая гипотеза: нулевая и конкурирующая, простая и сложная. Ошибки первого и второго рода.

Проверка гипотезы о нормальном распределении генеральной совокупности: критерий согласия Пирсона. Методика вычисления теоретических частот нормального распределения. Проверка гипотезы об однородности двух выборок (критерий Вилкоксона)

^ Методы сравнения выборочных данных. Сравнение двух дисперсий (независимые выборки, критерий Фишера-Снедекора). Сравнение двух выборочных средних ( независимые выборки малых и больших объемов). Сравнение двух выборочных средних ( зависимые выборки одинакового объема) Сравнение выборочной средней с гипотетической генеральной средней (малые и большие объемы выборки). Сравнение нескольких средних методом дисперсионного анализа

^ Понятие о корреляционном анализе. Функциональная, статистическая и корреляционная зависимости. Выборочный коэффициент корреляции. Проверка гипотезы о значимости выборочного коэффициента корреляции. Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости. Метод парных корреляций. Метод множественных корреляций.

^ Способы табличного и графического представления результатов эксперимента. Таблицы и их структура. Виды таблиц.

Компьютерные программы статистической обработки данных.

Работа в Excel. Нахождение статистического распределения выборки. Построение полигона. Построение гистограммы. Вычисление характеристик вариационного ряда.

1


2


4


2


3


2


10







Решение задач: №№439; 440; 443 – 451; 455 - 456 [2]


№ 635 [2]


№ 627. [2]


№№ 555 – 557; [2]

№№ 567; 570; 571 [2]


№ 583 [2]


№№ 540; 541; 545; 617; 618;622. [2]



Текущий контроль на индивидуальных консультациях


Текущий контроль на индивидуальных консультациях


Текущий контроль на индивидуальных консультациях























Примерная тематика лабораторных занятий


  1. Статистическое распределение выборки. Полигон. Гистограмма. Характеристики вариационного ряда.

  2. Точечные оценки параметров распределения.

  3. Проверка гипотезы об однородности двух выборок (критерий Вилкоксона).

  4. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона.

  5. Сравнение двух дисперсий (независимые выборки, критерий Фишера-Снедекора).

  6. Сравнение двух выборочных средних ( независимые выборки малых и больших объемов).

  7. Сравнение двух выборочных средних ( независимые выборки малых и больших объемов).

  8. Сравнение выборочной средней с гипотетической генеральной средней (малые и большие объемы выборки).

  9. Выборочный коэффициент корреляции. Проверка гипотезы о значимости выборочного коэффициента корреляции.

  10. Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.

Сравнение нескольких средних методом дисперсионного анализа.

Литература

  1. Гмурман В. Е. Теория вероятностей и математическая статистика – М: Высшая школа, 1997

  2. Гмурман В. Е. Руководство к решению задач по теории вероятностей и математическая статистика – М: Высшая школа, 1998

Дополнительная литература

  1. Немов Р. С. Психология – М: Владос, 2000, книга 3

  2. Сараева Н. В. Основы исследовательской деятельности – Могилев, 2001



ВВЕДЕНИЕ

  1. Краткая историческая справка


До 16 века основным и единственным способом демонстрации истинны считалось умственное рассуждение, логика убеждения. Метод познания: живое созерцание, логическое умозаключение.

В 16 веке Галилео Галилей (итальянский ученый) в физическую науку вводит экспериментальный (научный) метод исследования, где главным приемом доказательства становится эксперимент.

С конца 19 века экспериментальный метод становится основой получения научного (достоверного) знания. К сожалению в решении некоторых спорных вопросов часто применяется метод авторитета, а не научный метод отыскания истины.

На статус современной экспериментальной науки претендует психология. В не эксперимент стал внедряться со второй половины 19 столетия. В настоящее время эксперимент широко используется не только в науке, но и в прикладной психологии. Правильно организованный, тщательно проведенный психолого-педагогический эксперимент позволяет ответить на многие вопросы.

В любом реальном эксперименте, в том числе и психологическом, можно выделить следующие блоки:

  1. Формулировка цели исследования

  2. Выбор предмета исследования.

  3. Выбор исследуемого признака, качества, свойства.

  4. Выбор количественной меры оценки качества и ее единицы измерения.

  5. Выбор объекта исследования.

  6. Подготовка и проведение эксперимента.

  7. Сбор количественных результатов наблюдений.

  8. Обработка результатов наблюдений:

  • выбор математической модели, которой можно описать набор полученных экспериментальных данных (выдвижение гипотезы),

  • выбор способа обработки,

  • представление конечного результата,

  • проверка полученного результата (проверка гипотезы).

Если эксперимент направлен на установление закономерностей, которым подчиняются массовые случайные явления, то в этом случае для обработки результатов наблюдений и проверки полученного результата пользуются методами математической статистики.


  1. ^ Основные понятия математической статистики.


Явление – это единичный факт, единичное событие в области исследования.

Наблюдаемые нами события (явления) можно подразделить на следующие три вида: достоверные, невозможные и случайные.

Достоверным называют событие, которое обязательно произойдет, если будет осуществлена определенная совокупность условий.

Невозможным называют событие, которое заведомо не произойдет, если будет осуществлена определенная совокупность условий.

Случайным называют событие, которое при осуществлении совокупности условий может либо произойти, либо не произойти.

Каждое случайное событие есть следствие действия очень многих случайных причин. Невозможно учесть влияние на результат всех этих причин, т.к. число их велико и законы их действия неизвестны. Поэтому заранее предсказать произойдет единичное событие или нет невозможно. Однако, если речь идет о однородных случайных массовых событиях, то можно установить закономерности, которым они подчиняются. Этим и занимается такой раздел математики как математическая статистика. В этом случае результаты наблюдений – это статистические данные.

Вероятностью события называют отношение числа благоприятствующих этому событию исходов к общему числу всех равновозможных несовместных элементарных исходов, образующих полную группу:

Р = m/n,

где m – число элементарных исходов, благоприятствующих событию, n – число равновозможных несовместных элементарных исходов испытания, образующих полную группу.

Из определения вероятности вытекают следующие ее свойства:

  1. Вероятность достоверного события равна единице.

  2. Вероятность невозможного события равна нулю.

  3. Вероятность случайного события есть положительное число, заключенное между нулем и единицей.

Относительной частотой события называют отношение числа испытаний, в которых событие появилось, к общему числу фактически произведенных испытаний:

W = m/n,

где m – число появлений события, n – общее число испытаний.

Из сопоставления определений вероятности и относительной частоты следует, что при нахождении вероятности не требуется, чтобы испытания производились в действительности, а при вычислении относительной частоты необходимо, чтобы испытания были произведены фактически. Другими словами, вероятность вычисляют до опыта, относительную частоту – после опыта. Если опытным путем установлена относительная частота, то полученное число можно принять за приближенное значение вероятности.


^ ВЫБОРОЧНЫЙ МЕТОД

  1. Основные понятия

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты.

Выборочной совокупностью (выборкой) называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.

Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Это требование коротко формулируется так: выборка должна быть репрезентативной (представительной). Выборка будет представительной, если ее выбирать случайно, т.е. каждый объект выборки отбирается случайно из генеральной совокупности, и, следовательно, все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку.


^ 2. Статистическое распределение выборки.

Пусть из генеральной совокупности извлечена выборка:

х1, х2, х3, …, хk ,

причем хi наблюдалось n1 раз, х2 – n2 раза и т.д., n1 + n2 + … + n k = n – объем выборки.

Наблюдаемые значения хi называются вариантами.

Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом.

Число наблюдений ni называются частотой. Сумма всех частот равна объему выборки.

Отношение частоты к объему выборки называют относительной частотой. Сумма всех относительных частот равна единице.

^ Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение может быть задано также в виде последовательности интервалов и соответствующих им частот. В качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал.

Под распределением генеральной совокупности понимают соответствие между возможными значениями случайной величины и их вероятностями (теоретическое распределение).

Под распределением выборочной совокупности понимают соответствие между наблюдаемыми вариантами и их частотами или относительными частотами (эмпирическое распределение).

Пример 1. В результате психолого – педагогического эксперимента получена следующая выборка:




1

2

3

4

5

6

7

8

9

10

11

12

13

хi

1

2

1

3

5

6

7

1

2

4

5

6

3


Написать статистическое распределение выборки.


Решение.

Объем выборки n = 13

Вариационный ряд: 1 1 1 2 2 3 3 4 5 5 6 6 7

Статистическое распределение выборки:

Варианты

1

2

3

4

5

6

7

Частоты

3

2

2

1

2

2

1

Относительные частоты























^ 3. Полигон и гистограмма.

Для наглядности строят различные графики статистического распределения. В частности, полигон и гистограмму. Гистограмму целесообразно строить в случае непрерывного признака

^ Полигоном частот называют ломанную, отрезки которой соединяют точки (x1, n1), (x2, n2) ,…, (xk, nk).

Для построения полигона частот на оси абсцисс откладывают варианты хi , а на оси ординат – соответствующие им частоты n i . Точки (хi , n i) соединяют отрезками прямых и получают полигон частот.

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x1, W1), (x2, W2), … , (xk, Wk).

Для построения полигона относительных частот на оси абсцисс откладывают варианты хi , а на оси ординат – соответствующие им относительные частоты Wi . Точки (хi , Wi ) соединяют отрезками прямых и получают полигон относительных частот.

Пример 2. Построить полигон частот по данным примера 1.

^ Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению n i/ h.

Величина n i/ h называется плотностью частоты.

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы шириной h, а над ними строят прямоугольники высотой n i/ h. Площадь i – ого частичного прямоугольника равна сумме частот вариант i – ого интервала:

S = n i.

Следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

^ Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, высоты равны отношению Wi/ h. Величина Wi/ h называется плотностью относительной частоты.

Пример 3. В результате психолого – педагогического эксперимента получено следующее статистическое распределение, представленное в виде интервалов и соответствующих им частот.

5 – 10 4

10 – 15 6

15 – 20 16

20 – 25 36

25 – 30 24

30 – 35 10

35 – 40 4

Построить гистограмму относительных частот.


^ 4. Характеристики вариационного ряда.

К характеристикам вариационного ряда относятся выборочная средняя, выборочная дисперсия, выборочное среднее квадратичное отклонение, мода, медиана, размах варьирования, среднее абсолютное отклонение, коэффициент вариации.

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности:

хв = (х1 + х2 + … + хn )/n.

Если же значения признака х1 , х2 , …, хk имеют соответствующие частоты n1, n2, …, nk, причем n1 + n2 +… + nk = n, то

хв = (n1х1 + n2х2 + … + nk хk )/n.

Выборочная дисперсия вводится для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг выборочного среднего:

Dв = [(x1 – xв)2 + (x2 – xв)2 + … + (xn – xв)2 ] / n, (n >30)

Dв = [(x1 – xв)2 + (x2 – xв)2 + … + (xn – xв)2 ] / (n –1), (n  30).

Если значения признака х1 , х2 , …, хk имеют соответствующие частоты n1, n2, …, nk, причем n1 + n2 +… + nk = n, то

Dв = [n1(x1 – xв)2 + n2(x2 – xв)2 + … + nk(xk – xв)2 ] / n, (n >30)

Dв = [n1(x1 – xв)2 + n2 (x2 – xв)2 + … + nk (xk – xв)2 ] / (n –1), (n  30).

Пример 4. Выборочная совокупность задана статистическим распределением:


xi

1

2

3

4

ni

20

15

10

5


Найти выборочное среднее и выборочную дисперсию. (Ответ: хв =2, Dв = 1 ).

Кроме дисперсии для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются также выборочным средним квадратичным (стандартным) отклонением.

Выборочным средним квадратичным (стандартным) отклонением называют квадратный корень из выборочной дисперсии:

Sв =  Dв

Sв =  Dв

называют варианту, которая делит вариационный ряд на две части, равные по числу вариант.

Если число вариант нечетное, т.е. n = 2k+1, то me = xk+1. При четном n = 2k медиана me =( xk + xk+1) /2.

Размахом варьирования (R) называют разность между наибольшей и наименьшей вариантами:

R = xmax – xmin

Средним абсолютным отклонением называют среднее арифметическое абсолютных отклонений:

= [(x1 – xв) + (x2 – xв) + … + (xn – xв) ] / n,

Если значения признака х1 , х2 , …, хk имеют соответствующие частоты n1, n2, …, nk, причем n1 + n2 +… + nk = n, то

= [n1(x1 – xв) + n2(x2 – xв) + … + nk(xk – xв) ] / n

Коэффициентом вариации (V) называют отношение выборочного среднего квадратичного отношения к выборочному среднему, выраженное в процентах:

V = (Sв / xв)100%.

Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов. Тот из рядов имеет большее рассеяние по отношению к выборочной средней, у которого коэффициент вариации больше. Коэффициент вариации безразмерная величина, поэтому он пригоден для сравнения рассеяния вариационных рядов, варианты которых имеют различную размерность.

Замечание. Если вариационный ряд составлен по данным генеральной совокупности, то характеристики называются генеральными.



  1. ^ Применение выборочного метода к результатам тестирования.

1 . Результаты тестирования представляют собой статистический ряд несгруппированных данных. Их первичная запись производится в таблицу « Первичная запись результатов тестирования»

Таб. 1. Первичная запись результатов тестирования

№ п/п

Ф.И.О

Количество баллов





























2. Результаты тестирования переписываются по возрастанию (убыванию) вариант, т.е. составляется вариационный ряд.

Таб, 2. Вариационный ряд.

№ п/п

1

2



n

xi














3.Составляется статистическое распределение выборки

а) в виде перечня вариант и частот (относительных частот), если объем выборки небольшой (n<20)

Таб. 3а. Статистическое распределение выборки.

xi










ni










Wi










Замечание. Если крайние варианты сильно отличаются от соседних и их частота сравнительно мала, то их следует отбросить и обязательно проанализировать причину их появления.

б) в виде последовательности интервалов и соответствующих им частот (относительных частот), если объем выборки n >20.

Таб. 3б. Статистическое распределение выборки.

Частичный интервал, шириной h

Сумма частот вариант частичного интервала

Сумма относительных частот вариант частичного интервала

XH1 , XH1 + h







XH1 + h , XH1 + 2h







XH1 + 2h , XH1 + 3h















XH1 + (k – 1)h , XH1 + kh








Ширина интервала вычисляется следующим способом:

h = (xmax – xmin)/k, XH1 = xmin – h/2

где k =  n – количество интервалов, n - объем выборки. k и h округляются до целых чисел.

При распределении результатов тестирования по интервалам, варианты, попавшие на границы интервалов, распределяют одним из следующих способом:

  • Относят к последующему интервалу.

  • Делят пополам между соседними интервалами.

  • Относят к предыдущему интервалу.

4. Строится полигон по результатам таб. 3а или таб 3б. В случае таб.3б полигон частот образуется ломаной линией, соединяющей точки, соответствующие средним значениям интервалов группировки и частотам этих интервалов. Иногда для завершения фигуры справа и слева откладываются еще две середины интервалов с нулевой частотой.

5. Строится гистограмма по результатам таб.3б.

6. Вычисляются статистические показатели: хв, Sв, Dв, Mo, Me, R, , V.

7. Сравниваются хв, Mo, Me.

8. Делается предварительное заключение о принадлежности или нет данной выборки нормальному распределению.

Замечание: в первом приближении можно считать, что выборка взята из нормально распределенной генеральной совокупности, если

  • гистограмма имеет один максимум,

  • ее можно считать симметричной относительно выборочного среднего,

  • частичный интервал, содержащий выборочное среднее арифметическое хв совпадает с частичным интервалом, содержащем моду Mo и медиану Me или оба интервала граничат.


^ МЕТОДЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ПРИ ОЦЕКЕ КАЧЕСТВЕННЫХ ПОКАЗАТЕЛЕЙ ТЕСТОВ.


1. Основные понятия.

.

Под корреляцией следует понимать определенную вероятностную взаимосвязь между изменяющимися свойствами или признаками, которые не обладают строгой функциональной зависимостью.

Если с увеличением или уменьшением первого признака происходит соответствующее изменение другого, то говорят о прямой (положительной) корреляции. Если же по мере увеличения или уменьшения первого признака второй изменяется в обратном направлении, то это обратная (отрицательная) корреляция. Степень взаимосвязи и ее направление характеризует коэффициент корреляции r. Однако коэффициент корреляции ничего не говорит о природе этой взаимосвязи. Количественно коэффициент корреляции может принимать значения от +1 до –1. Полная положительная корреляция выражается коэффициентом r =1, полная отрицательная корреляция выражается коэффициентом r = -1. Однако на практике полная корреляция практически не встречается.


^ 2. Ранговая корреляция Спирмена.

В настоящее время при установлении связи между признаками часто используется ранговая корреляция Спирмена. Она является наиболее простым способом установления меры связи между факторами. Данный вид корреляции для анализа качественных показателей тестов целесообразно использовать в следующих случаях:

  • Число пар значений измеряемых свойств не менее 10, но не более 30.

  • Значения измеряемого свойства не имеют стабильных числовых значений, но отражают четкий порядок следования этих величин.

  • При получении приближенной информации. Например: оценки типа «да», «нет», «скорее да, чем нет» и т.д., которые переводятся в баллы.

Под качественным признаком подразумевают признак, который невозможно измерить достаточно точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их в порядке убывания или возрастания качества.

Пусть выборка объема n содержит независимые объекты, которые обладают двумя качественными признаками: A и B ( например, интерес к предмету и успеваемость). Для определенности условимся располагать объекты в порядке ухудшения качества. Расположим сначала объекты в порядке ухудшения качества по признаку A (интерес). Припишем объекту, стоящему на i – ом месте, число, которое называется рангом (xi). Ранг равен порядковому номеру объекта: xi = i. Затем расположим объекты в порядке убывания качества по признаку B и припишем каждому из них ранг (порядковый номер) yj = j. Потом для удобства сравнения рангов составляются две последовательности рангов, где индекс i при y равен порядковому номеру объекта по признаку A. В итоге получают две последовательности рангов:

По признаку А: x1, x2, … , xn.

По признаку B: y1, y2, … , yn.

Для оценки степени связи признаков А и В служит коэффициент ранговой корреляции Спирмена, который находится по формуле:

r = 1 – (6di2)/(n3 – n) = 1 – (6di2)/[n(n – 1)(n +1)],

где di = xi – yi, n – объем выборки. Абсолютная величина коэффициента ранговой корреляции Спирмена не превышает единицы (r   1).

В процессе тестирования часто возникает ситуация, когда несколько испытуемых получают одинаковые результаты. В этом случае равным результатам тестирования присваивается одинаковый ранг, являющийся средним арифметическим мест (порядковых номеров), соответствующих одинаковым значениям. Таким образом, ранг испытуемых не всегда соответствует его порядковому номеру.


^ 3. Алгоритм вычисления ранговой корреляции Спирмена.


  1. Составляется таблица первичной записи результатов тестирования.

Таб.1. Первичная запись результатов тестирования

№ п/п

Ф.И.О.

Баллы по тесту А

Баллы по тесту В






































2. Составляются ранговые таблица результатов тестирования.

Таб.2а. Таблица рангов xi результатов тестирования по признаку А.

№ п/п

(место i = 1,2,…,n)

Ф.И.О.

Количество баллов

Ранг

xi














Таб.2б. Таблица рангов yj результатов тестирования по признаку В.

№ п/п

(место j = 1,2,…,n)

Ф.И.О.

Количество баллов

Ранг

yj






































3. Составляется совместная таблица рангов тестирования.

Таб. 3. Совместная таблица рангов тестирования.

№ п/п

(место i = 1,2,…,n)

Ф.И.О.

(по таб.2а)

Ранг

xi

Ранг

yi

di = xi – yi

di2












































































di2 =

4. По формуле r = 1 – (6di2)/[n(n – 1)(n +1)] вычисляется коэффициент ранговой корреляции.

Пример1. Знания 10 студентов проверены по двум тестам А и В. Оценки по 100 бальной системе представлены в таб. 1.

Таб. 1. Первичная запись результатов тестирования

№ п/п

Ф.И.О.

Баллы по тесту А

Баллы по тесту В

1

А1

75

55

2

А2

95

92

3

А3

70

60

4

А4

62

45

5

А5

86

83

6

А6

57

62

7

А7

84

80

8

А8

50

70

9

А9

60

72

10

А10

90

93


Найти коэффициент ранговой корреляции Спирмена между оценками по двум тестам.


Решение.

Таб.2а. Таблица рангов xi результатов тестирования по признаку А.

№ п/п

(место i = 1,2,…,n)

Ф.И.О.

Количество баллов

Ранг

xi

1

А2

95

1

2

А10

90

2

3

А5

86

3

4

А7

84

4

5

А1

75

5

6

А3

70

6

7

А4

62

7

8

А9

60

8

9

А6

57

9

10

А8

50

10

Таб.2б. Таблица рангов yj результатов тестирования по признаку В.

№ п/п

(место j = 1,2,…,n)

Ф.И.О.

Количество баллов

Ранг

yj

1

А10

93

1

2

А2

92

2

3

А5

83

3

4

А7

80

4

5

А9

72

5

6

А8

70

6

7

А6

62

7

8

А3

60

8

9

А1

55

9

10

А4

45

10


Таб. 3. Совместная таблица рангов тестирования.

№ п/п

(место i = 1,2,…,n)

Ф.И.О.

Ранг

xi

Ранг

yi

di = xi – yi

di2

1

А2

1

2

-1

1

2

А10

2

1

1

1

3

А5

3

3

0

0

4

А7

4

4

0

0

5

А1

5

9

-4

16

6

А3

6

8

-2

4

7

А4

7

10

-3

9

8

А9

8

5

3

9

9

А6

9

7

2

4

10

А8

10

6

4

16




di2 =60

r = 1 –6*60:(10*11*9) = 1 – 0,36 = 0,64


Пример2. В результате психолого – педагогического эксперимента получены результаты, которые представлены в таб. 1. (А – интерес к предмету, В – знания по предмету)


Таб. 1. Первичная запись результатов тестирования

№ п/п

Ф.И.О.

Баллы по тесту А

Баллы по тесту В

1

А1

5

3,2

2

А2

6

4,0

3

А3

7

4,1

4

А4

8

4,2

5

А5

2

2,5

6

А6

4

5,0

7

А7

8

3,0

8

А8

7

4,8

9

А9

2

4,6

10

А10

9

2,4


Найти коэффициент ранговой корреляции Спирмена между оценками по двум тестам.


Решение.


Таб.2а. Таблица рангов xi результатов тестирования по признаку А.

№ п/п

(место i = 1,2,…,10)

Ф.И.О.

Количество баллов

Ранг

xi

1

А10

9

1

2

А7

8

2,5

3

А4

8

2,5

4

А8

7

4,5

5

А3

7

4,5

6

А2

6

6

7

А1

5

7

8

А6

4

8

9

А9

2

9,5

10

А5

2

9,5


Таб.2б. Таблица рангов yj результатов тестирования по признаку В.

№ п/п

(место j = 1,2,…,10)

Ф.И.О.

Количество баллов

Ранг

yj

1

А6

5

1

2

А8

4,8

2

3

А9

4,6

3

4

А4

4,2

4

5

А3

4,1

5

6

А2

4,0

6

7

А1

3,2

7

8

А7

3,0

8

9

А5

2,5

9

10

А10

2,4

10


Таб. 3. Совместная таблица рангов тестирования.

№ п/п

(место i = 1,2,…,10)

Ф.И.О.

Ранг

xi

Ранг

yi

di = xi – yi

di2

1

А10

1

10

-9

81

2

А7

2,5

8

-5,5

30,25

3

А4

2,5

4

-1,5

2,25

4

А8

4,5

2

2,5

6,25

5

А3

4,5

5

-0,5

0,25

6

А2

6

6

0

0

7

А1

7

7

0

0

8

А6

8

1

7

49

9

А9

9,5

3

6,5

42,25

10

А5

9,5

9

0,5

0,25




di2 = 203

r = 1 –6*203:(10*11*9) = 1 – 1.23 = - 0,23

Примечание. В методической литературе выделяют пять видов связей (положительных и отрицательных) между определенными изучаемыми признаками на выборках от 20 до 40 испытуемых. Коэффициент корреляции от  0,01 до  0,19 указывает на практическое отсутствие связи между признаками. Связь считается слабой, если коэффициент корреляции равен от  0,20 до  0,29, умеренной - от  0,30 до  0,49, существенной (заметной) - от  0,50 до  0,69, сильной - от  0,70 до  0,99.

^

СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗЫ


  1. Общие положения

При статистической проверке гипотезы выделяют следующие этапы:

  • Формулировка нулевой и альтернативной гипотез.

  • Выбор соответствующего уровня значимости.

  • Определение объема выборки.

  • Выбор статистического критерия для проверки нулевой гипотезы.

  • Определение критической области и области принятия решения.

  • Формулировка правила принятия гипотезы.

  • Принятие статистического критерия.

Рассмотрим более подробно каждый из перечисленных этап.

  • Гипотеза, подлежащая проверке, называется нулевой и обозначается Н0. Наряду с нулевой гипотезой рассматривают альтернативную гипотезу Н1. Ее принятие заключается в том, что нулевую гипотезу следует отвергнуть.

  • Проверка статистических гипотез всегда связана с риском неправильного суждения из-за каких-либо случайных особенностей распределения тестовых оценок определенного признака или свойства. Уровень значимости и есть величина, оценивающая этот риск. Иначе говоря, уровень значимости – понятие математической статистики, отражающее степень вероятности ошибочного выбора относительно статистической гипотезы о распределении признака, проверяемого на основе выборочных данных. Показатель уровня значимости обозначается через и выражается в процентах или долях вероятной ошибки. Например, при проведении тестовых измерений = 0,05. Это означает, что в 5% случаев повторных выборок принятое решение может оказаться неправильным. Противоположной величиной для уровня значимости является уровень достоверности. Уровень достоверности отражает вероятность правильного вывода относительно статистической гипотезы. Например, если уровень значимости  = 5%, то уровень достоверности Р=95%. Множество всех значений тестовых оценок, при которых принимаются решения, отклоняющие нулевую гипотезу, называется критической областью. Совокупность же этих значений, при которых нулевую гипотезу принимают, называется областью принятия решения.

  • Если объем выборки n  30, то выборка считается малой (малая выборка). Если объем выборки n  30, то выборка считается большой ( большая выборка).

  • Важным аспектом при проверке выдвинутой гипотезы является выбор статистического критерия. При этом следует обратить внимание на следующие два фактора:

  1. зависимы или независимы между собой выборки респондентов:

  2. подчиняются или не подчиняются они закону нормального распределения. Если тестовые оценки имеют нормальное распределение, то используются параметрические критерии. Если распределение тестовых оценок не известно, то критерии проверок статистических гипотез непараметрические.

  • Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Критерий проверки гипотезы не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие с данными наблюдений.



^ 2. Сравнение двух средних.

Зависимые выборки, нормальное распределение.

Имеем две зависимые выборки из генеральной совокупности, распределенной нормально, одинакового объема n. Варианты выборок равны соответственно xi,yi. Введем следующие обозначения:

di = xi-yiразность вариант с одинаковыми номерами (один и тот же объект);

dср = (d1 + d2 +…+ dn )/n – средняя разностей вариант с одинаковыми номерами;

xсрсреднее первой выборки, yср - среднее второй выборки;

Sd = ((di2 – (di)2/n)/(n – 1)).

Правило. Для того, чтобы при заданном уровне значимости проверить нулевую гипотезу Но о равенстве двух средних (xср = yср ) при конкурирующей гитотезе Н1 средние не равны (xср  yср ), надо вычислить наблюдаемое значение критерия:

Тнабл. = dср  n / Sd .

По таблице критических точек распределения Стъюдента, по по заданному уровню значимости , помещенному в верхней строке таблицы, и числу степеней свободы k = n–1 найти критическую точку tдвуст.кр.( , k ). Если  Тнабл.  tдвуст.кр.( , k ), то нет оснований отвергать нулевую гипотезу, т.е. средние результаты измерений различаются незначимо и можно считать, что xср = yср . Если  Тнабл.  tдвуст.кр.( , k ), то нулевую гипотезу отвергают, т.е. средние результаты измерений различаются значимо (xср  yср ).

Пример. См. №583 (сб. Гмурман)

^ 3. Проверка гипотезы об однородности двух выборок

по критерию Влкоксона.

Имеем две выборки, случайные величины которых непрерывны, распределения неизвестны. Варианты равны соответственно xi,yi. Объем выборок разный, n1 n2.

Нулевая гипотеза: обе выборки взяты из одного распределения.

Конкурирующая гипотеза: выборки принадлежат разным распределениям.

А). ^ Объем выборок не превосходит 25.

Правило Для того, чтобы при заданном уровне значимости проверить нулевую гипотезу Но при конкурирующей гитотезе Н1 надо:

  • Расположить варианты обеих выборок в возрастающем порядке, т.е. в виде одного вариационного ряда.

  • Найти сумму порядковых номеров вариант первой выборки – W1.

  • Найти по таблице нижнюю критическую точку ниж.кр.(,n1,n2), где  = /2.

  • Найти верхнюю критическую точку по формуле: верх.кр.= (n1 + n2 +1) n1 - ниж.кр

Если ниж.кр.< Wнабл. < верх.кр., то нет оснований отвергать нулевую гипотезу. Если Wнабл. < ниж.кр или Wнабл. > верх.кр, то нулевую гипотезу отвергают .

Б). Проверка нулевой гипотезы в случае, если объем хотя бы одной из выборок превосходит 25. В этом случае

ниж.кр.(,n1,n2) = целая часть ((n1 + n2 +1) n1 – 1)/2 – Zкр.( n1n2 (n1 + n2 +1)/12).

Zкр. находят по таблице функции Лапласа с помощью равенства Ф(Zкр.) = (1 - )/2. В остальном см. п.А.

Пример №627.




Похожие:

Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКурс лекций для студентов специальности Психология Часть Элементы теории множеств и математической логики Лекция 1
Понятия «множество», «элемент множества», «элемент принадлежит множеству» относятся к первичным, неопределяемым понятиям современной...
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКурс лекций для студентов специальности Психология Часть математическая статистика Лекция 2
Следующий шаг – получение числовых характеристик выборки, позволяющих глубже понять особенности объекта наблюдения: среднее значение...
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКонспект лекций для студентов специальности «Теплогазоснабжение и вентиляция»
Конспект лекций дисциплины «Строительная теплофизика» предназначен для студентов, изучающих в рамках специальности «Теплогазоснабжение...
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКурс лекций для студентов специальности Психология Часть основы математического анализа Лекция 2
К основным операциям (+, –,, ), которые применяются в элементарной математике, в высшей математике добавляется еще одна – операция...
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКурс лекций для студентов специальности 40 02 02 «Электронные вычислительные средства»
Охватывают частотный диапазон применения до десятков килогерц
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКурс лекций по дисциплине «лесоведение» для специальности 260400 «Лесное и лесопарковое хозяйство»
Лекция Предмет лесоведения. Значение леса и лесоведения. История лесоведения, его истоки и задачи
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКурс лекций по дисциплине «Вычислительная математика» для студентов заочной (ускоренной) формы обучения по специальности 230201
Математики, занимающийся построением и обоснованием численных алгоритмов, решений сложных задач из различных областей науки и производственной...
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКонспект лекций Херсон 2002 Конспект лекций разработал зав каф доц к. т н. Герасимович Л. М. Конспект лекций рекомендован для студентов по специальности 050206 "Менеджмент внешнеэкономической деятельности предприятий"
Охватывает рынки всех стран. Внутренний – национальный валютный рынок в пределах государства
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconОграниченный тип данных
Из широко известных яп перчислимый тип данных впервые появился в 1969 году в яп pasca (Курс Никлауса Вирта для студентов). После...
Курс лекций «Обработка данных» для специальности П. 04. 05. 00. П «Практическая психология» iconКурс лекций по работе в системе матричных расчетов Matlab
Введение в предмет. Основные понятия. Предназначение системы Matlab. Типы данных. 4
Разместите ссылку на наш сайт:
Уроки, сочинения


База данных защищена авторским правом ©izlov.ru 2000-2014
При копировании материала обязательно указание активной ссылки открытой для индексации.
связаться с нами