happy-frog.ru

Как сделать значок среднее


Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

На всех предыдущих занятиях, когда мы изучали различные методы анализа данных и разные критерии для их оценки, мы использовали так называемые описательные статистики – это показатели, которые описывают особенности того или иного распределения данных. Действительно, чтобы представить, как выглядит полученное в ходе эксперимента множество результатов, лучше всего построить их частотное распределение и для полученной кривой указать следующие ее характеристики:

  • среднее арифметическое (М);
  • среднее квадратичное отклонение (σ);
  • дисперсию (σ2);
  • зет — оценки точечных значений (Z).

Когда эти описательные статистики подсчитываются применительно к очень большой по численности группе испытуемых (тысячи и миллионы людей), то сама эта группа называется «генеральной совокупностью», а описательные статистики называются «параметры» совокупности. Такое различие в названиях призвано подчеркнуть, что описательные статистики, которые обычно рассчитываются для малых выборок, могут не совпадать с показателями, рассчитанными для того же признака на огромных  выборках, т.е. будут иметь место расхождения М, σ и остальных показателей. Конечно, показатели, которые получены на очень больших выборках, являются более надежными, поскольку показывают не случайные, а стабильные (устойчивые) тенденции в распределении результатов. Поэтому, чтобы подчеркнуть надежность описательных статистик, выведенных на генеральной совокупности данных, их стали называть «параметрами», рассматривая их как своего рода  устойчивые стандарты  для изучаемого признака или характеристики.

В этой связи те критерии, при расчете которых используются параметры (или описательные статистики) получили название – «параметрических  критериев». К числу параметрических относятся: критерии F и t, а также коэффициент корреляции r. Но помимо данного вида критериев в статистике существует еще одна группа критериев, которые называются «непараметрические». Они называются так потому, что не опираются в своих расчетах на параметры (описательные статистики), а используют совершенно другие показатели – какие именно будет сказано далее применительно к каждому конкретному критерию. Итак, начнем с изучения первого непараметрического критерия под названием «хи-квадрат».

Когда мы имеем дело со свойствами живых существ (их анатомическими, биологическими или психическими проявлениями), то эти свойства в своем частотном распределении подчиняются закону нормального распределения. Однако этот закон не распространяется на события, происходящие с живыми существами, поскольку сами события являются следствием внешних факторов, т.е. свойств окружающего физического мира. В этом мире одни события могут возникать одинаково часто, а могут  встречаться с разной вероятностью, и описать данную вероятность довольно сложно.  Можно, например, сказать, что такое природное явление, как дождь наиболее более вероятно в осенний период для нашего региона и наименее вероятно в зимний период, а в весенний и летний период примерно равновероятно.

Предположим синоптики, занимающиеся предсказанием погоды, составили прогноз того, сколько раз ожидаются те или иные природные явления (дождь, снег и др.) в  каждом  месяце года в нашем регионе. Потом записали, сколько по факту произошло этих явлений в каждом из двенадцати месяцев. Естественно, количество ожидаемых явлений и количество состоявшихся явлений не совпало точно, причем в каждом месяце эти разногласия носили разный характер: в каких-то месяцах различия оказались заметными, а в каких-то — незначительными. Предположим, что руководство синоптической службы решило оценить, можно ли считать расхождения в ожидаемых и реальных частотах появления природных феноменов существенными. На языке статистики  это означало проверить расхождения в ожидаемых и реальных частотах на достоверность различий. Сейчас мы рассмотрим метод, с помощью которого можно ответить на данный вопрос.

Этот метод называется расчет критерия хи-квадрат. Сам критерий хи-квадрат обозначается греческой буквой χ2. Суть критерия заключается в том, что он сравнивает  ожидаемые частоты появления каких-то событий и фактические частоты появления этих событий. Фактические частоты, которые иногда называют наблюдаемые частоты, принято обозначать буквой fo (поскольку f  — это начальная буква в слове «frequencies», т. е. частоты, а значок «о» внизу относится к слову  «observe», что значит «наблюдать»). Ожидаемые частоты обозначаются буквой  fe (значок «е» внизу относится к слову «expect», что значит «ожидать»). Формула расчета критерия:

17
Разберем пример с использованием данного критерия. Предположим, что вам поручили оценить, насколько хорошо работает метеослужба какого-то региона, данные которой используются аэропортами для планирования полетов. В первом столбце приведенной ниже таблицы указаны дни с различными природными явлениями (снег, дождь и т.п.), в следующем столбце — наблюдавшаяся по факту частота появления этих дней в течение одного из зимних месяцев и прогнозируемая (ожидавшаяся) метеослужбой частота этих явлений.

Природное явление Условный код явления Наблюдавшаяся частота  fo Ожидаемая частота  fe  Их разница (fo — fe) Солнечно «1» 12 14 2 Дождь «2» 11 8 3 Снег «3» 8 5 3 Ветер «4» 20 17 3 Высокое давление «5» 10 16 6 Низкое давление «6» 14 14 0 Магнитная буря «7» 9 10 1

Вычислим экспериментальное значение хи-квадрат по формуле:

18
Чтобы определить, являются ли различия в частотах фактических и ожидаемых достоверными, нужно сравнить значение χ2эксп с критическим значением этого критерия — χ2крит по соответствующей таблице.

Таблица

Таблица

Обратите внимание, что для выбора критического значения вам придется выбрать какую-то конкретную строку. Строки означают различное число степеней свободы – показатель К. Вы помните, что, что он определяется как количество статистических объектов  за минусом единицы: К= N -1. В роли статистических объектов могут выступать сами испытуемые, но не только они. В данном примере с погодными явлениями нет испытуемых, а в роли изучаемых объектов выступают семь природных явлений, следовательно, именно природные явления будут определять число N. Если N=7, то число степеней свободы будет на 1 меньше, значит, К=6.

В таблице на строке К=6 стоит критическое значение (при уровне значимости р=0,05) равное 12,6.

Сделать вывод о достоверности различий можно лишь в том случае, когда экспериментальное значение χ2 превысит критическое значение. В данном случае χ2эксп=6,09 в то время, как χ2крит= 12,6, следовательно, экспериментальное значение не превысило критическое, и мы не можем говорить о наличии достоверных различий между ожидаемыми природными явлениями и их реальными проявлениями. Иными словами, наши прогнозы нельзя признать слишком отличающимися от действительности, поскольку эти различия не достоверны (нет стабильной тенденции в расхождении ожидаемых и фактических частот).

На практике критерий хи-квадрат применяют не только в тех случаях, когда требуется сравнить ожидаемые (прогнозируемые) и фактические (наблюдаемые) частоты каких-то явлений. Его применение возможно и для сравнения результатов двух групп испытуемых, если  данные одной группы рассматривать в качестве ожидаемых результатов, а данные другой группы  принять за фактически наблюдаемые результаты! Поскольку критерий хи-квадрат не требует наличия нормального распределения частот в выборке данных (преобладания средних значений), то он применим для анализа любых частотных распределений. Рассмотрим пример подобного рода, где требуется сравнить  результаты  двух групп испытуемых, при этом сделаем расчеты критерия с помощью компьютерной программы SPSS.

Предположим, у нас имеются результаты контрольных работ двух групп учащихся. Ученики из класса «А» писали контрольную работу первыми и дали определенные результаты. Затем контрольную работу предстояло писать ученикам из класса «Б». Учителя вполне могли рассматривать результаты работы, полученные в классе «А»,  в качестве потенциально ожидаемых и для другого класса – «Б». Но класс «Б» показал несколько иные результаты. Встал вопрос: можно ли признать, что результаты класса «Б» существенно отличаются от результатов класса «А»?

Для ответа на вопрос мы можем воспользоваться критерием хи-квадрат. Для начала возьмем  сводную таблицу результатов контрольной работы, которую вам раздали. В каждом классе было по 35 человек.

Оценки за работу В классе «Б» (fo – наблюдаемые частоты) В классе «А» (fe– ожидаемые частоты) «1» 3 2 «2» 8 4 «3» 10 12 «4» 7 8 «5» 7 6

Попробуем сделать расчет χ2эксп  в программе SPSS. Обычно работу с программой мы начинали с того, что вводили в базу данных сразу все полученные в эксперименте значения, называя первую группу (колонку) результатов – переменной V1, а вторую группу результатов – V2 и так далее.

Но с критерием хи-квадрат надо поступать иначе. Ввод данных для этого критерия имеет свою особую специфику: можно даже сказать, что ввод требует соблюдения целого ряда «хитростей», которые присущи только хи-квадрату! Поэтому внимательно изучите, как надо вводить данные в программу для расчета критерия χ2.

В базу данных вводится только одна группа данных, которая соответствует фактическим, т.е. наблюдаемым частотам. А группа данных, соответствующая ожидаемым частотам, не вводится в базу данных вообще! Эта группа данных будет вводиться в другом месте программы, когда компьютер сам запросит ввести ожидаемые значения. Сейчас мы разберем по порядку действия на компьютере.

Итак, начинаем ввод фактических значений – в нашем примере  фактическими значениями выступают результаты класса «Б». Их надо набирать в первой колонке базы данных программы не в свернутом виде, как это представлено в сводной таблице (на листочке), а в развернутом виде. Поясним, что означает в развернутом виде. Это означает, что если оценка «1» встретилась в классе «Б» 3 раза, то надо три раза набрать цифру 1 в первую графу базы данных, т.е. заполнить три клетки по вертикали (в столбик) цифрой 1. Таким образом, мы столько раз набираем определенную оценку, сколько раз она профигурировала в результатах. Значит, оценку «2»  мы наберем (по вертикали) 8 раз, оценку «3» наберем 10 раз, затем оценку «4» напечатаем 7 раз и оценку «5» напечатаем 7 раз.

Всего должно получиться 35 заполненных строк  в первой графе базы данных. Больше ничего в базу данных вводить не надо. Нажимаем команду Analyze. Из предложенного меню действий выбираем строку, где написано Nonparametric tests, что означает «непараметрические критерии». Далее предлагается выбрать определенный критерий из имеющихся в списке. Здесь надо нажать на строку со словом Chi-Square. Появится окно, где первую переменную следует выбрать из предложенного перечня переменных традиционным путем переноса (с помощью стрелочки).

Теперь настал момент, когда надо вводить в программу вторую переменную, т.е. результаты работы в классе «А» — ожидаемые результаты. Напомним, что слово «ожидаемые значения» переводится как «Expected Values», поэтому нужно вводить ожидаемые значения в той части поля, где имеется рубрика «Expected Values» (нижний правый квадрат окна). Под этой рубрикой  имеется строка со словом  «Value», эту строку надо активировать, для чего следует нажать мышью на точку впереди этого слова. При этом произойдет активация команды  «использовать значения», которые будут сейчас введены в качестве ожидаемых частот.

Если фактические (наблюдаемые) частоты вводились в базу данных развернутым способом: сколько раз встретилось какая-то оценка, столько раз ее и набирали, то здесь способ ввода данных будет совершенно иным! Дело в том, что программа к  наступившему моменту уже обработала первую переменную (данные класса «Б») и создала свернутый протокол результатов. Свернутый протокол – это точная копия первой графы нашей таблицы № 10, которую вы уже имеете:

«1» 3 «2» 8 «3» 10 «4» 7 «5» 7

Теперь компьютер «подготовился» к восприятию следующих данных, т.е. ожидаемых частот, но уже в форме свернутого протокола!

По этой причине  вы должны ввести  запрашиваемую программой вторую графу данных (ожидаемые частоты – результаты класса «А») и именно в том порядке, как они записаны в таблице № 10, иными словами вы вводите:

2 4 12 8 6

Важно помнить, что  программа заставляет вводить частоты в соответствии с порядком возрастания величины самого результата: первыми следует набирать частоты встречаемости результата «1», а затем частоты для результата «2», далее частоты для результата «3» и так до частот, соответствующих  результату «5».

Теперь ознакомимся с технологией ввода ожидаемых частот в маленькое окошко. Сначала надо поставить курсор в это маленькое окошко и набрать первое значение. У нас в таблице это значение равно 2 — это ожидаемая частота встречаемости результата в «1» балл. Набрав цифру 2, следует нажать на слово Add, которое стоит чуть ниже, после этого набранная цифра переместится в формируемую колонку данных для последующей обработки. Затем нужно вернуть курсор в маленькое окошко и набрать следующую цифру – ей будет цифра 4, после чего снова нажать слово Add, которое означает «добавить» данных в формируемую колонку. Так надо ввести всю последовательность ожидаемых частот. Если вы неправильно нажали цифру, то ошибку можно исправить командой Remove, которая уберет выделенное вами значение, а вам придется ввести новое. Следите, чтобы вводимые частоты соответствовали порядку возрастания оценочных баллов в таблице. Когда все значения будут введены, можно нажать команду ОК на выполнение анализа.

Обращаю ваше внимание на, что при расчетах хи-критерия в статистических пакетах требуется, чтобы количество наблюдаемых частот составляло применительно к отдельному объекту (коду) не менее 5-ти случаев! Иначе программа SPSS не производит расчет данного критерия, поскольку количество наблюдений слишком мало (о чем выдается сообщение при открытии результирующего окна «OutPut»).

Еще одно важное замечание касается общего количества частот во второй группе данных. Оно должно  в сумме соответствовать общему количеству случаев наблюдений, зарегистрированных в первой группе. Если вернуться к примеру с оценками мебели, то это означает, что при опросе 100-та покупателей относительно мебели первой фирмы, должны быть опрошены тоже 100 покупателей относительно мебели второй фирмы, — только в этом случае опрос будет считаться вполне корректным. Однако если оказалось, что во второй группе данных зарегистрировано меньшее количество оценок, чем в первой группе, то это допустимо потому, что программа сама посчитает предполагаемые вероятности встречаемости кодов с учетом тех пропорций между частотами, которые Вы введете в «Values».

Когда расчеты выполнены, автоматически открывается окно «OutPut» и на экране появятся две таблички, в нижней из них будут указаны величина хи-квадрат (Chi-Square) и величина уровня значимости (sig), по которой можно судить о правомерности вывода о достоверности различий. В таблице также указано число степеней свободы (df) – оно отражает количество изучаемых событий за минусом единицы.

В данном примере событием выступает  оценка, выставленная за контрольную работу, т.е. оценки от 1-го до 5-ти баллов. Но число степеней свободы будет не пять, а на единицу меньше, следовательно, оно равно 4. Это число потребуется вам, если вы захотите посмотреть критическое значение данного (χ2крит) в статистической таблице, чтобы оценить, больше оно или меньше полученного при расчетах χ2эксп (на экране). Если рассчитанное нами экспериментальное значение превышает критическое, то можно сделать вывод о достоверности различий фактических и ожидаемых частот  или просто о различии двух групп результатов. Однако, как мы отмечали ранее, вывод о достоверности возможно сделать и не прибегая к таблице, а основании показателя уровня значимости (sig): он должен быть меньше 0,05. Мы получили после расчетов такие показатели:

χ2эксп  = 4,43, sig= 0,35

Это дает нам право утверждать, что различия между результатами контрольной работы в классе «Б» и в классе «А» носят  недостоверный характер (ошибочность вывода о достоверных различиях составляет 35%).


Источник: http://statyx.ru/metod-rascheta-kriteriya-hi-kvadrat/

Как сделать значок среднее фото



Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее

Как сделать значок среднее




Читать далее:












Меню

Главная

Поздравления в картинках с днем рождения алексею
Поздравления с юбилеем женщине в прозе шуточные
Юморное поздравления брата с днем рождения
Как сделать черствый хлеб мягким в духовке
Как сделать на пластике отверстие
Иглы для ковровой вышивки своими руками
Где находится масляный фильтр на тойоте королла
Маска от прыщей в домашних условиях с содой
Доверие как это сделать
На греческом поздравления