Инструменты дескриптивного анализа

Инструменты дескриптивного анализа

Для описания инфы, приобретенной на базе выборочных измерений, обширно употребляется две группы мер. 1-ая включает меры «центральной тенденции», либо меры, которые обрисовывают обычного рес­пондента либо обычный ответ. 2-ая включает меры варианты, либо ме­ры, описывающие степень схожести либо несхожести респондентов либо ответов с «типичными» респондентами либо ответами.

Есть и другие Инструменты дескриптивного анализа описательные меры, к примеру меры асим­метрии (как отысканные кривые рассредотачивания отличаются от нор­мальных кривых рассредотачивания). Но они употребляются не настолько час­то, как вышеупомянутые, и не представляют особенного энтузиазма для заказ­чика.

Ниже дается только короткая черта обозначенных мер. Более подробную информацию можно получить из Инструменты дескриптивного анализа книжек по математической статистике, к примеру [9], [10].

К числу мер центральной тенденции относятся мода, медиана и средняя.

Мода охарактеризовывает величину признака, появляющуюся более нередко по сопоставлению с другими величинами данного признака. Мода но­сит относительный нрав, и необязательно, чтоб большая часть рес­пондентов указало конкретно данную величину признака.

Медиана охарактеризовывает значение признака Инструменты дескриптивного анализа, занимающее срединное место в упорядоченном ряду значений данного признака.

Третьей мерой центральной тенденции является средняя величина, которая в большинстве случаев рассчитывается как средняя арифметическая величина. При ее вычислении общий объем признака поровну распределяется меж всеми единицами совокупы.

Видно, что степень информативности средней величины больше, чем медианы, а Инструменты дескриптивного анализа медианы — моды.

Но рассмотренные меры не охарактеризовывают вариацию ответов на некий вопрос либо, говоря другими словами, несходство, различие респондентов либо измеренных черт. Разумеется, что кроме познания величин мер центральной тенденции принципиально установить, насколь­ко близко к этим величинам размещены другие приобретенные оцен­ки. Обычно употребляют три меры варианты: рассредотачивание частот, раз Инструменты дескриптивного анализа­мах варианты и среднее квадратическое отклонение.

Рассредотачивание частот представляет в табличной либо графической форме число случаев возникновения каждого значения измеренной характе­ристики (признака) в каждом избранном спектре ее значений. Распре­деление частот позволяет стремительно сделать выводы о степени подробности результатов измерений.

Размах варианты определяет абсолютную разность меж макси­мальным Инструменты дескриптивного анализа и наименьшим значениями измеренного признака. Говоря другими словами, это разница меж конечными точками в распределе­нии упорядоченных величин измеренного признака. Данная мера опре­деляет интервал рассредотачивания значений признака.

Среднее квадратическое отклонение является обобщающей статисти­ческой чертой варианты значений признака. Если эта мера ма­ла, то кривая рассредотачивания имеет неширокую Инструменты дескриптивного анализа, сжатую форму (результаты из­мерений владеют высочайшей степенью схожести); если мера велика, то кривая рассредотачивания имеет широкий, растянутый вид (велика степень различия оценок).

Ранее было отмечено, что выбор шкалы измерений, а следователь­но, типа вопросов в опросном листе предназначают количество полу­чаемой инфы. Схожим образом, количество инфы Инструменты дескриптивного анализа, полу­чаемой при использовании рассмотренных выше мер, является различ­ным. Общим правилом будет то, что статистические меры дают воз­можность получить больше инфы при применении более ин­формативных шкал измерений. Выбор шкалы измерений предназначает выбор статистических мер. К примеру, один из вопросов демографиче­ского исследования, при проведении которого использовалась шкала на­именований Инструменты дескриптивного анализа, касался национальности. Русским был присвоен код 1, ук­раинцам — 2, татарам — 3 и т.д. В этом случае, естественно, можно вы­числить среднее значение. Но как интерпретировать среднюю нацио­нальность, равную, скажем, 5,67? Для вычисления средних нужно исполь­зовать интервальную шкалу либо шкалу отношений. Но в нашем примере можно использовать моду Инструменты дескриптивного анализа.

Что касается мер варианты, то при использовании номинальной шкалы применяется рассредотачивание частот, при использовании шкалы порядков — кумулятивное рассредотачивание частот, а при использовании интервальной шкалы и шкалы отношений — среднее квадратическое от­клонение.

Статистический вывод

Вывод является видом логического анализа, направленного на по­лучение общих заключений о всей совокупы на базе наблюдений за Инструменты дескриптивного анализа малой группой единиц данной совокупы.

Выводы делаются на базе анализа малого числа фактов. Напри­мер, если два ваших товарища, имеющих одну и ту же марку автомобиля, сетуют на его качество, то вы сможете прийти к выводу о низком качестве данной марки автомобиля в целом.

Статистический же вывод основан на Инструменты дескриптивного анализа статистическом анализе ре­зультатов выборочных исследовательских работ и ориентирован на оценку характеристик совокупы в целом. В этом случае результаты выборочных исследо­ваний являются только отправной точкой для получения общих выводов.

К примеру, автомобилестроительная компания провела два незави­симых исследования с целью определения степени удовлетворенности потребителей своими автомобилями. 1-ая Инструменты дескриптивного анализа подборка включала 100 по­требителей, купивших данную модель в течение последних 6 меся­цев. 2-ая подборка включала 1000 потребителей. В процессе телефонного интервьюирования респонденты отвечали на вопрос: «Удовлетворены вы либо не удовлетворены приобретенной вами моделью автомобиля?» 1-ый опрос выявил 30% неудовлетворенных, 2-ой — 35%.

Так как есть ошибки подборки и в первом и во Инструменты дескриптивного анализа 2-м случаях, то можно сделать последующий вывод. Для первого варианта: около 30% опрошенных выразили неудовлетворенность приобретенной моделью автомобиля. Для второго варианта около 35% опрошенных выразили не­удовлетворенность приобретенной моделью автомобиля. Какой общий вывод можно сделать в этом случае? Как избавиться от термина «около»? Для этого введем показатель ошибки: 30% ± х% и 35% ± у% и сравним х Инструменты дескриптивного анализа и у. Используя логический анализ, можно прийти к выводу, что большая подборка содержит наименьшую ошибку и что на ее базе можно сделать более правильные выводы о мировоззрении всей совокупы потреби­телей. Видно, что решающим фактором для получения правильных выво­дов является размер подборки. Данный показатель находится во всех Инструменты дескриптивного анализа формулах, определяющих содержание разных способов статистиче­ского вывода.

При проведении рекламных исследовательских работ в большинстве случаев исполь­зуются последующие способы статистического вывода: оценка характеристик и проверка гипотез.

Оценка характеристик генеральной совокупы представляет из себя процесс определения, исходя из данных о выборке, интервала, в каком находится один из характеристик Инструменты дескриптивного анализа генеральной совокупы, к примеру среднее значение. Для этого употребляют последующие статистические пока­затели: средние величины, среднюю квадратическую ошибку и хотимый уровень доверительности (обычно 95% либо 99%).

Ниже пойдет разговор об их роли при проведении оценки пара­метров.

Средняя квадратическая ошибка является, как отмечалось выше, мерой варианты выборочного рассредотачивания при теоретическом предпо­ложении, что исследовалось Инструменты дескриптивного анализа огромное количество независящих выборок одной и той же генеральной совокупы.

Она определяется по последующей формуле:

где sx — средняя квадратическая ошибка выборочной средней;

s — среднее квадратическое отклонение от средней величины в вы­борке;

n — объем подборки.

Если употребляются процентные меры, выражающие альтернатив­ную изменчивость высококачественных признаков, то

где s — средняя Инструменты дескриптивного анализа квадратическая ошибка выборочной средней при использовании процентных мер;

р — процент респондентов в выборке, поддержавших первую кандидатуру;

q = (100 — q) — процент респондентов в выборке, поддержавших

вторую кандидатуру;

n — объем подборки.

Видно, что средняя ошибка подборки тем больше, чем больше ва­риация, и тем меньше, чем больше объем подборки.

Так как всегда существует Инструменты дескриптивного анализа выборочная ошибка, то нужно оценить разброс значений изучаемого параметра генеральной совокупно­сти. Представим, исследователь избрал уровень доверительности, рав­ный 99%. Из параметров обычной кривой рассредотачивания вытекает, что ему соответствует параметр Z = ± 2,58. Средняя для генеральной сово­купности в целом рассчитывается по формуле

Если употребляются процентные меры, то

Это значит, что если вы желаете Инструменты дескриптивного анализа, чтоб при 99%-ном уровне до­верительности спектр оценок включал настоящую для генеральной со­вокупности оценку, то нужно помножить среднюю квадратическую ошибку на 2,58 и добавить приобретенный итог к процентному значе­нию р (верхняя предельная оценка). Если же произвести вычитание дан­ного произведения, то найдем нижнюю предельную оценку.

Как эти формулы связаны Инструменты дескриптивного анализа со статистическим выводом?

Так как делается оценка параметра генеральной совокуп­ности, то тут указывается спектр, в который попадает настоящее зна­чение параметра генеральной совокупы. С этой целью для подборки берутся статистическая мера центральной тенденции, величина диспер­сии и объем подборки. Дальше делается предположение об уровне довери­тельности и рассчитывается Инструменты дескриптивного анализа спектр разброса параметра для генераль­ной совокупы.

К примеру, для членов подборки (100 читателей некий газеты) было установлено, что среднее время чтения газеты составляет 45 минут при средней квадратической ошибке в 20 минут. При уровне доверитель­ности, равном 95%-ном, получим

При 99%-ном уровне доверительности получим

Видно, что доверительный интервал обширнее для 99% по сопоставлению с Инструменты дескриптивного анализа 95%-ным уровнем доверительности.

Если употребляются проценты и оказалось, что из подборки в 100 человек 50% опрошенных по утрам пьет кофе, то при уровне доверитель­ности в 99% получим последующий спектр оценок:

Таким макаром, логика статистического вывода ориентирована на по­лучение конечных заключений об изучаемом параметре генеральной со­вокупности на базе Инструменты дескриптивного анализа выборочного исследования, осуществленного по законам математической статистики. Если употребляется обычное заклю­чение, не основанное на статистических измерениях, то конечные выво­ды носят личный нрав и на базе одних и тех же фактов раз­ные спецы в состоянии сделать различные выводы.

При использовании статистического вывода употребляются форму­лы, носящие Инструменты дескриптивного анализа беспристрастный нрав, в базе которых лежат общепри­знанные статистические концепции. В итоге конечные выводы но­сят намного более беспристрастный нрав.

В ряде всевозможных случаев делаются суждения относительно какого-то пара­метра генеральной совокупы (величине средней, дисперсии, характе­ре рассредотачивания, форме и тесноте связи меж переменными) исходя только из неких догадок Инструменты дескриптивного анализа, раздумий, интуиции, непол­ных познаний. Такие суждения именуются догадками.

Статистической догадкой именуется предположение о свойстве генеральной совокупы, которое можно проверить, делая упор на дан­ные подборки.

Подпроверкой догадки понимается статистическая процедура, используемая для доказательства либо отличия догадки, основанной на результатах выборочных исследовательских работ. Проверка догадки осуществляется на базе выявления согласованности эмпирических Инструменты дескриптивного анализа данных с гипотетичными. Если расхождение меж сравниваемыми величинами не выходит за границы случайных ошибок, догадку принимают. При всем этом не делается никаких заключений о корректности самой догадки, идет речь только о согласованности сравниваемых данных.

Проверка догадки проводится в 5 шагов:

1. Делается некое предположение относительно некий ха­рактеристики генеральной совокупы, к Инструменты дескриптивного анализа примеру о средней величине определенного параметра.

2. Формируется случайная подборка, проводится выборочное иссле­дование и определяются статистические характеристики подборки.

3. Сравниваются гипотетичное и статистическое значения иссле­дуемой свойства.

4. Определяется, соответствуют либо нет результаты выборочного исследования принятой догадке.

5. Если результаты выборочного исследования не подтверждают ги­потезу, последняя пересматривается — она должна соответствовать дан Инструменты дескриптивного анализа­ным выборочного исследования.

Вследствие варианты результатов выборочных исследовательских работ не­возможно сделать полностью четкий вывод о достоверности догадки, проводя обычное арифметическое сопоставление величин черт. По­этому статистическая проверка догадки включает внедрение: выбо­рочного значения свойства, среднего квадратического отличия, предпочтительного уровня доверительности и гипотетитеского значения харак­теристики для генеральной совокупы Инструменты дескриптивного анализа в целом.

Для проверки гипотез о средних величинах применяется следую­щая формула:

К примеру, готовя рекламу учебной программки по подготовке тор­говых агентов в институте, управляющий программки считал, что выпуск­ники программки получают в среднем 1750 баксов за месяц. Таким обра­зом, гипотетичная средняя для генеральной совокупы равна Инструменты дескриптивного анализа 1750 баксам. Для проверки данной догадки было проведено телефонное обследование торговых агентов различных компаний.

Подборка составила 100 человек, средняя для подборки равнялась 1800 баксам и среднее квадратическое отклонение составляло 350 дол­ларов. Появляется вопрос, является ли большой разница (50 баксов) меж гипотетичной заработной платой и ее средним значением для подборки. Проводим расчеты по формуле (4.2):

Видно Инструменты дескриптивного анализа, что средняя квадратическая ошибка средней величины бы­ла равна 35 баксам, а личное от деления 50 на 45 составляет 1,43 (нор­мированное отклонение), что меньше ±1,96 — величины, характеризую­щей уровень доверительности 95%. В этом случае выдвинутую догадку можно признать достоверной.

При использовании процентной меры испытание догадки осуще­ствляется последующим образом. Представим, что, исходя из собствен Инструменты дескриптивного анализа­ного опыта, один из автовладельцев выдвинул догадку, согласно которой только 10% автовладельцев употребляют ремни. Но на­циональные выборочные исследования 1000 автовладельцев проявили, что 80% из их употребляют ремни. Расчеты в этом случае проводятся последующим образом:

где р — процент из выборочных исследовательских работ;

πH — процент из догадки;

sp — средняя квадратическая ошибка при Инструменты дескриптивного анализа расчетах в процентах.

Видно, что начальная догадка отличалась от отысканных 80% на величину 55,3, умноженную на среднеквадратическую ошибку, т.е. не может быть признана достоверной.

В ряде всевозможных случаев целенаправлено использовать направленные гипоте­зы. Направленные догадки определяет направления вероятных значе­ний какого-то параметра генеральной совокупы. К примеру, заработ­ная плата составляет больше Инструменты дескриптивного анализа 1750 баксов. В этом случае использует­ся только одна сторона кривой рассредотачивания, что находит отражение в применении символов «+» и «-» в расчетных формулах.

Более детализированную информацию по данной дилемме можно полу­чить из [25].

Тут, правда, появляется вопрос. Если можно провести выбороч­ные исследования, то для чего выдвигать догадки? Обработка результатов выборочных Инструменты дескриптивного анализа исследовательских работ дает возможность получить средние величины и их статистические свойства, не выдвигая никаких гипотез. По­этому проверка гипотез быстрее применяется в случаях, когда нереально либо очень трудоемко проводить полномасштабные исследования и когда требуется ассоциировать результаты нескольких исследовательских работ (для различных групп респондентов либо проведенных в различное время). Такового рода Инструменты дескриптивного анализа задачки, обычно, появляются в социальной статистике. Трудоем­кость статистико-социологических исследовательских работ приводит к тому, что практически они все строятся на несплошном учете. Потому неувязка доказа­тельности выводов в социальной статистике стоит в особенности остро.

Применяя функцию проверки гипотез, следует держать в голове, что она может гарантировать Инструменты дескриптивного анализа результаты с определенной вероятностью только по «беспристрастным» подборкам, на базе беспристрастных данных.

Анализ различий

Проверка существенности различий заключается в сравнении ответов на один и тот же вопрос, приобретенных для 2-ух либо более независящих групп респондентов. Не считая того, в ряде всевозможных случаев представляет ин­терес сопоставление ответов на два либо более Инструменты дескриптивного анализа независящих вопросов для од­ной и той же подборки.

Примером первого варианта может служить исследование вопроса: что предпочитают пить по утрам обитатели определенного региона: кофе либо чай. Сначало было опрошено на базе формирования случайной подборки 100 респондентов, 60% которых отдают предпочтение кофе; че­рез год исследование было повторено, и только Инструменты дескриптивного анализа 40% из 300 опрошенных человек высказалось за кофе. Как можно сравнить результаты этих 2-ух исследовательских работ? Прямым арифметическим методом ассоциировать 40% и 60% нельзя из-за различных ошибок выборок. Хотя в случае огромных разли­чий в цифрах, скажем, 20 и 80%, легче прийти к выводу об изменении вку­сов в пользу кофе. Но если есть Инструменты дескриптивного анализа уверенность, что эта большая разни­ца обоснована сначала тем, что в первом случае использовалась очень малая подборка, то таковой вывод возможно окажется непонятным. Таким макаром, при проведении подобного сопоставления в расчет необхо­димо принять два критичных фактора: степень существенности разли­чий меж величинами параметра для 2-ух выборок и Инструменты дескриптивного анализа средние квадратические ошибки 2-ух выборок, определяемые их объемами.

Для проверки, является ли значимой разница измеренных средних, употребляется нулевая догадка. Нулевая догадка подразумевает, что две совокупы, сравниваемые по одному либо нескольким призна­кам, не отличаются друг от друга. При всем этом подразумевается, что действи­тельное различие сравниваемых величин равно нулю Инструменты дескриптивного анализа, а выявленное по данным отличие от нуля носит случайный нрав [10], [25].

Для проверки существенности различия меж 2-мя измеренными средними (процентами) сначала проводится их сопоставление, а потом полу­ченная разница переводится в значение среднеквадратических ошибок, и определяется, как далековато они отклоняются от гипотетичного нулевого значения.

Как определены среднеквадратические ошибки, становится из­вестной Инструменты дескриптивного анализа площадь под обычной кривой рассредотачивания и возникает воз­можность сделать заключение о вероятности выполнения нулевой догадки.

Разглядим последующий пример. Попытаемся ответить на вопрос: «Есть ли разница в потреблении прохладительных напитков меж де­вушками и юношами?». При опросе был задан вопрос относительно чис­ла банок прохладительных напитков, потребляемых в Инструменты дескриптивного анализа течение недели. Описательная статистика показала, что в среднем юноши потребляют 9, а девицы 7,5 банок прохладительных напитков. Средние квадратические отличия, соответственно, составили 2 и 1,2. Объем выборок в обоих случаях составлял 100 человек. Проверка статистически важной разни­цы в оценках осуществлялась последующим образом:

где x1 и x2 — средние для 2-ух выборок;

s1 и s2 — средние Инструменты дескриптивного анализа квадратические отличия для 2-ух выборок;

n1 и n2 — объем соответственно первой и 2-ой подборки.

Числитель данной формулы охарактеризовывает разницу средних. Не считая того, нужно учитывать различие формы 2-ух кривых рассредотачивания. Это осуществляется в знаменателе формулы. Выборочное рассредотачивание сейчас рассматривается как выборочное рассредотачивание различия меж средними (процентными мерами). Если нулевая Инструменты дескриптивного анализа догадка справедлива, то рассредотачивание различия является обычной кривой со средней, равной нулю, и средней квадратической ошибкой, равной 1.

Видно, что величина 6,43 значительно превосходит значение ±1,96 (95%-ный уровень доверительности) и ±2,58 (99%-ный уровень довери­тельности). Это значит, что нулевая догадка не является настоящей.

На рис. 4.6 приводятся кривые рассредотачивания для этих 2-ух срав­ниваемых выборок Инструменты дескриптивного анализа и средняя квадратическая ошибка кривой различия. Средняя квадратическая ошибка средней кривой различия равна 0. Вслед­ствие огромного значения среднеквадратических ошибок возможность справедливости нулевой догадки об отсутствии различия меж 2-мя средними меньше 0,001.


instrumentarij-mentorstva-kak-pomoch-kritikam-bit-sovetchikami.html
instrumentarij-ocenivaniya-rezultatov.html
instrumentarij-sbora-dannih.html