Смотреть страницы где упоминается термин малая выборка. Бутстреп, малые выборки, применение в анализе данных Бутстреп, малые выборки, применение в анализе данных

В практике статистических исследований часто приходится сталкиваться с малыми выборками , которые имеют объем менее 30 единиц. К большим же обычно относят выборки объемом свыше 100 единиц.

Обычно малые выборки применяются в случаях, когда невозможно или нецелесообразно использовать большую выборку. Иметь дело с такими выборками приходится, например, при опросах туристов и посетителей гостиниц.

Величина ошибки малой выборки определяется по формулам, отличающимся от формул для сравнительно большого объема выборки ().

При малом объеме выборки n следует учитывать взаимосвязь между выборочной и генеральной дисперсией :

Так как при малой выборке дробь имеет существенное значение, то вычисление дисперсии производится с учетом, так называемого числа степеней свободы . Оно понимается как число вариантов , которые могут принимать произвольные значения, не меняя величины средней .

Средняя ошибка малой выборки определяется по формуле:

Предельная ошибка выборки для средней и доли находится аналогично случаю большой выборки:

где t – коэффициент доверия, зависящий от заданного уровня значимости и числа степеней свободы (Приложение 5).

Значения коэффициента зависят не только от заданной доверительной вероятности , но и от объема выборки n . Для отдельных значений t и n доверительная вероятность определяется по распределению Стьюдента, которое содержит распределения стандартизованных отклонений:

Замечание. По мере увеличения объема выбор­ки распределение Стьюдента приближается к нормальному распределению: при n =20 оно уже мало отличается от нормального распределе­ния. При проведении малых выборочных обследований следует учесть, что чем меньше объем выборки n , тем больше раз­личие между распределением Стьюдента и нормальным рас­пределением. Например, при п min . = 4 это различие весьма существенно, что говорит об уменьшении точности результатов малой выборки.

При контроле качества товаров в экономических исследованиях эксперимент может проводиться на основе малой выборки.Под малой выборкой понимается несплошное статистическое обследование,при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности. Объем малой выборки обычно не превышает 30 единиц и может доходить до 4 - 5 единиц.Средняя ошибка малой выборки вычисляется по формуле:,где - дисперсия малой выборки.При определении дисперсии число степеней свободы равно n-1: . Предельная ошибка малой выборки определяется по формулеПри этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная вероятность малой выборки определяется по специальным таблицам Стьюдента (Табл. 9.1.), в которых даны распределения стандартизированных отклонений:.Поскольку при проведении малой выборки в качестве доверительной вероятности практически принимается значение 0,59 или 0,99, то для определения предельной ошибки малой выборки используются следующие показания распределения Стьюдента:

Способы распространения характеристик выборки на генеральную совокупность. Выборочный метод чаще всего применяется для получения характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от целей исследований это осуществляется или прямым пересчётом показателей выборки для генеральной совокупности, или посредством расчёта поправочных коэффициентов. Способ прямого пересчёта. Он состоит в том, что показатели выборочной доли или средней распространяется на генеральную совокупность с учётом ошибки выборки.Так, в торговле определяется количество поступивших в партии товара нестандартных изделий. Для этого (с учётом принятой степени вероятности) показатели доли нестандартных изделий в выборке умножаются на численность изделий во всей партии товара. Способ поправочных коэффициентов . Применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета.В статистической практике этот способ используется при уточнении данных ежегодных переписей скота, находящегося у населения. Для этого послеобобщения данных сплошного учета практикуется 10%-ное выборочное обследованиес определением так называемого “процента недоучета”. Способы отбора единиц из генеральной совокупности. В статистике применяются различные способы формирования выборочных совокупностей, что обусловливается задачами исследования и зависит от специфики объекта изучения.Основным условием проведения выборочного обследования является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы генеральной совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности. Существуют следующие способы отбора единиц из генеральной совокупности:1) индивидуальный отбор - в выборку отбираются отдельные единицы;2) групповой отбор - в выборку попадают качественно однородные группы или серии изучаемых единиц;3) комбинированный отбор - это комбинация индивидуального и группового отбора. Способы отбора определяются правилами формирования выборочной совокупности.Выборка может быть:- собственно-случайная;- механическая;- типическая;- серийная;- комбинированная. Собственно-случайная выборка состоит в том, что выборочная совокупность образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки. Доля выборки есть отношение числа единиц выборочной совокупности n к численности единиц генеральной совокупности N, т.е..Так, при 5%-ной выборке из партии товара в 2 000 ед. численность выборки n составляет 100 ед. (5*2000:100), а при 20%-ной выборке она составит 400 ед. (20*2000:100) и т.д. Механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки.Так, при 2%-ной выборке отбирается каждая 50-я единица (1:0,02), при 5%-ной выборке - каждая 20-я единица (1:0,05) и т.д.Таким образом, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица.Важной особенностью механической выборки является то, что формирование выборочной совокупности можно осуществить, не прибегая к составлению списков. На практике часто используют тот порядок, в котором фактически размещаются единицы генеральной совокупности. Например, последовательность выхода готовых изделий с конвейера или поточной линии, порядок размещения единиц партии товара при хранении, транспортировке, реализации и т.д. Типическая выборка. При типической выборке генеральная совокупность вначале расчленяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании производительности труда работников торговли, состоящих из отдельных групп по квалификации.Важной особенностью типической выборки является то, что она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность.Для определения средней ошибки типической выборки используются формулы: повторный отбор , бесповторный отбор , Дисперсия определяется по следующим формулам: , При одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку. Так обстоит дело при собственно-случайной и серийной выборке.При многоступенчатой выборке производят подбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы. Так производится типическая выборка с механическим способом отбора единиц в выборочную совокупность. Комбинированная выборка может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.

Метод малых выборок имеет ряд преимуществ перед методом больших выборок. Основными преимуществами его являются, во-первых, уменьшение объема вычислительных работ, во-вторых, возможность следить за динамикой изменения точности процесса во времени, чего нельзя сделать с помощью метода больших выборок. Метод больших выборок может дать представление лишь о точности и устойчивости процесса в период взятия выборки, которые могут сохраниться и в дальнейшем, если после взятия выборки условия протекания процесса не изменяются. В действительности такой неизменности производственных условий заранее предвидеть нельзя. Например, при работе на прутковом автомате в течение смены производится несколько раз замена материала (смена прутка), смена инструмента в связи с износом, поднастройка станка и т.д., которые могут вносить значительные коррективы в полученные ранее параметры распределения. Метод малых выборок, если последние берут в течение всей смены регулярно через определенные промежутки времени, позволяет получить полную картину состояния процесса в течение исследуемого периода, выяснить степень его устойчивости, а также выявить причины недостаточной устойчивости процесса во времени, если она есть.

Статистический анализ малыми выборками производится следующим образом. Выборки объемом n = 5-10 шт. берутся через определенные фиксированные промежутки времени (например, через 15-30 мин). Период времени для отбора проб устанавливается опытным путем и зависит от производительности станка, объема выборки и степени устойчивости технологического процесса. Для каждой выборки нужно вычислить и S . Далее необходимо для каждых двух смежных выборок проверить гипотезу однородности дисперсий выборок при помощи F - критерия Фишера.

Если гипотеза подтверждается, то это свидетельствует о стабильности рассеивания или о том, что сравниваемые выборки взяты из одной и той же генеральной совокупности. При подтверждении гипотезы однородности дисперсий двух выборок следует проверить гипотезу однородности двух выборочных средних по t -критерию Стьюдента.

Подтверждение гипотезы равенства двух смежных выборочных средних означает, что центр настройки оборудования не изменится в момент взятия данной выборки и остался таким, каким был при взятии предыдущей выборки, т.е. процесс находится в стабильном состоянии. Когда гипотеза равенства двух средних выборок не подтверждается, это свидетельствует о смещении центра настройки станка во время взятия данной выборки. Так как выборки берутся через определенные промежутки времени, то при обнаружении смещения центра настройки или изменения зоны рассеивания можно определить период времени, через который наступило нарушение стабильности процесса.

Обнаружив факт нарушения стабильности процесса, можно установить и область, в которой следует искать причину этого явления. Неоднородность выборочных дисперсий, свидетельствующая о нестабильности рассеивания, указывает на то, что причину этого следует искать в станке или в механических свойствах обрабатываемого материала. Неоднородность выборочных средних говорит о смещении центра настройки (причину искать в инструменте).

Таким образом, беря в течение смены через определенные интервалы времени малые выборки из текущей продукции станка, вычислены средние и дисперсии выборок путем сравнения и оценки их расхождения при помощи F и t- критериев, можно установить моменты разладок процесса и даже источники этих разладок.

А.М. Носовский1*, А.Э. Пихлак2, В.А. Логачев2, И.И. Чурсинова3, Н.А. Мутьева2 СТАТИСТИКА МАЛЫХ ВЫБОРОК В МЕДИЦИНСКИХ ИССЛЕДОВАНИЯХ

"Государственный научный центр Российской Федерации - Институт медико-биологических проблем Российской академии наук, 123007, Москва, Россия; 2ГБОУ ВПО «Московский государственный медико-стоматологический университет имени А.И.Евдокимова» Минздрава России, 127473, Москва, Россия; 3АНО «Артрологическая больница НПО СКАЛ», 109044, Москва, Россия

*Носовский Андрей Максимович, E-mail: [email protected]

♦ Экспериментально найдены характеристики статистических критериев. В результате вычисляли значение статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz). Для каждой исходной статистики вычисляется нормальная аппроксимация (Z-статистика) и уровень значимости p нулевой гипотезы об отсутствии различий в разбросе значений двух выборок. Если p>

Предлагаемые методы математической статистики позволяют подтверждать достоверность различий полученных результатов даже в небольших группах наблюдений, если различия достаточно значимы. Иллюстрацией служили клинические примеры пациентов с костно-суставной патологией. Ключевые слова: малая выборка, мощность критерия, коксартроз, подагрический полиартрит

A.M. Nosovskiy1, A.E.Pikhlak2, V.A. Logachev2, I.I. Chursinova3, N.AMuteva2 SMALL-DATA STATISTICS ANALYSIS IN MEDICAL STUDIES

1The state research center-institute of medical biological problems of the Russia academy of medical sciences, 123007 Moscow, Russia; 2Moscow State University of Medicine and Dentistry named after A.I. Evdokimov, 127473 Moscow, Russia; 3Arthrology hospital of scientific and practical association SKAL, 109044 Moscow, Russia

♦ The experimentally was found characteristics of statistical criteria. As a result, calculated the value of the statistics by W. An-sari-Bradly and K. Klotz. For each source of statistics calculated normal approximation (Z-statistics) and the significance level of p of the null hypothesis of no difference in the spread of the values of the two samples. Atp>0.05 the null hypothesis can be accepted. Suggested methods of mathematical statistics can be confirming the accuracy of the differences of the results, even in small groups of observations, if the differences are significant enough.

We used medical cases of patients with joint and bone pathology.

Key words: small data analysis, power of criteria, coxarthrosis, gouty arthritis

Принципы доказательной медицины предъявляют высокие требования к достоверности сравнительной оценки полученных результатов исследований. Это становится тем более важным, что большинство врачей имеет весьма поверхностное представление о методиках статистической обработки, ограничиваясь в своих публикациях помимо вычисления процентов, в лучшем случае /-критерием Стьюдента.

Однако для проведения полноценного анализа результатов исследования в ряде случаев этого бывает недостаточно. Не вызывает обычно сомнений достоверность выявленных закономерностей, когда число наблюдений составляет несколько тысяч или даже сотен. А если это - несколько десятков? А если мы имеем лишь несколько случаев? Ведь в медицине встречаются достаточно редкие заболевания, хирурги порой выполняют уникальные операции, когда количество наблюдений совсем невелико. Где та грань, тот необходимый и достаточный объем исследований, позволяющий утверждать о несомненном наличии той или иной закономерности?

Этот вопрос имеет важнейшее значение не только при оценке уже проведенных исследований, но и при планировании научной работы. Достаточно ли провести наблюдение за 20 пациентами или необходимо минимум 40? А может быть, хватит и 10 случаев? От своевременного и правильного ответа на этот вопрос зависит не только достоверность сделанных выводов, но и сроки проведения исследований, их стоимость, потребность в кадрах, оснащении и т.д.

Современная статистика знает довольно много приемов, с помощью которых можно определять достоверность результатов даже при небольшом числе наблюдений. Это - методы «малой выборки». Принято считать, что начало статистике малых выборок было положено в первом десятилетии XX века публикацией работы У Гос -

сета, где он под псевдонимом «Стьюдент» (студент) постулировал так называемое /-распределение. В отличие от теории нормального распределения, теория ^распределения для малых выборок не требует априорного знания или точных оценок математического ожидания и дисперсии генеральной совокупности, а также не требует допущений относительно параметров. В /-распределении одно из отклонений от выборочного среднего всегда фиксировано, так как сумма всех таких отклонений должна равняться нулю. Это сказывается на сумме квадратов при вычислении выборочной дисперсии как несмещённой оценки дисперсии генеральной совокупности и ведёт к тому, что число степеней свободы df получается равным числу измерений минус единица для каждой выборки. Отсюда, в формулах и процедурах вычисления /-статистики для проверки нулевой гипотезы df=w-1. Известны также классические работы крупнейшего английского статистика Р.А. Фишера (в честь которого получило свое название ^-распределение) по дисперсионному анализу - статистическому методу, явно ориентированному на анализ малых выборок. Из многочисленных статистик, которые можно обоснованно применять к малым выборкам, можно упомянуть: критерий точной вероятности Фишера; двухфак-торный непараметрический (ранговый) дисперсионный анализ Фридмана; коэффициент ранговой корреляции / Кендалла; коэффициент конкордации Кендалла; Я-критерий Краскела-Уоллеса для непараметрического (рангового) однофакторного дисперсионного анализа; ^/-критерий Манна-Уитни; медианный критерий; критерий знаков; коэффициент ранговой корреляции г Спирме-на; /-критерий Уилкоксона.

Определённого ответа на вопрос, какой объем должна иметь выборка, чтобы её можно было считать малой, не существует. Однако условной границей между малой и большой выборкой принято считать df=30. Основанием

для этого в какой-то мере произвольного решения служит результат сравнения /-распределения (для малых выборок) с нормальным распределением (г). Расхождение значений / и г имеет тенденцию возрастать с уменьшением и снижаться с увеличением Фактически, 1 начинает тесно приближаться к ъ задолго до предельного случая, когда /=г. Простое визуальное изучение табличных значений / позволяет увидеть, что это приближение становиться довольно быстрым, начиная с ^=30 и выше. Сравнительные величины / (при ^=30) и г равны соответственно: 2,04 и 1,96 для р=0,05; 2,75 и 2,58 для р=0,01; 3,65 и 3,29 для р=0,001.

В математической статистике употребляют коэффициент доверия /, значения функции табулированы при разных его значениях, при этом получают соответствующие уровни доверительной вероятности (табл. 1) .

Коэффициент доверия позволяет вычислить предельную ошибку выборки АХ, вычисляемую по формуле АХср=1цср, т.е. предельная ошибка выборки равна /-кратному числу средних ошибок выборки .

Таким образом, величина предельной ошибки выборки может быть установлена с определённой вероятностью. Как видно из последней графы таблицы 1, вероятность появления ошибки равной или большей утроенной средней ошибки выборки, т. е. АХс =3цс крайне мала и равна 0,003 (1-0,997). Такие маловероятные события считаются практически невозможными, а потому величину АХ =3цс можно принять за предел возможной ошибки выбо рки р3].

Интервал, в который с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра, называют доверительным, а вероятность Р - доверительной вероятностью . Чаще всего доверительную вероятность принимают равной 0,95 или 0,99, тогда коэффициент доверия 1 равен соответственно 1,96 и 2,58.

Это означает, что доверительный интервал с заданной вероятностью заключает в себе генеральную среднюю.

Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки .

Применение данного подхода может быть проиллюстрировано наблюдением за 20 пациентами с коксартрозом, находившихся на лечении в Артрологической больнице НПО «СКАЛ» (Научно-производственное объединение «Специализированное курсовое амбулаторное лечение») г. Москвы.

При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.

Вероятность ошибки первого рода называется уровнем значимости и обозначается а. Таким образом, а=Р{Ш¥ | Н0}, т.е. уровень значимости а - это вероятность события {Це¥}, вычисленная в предположении, что верна нулевая гипотеза Н0.

Уровень значимости и мощности критерия объединяются в понятии функции мощности критерия - функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Функция мощности зависит от критической области ¥ и действительного распределения результатов наблюдений. В параметрической

Таблица 1

Коэффициент доверия t и соответствующие уровни доверительной вероятности

t 1,00 1,96 2,00 2,58 3,00

F(0 0,683 0,950 0,954 0,990 0,997

задаче проверки гипотез распределение результатов наблюдений задается параметром 0. В этом случае функция мощности обозначается М(¥,0) и зависит от критической области ¥ и действительного значения исследуемого параметра 0. Если Н0: 0=00, Н1: 0=01, то М(¥,00) = а, М(¥,01)=1-в, где а - вероятность ошибки первого рода, в - вероятность ошибки второго рода. Тогда, мощность критерия - это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.

Функция мощности М(¥,0) в случае одномерного параметра 0 обычно достигает минимума, равного а, при 0=00, монотонно возрастает при удалении от 00 и приближается к 1 при | 0 - 00 | ^ да.

Оценим необходимую мощность статистических критериев (рис. 1), которые могли бы быть применены для анализа лечения 20 пациентов с коксартрозом.

Как видим, при среднеквадратическом отклонении равном 3,0, что бывает крайне редко, будут получены результаты с высокой степенью надёжности /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.

Для определения уровня значимости р обычно используется приближенная нормальная 2-аппроксимация соответствующей статистики. Такая аппроксимация дает хорошее приближение при достаточно больших размерах выборок. При малом объеме выборки и значениях р, близких к 0,05, мы проверяли вывод о нулевой гипотезе срав-

Power Curve alpha=0,05, sigma=

Power Curve alpha=0,05, sigma=1,

True Difference Between Means

True Difference Between Means

Рис. 1. Экспериментально найденные характеристики статистических

критериев.

Таблица 2 .

Группы наблюдения

Группа 1 Группа 2 Группа 3 Всего наблюдений

Нимесулид, витамины, хондропротекторы, лечебная физкультура + + + 20

Физиотерапия --- + + 15

Массаж... --- + 8

Боль при движении

Боль в покое 43±13 27±17

нением вычисленного значения статистики с критическим значением в таблице соответствующего распределения из статистического справочника.

Критерии различия сдвига (положения). Мы использовали эти критерии для проверки следующих гипотез:

♦ отсутствие различий во взаимном положении (медианах) двух исследованных выборках;

♦ сдвиг выборок друг относительно друга равен некоторому значению d;

♦ медиана одной анализируемой выборки равна значению d.

В случае б) необходимо было предварительно все значения второй выборки уменьшить на величину d: yi=yi-d.

В случае в) необходимо подготовить вспомогательную парную выборку, все элементы которой равны d.

В результате вычисляли:

♦ значение статистики W. Вилкоксона (Wilco-xon) - сумма рангов Rxi элементов одной из выборок в объединенной ранжированной выборке;

♦ значение статистики V Ван дер Вардена (van der Varden), основанную на использовании метода «произвольных меток».

Для каждой статистики вычислялась нормальная аппроксимация (Z-статистика) и уровень значимости P нулевой гипотезы об отсутствии различий в сдвиге по отношению друг к другу. Если p>0,05 нулевая гипотеза может быть принята.

Некоторые пакеты и авторы предлагают использовать ^/-критерий Манна-Уитни (Mann-Whitney) и критерий Вальда-Вольфовица (Vald-Wolfowitz). Однако давно уже доказано , что критерий Манна-Уитни эквивалентен, т.е. обладает теми же возможностями, что и крите-

Таблица 3 .

Средние показатели интенсивности боли (в баллах по ВАШ)

Группа 1 (n= 5) Группа 2 (n=7) Группа 3 (n= =8)

Показатель Начало наблюдения Конец наблюдения Снижение боли Начало наблюдения Конец наблюдения Снижение боли Начало наблюдения Конец наблюдения Снижение боли

Таблица 4.

Данные лабораторного обследования больного Б.

№ Показатель Норма Результат предпослед- Результат последнего

него посещения посещения

Гематокрит, % 40-48 38,7

Лимфоциты, % 19-37 42

СОЭ, мм/час 2-10 39

Мочевая кислота, мкмоль/л 200-416 504

Креатинин, мкмоль/л 44-106 238

Паратиреоидный гормон, пг/мл 7-53 76,8

Фибриноген, г/л 1,69-3,92 5,7

Белок в моче, г/л 0-0,1 1

43,5 39 10 489 202 101 3

Предпоследнее

Последнее

Рис. 2. р-значения клинических показателей больного Б. при предпоследнем и последнем обследовании.

рий Вилкоксона, а критерий Вальда-Вольфовица страдает сравнительно малой чувствительностью.

Критерии различия масштаба (рассеяния). Мы использовали эти критерии для проверки следующих гипотез:

♦ гипотеза об отсутствии различий в масштабах (в разбросе или рассеянии значений) исследуемых выборок;

♦ гипотеза о том, что отношение масштабов выборок равна заданной величине g.

В последнем случае необходимо предварительно изменить значения второй выборки у1=(у1-т0)^ , где т0 -общая медиана двух исследуемых спектров.

Если медианы генеральных совокупностей, из которых извлечены выборки, не равны по величине, но их

применить, предварительно модифицировав одну из выборок, например, в выборку yi=yi-m2+mr

Если же медианы не равны и не известны, то следует подтвердить гипотезу об отсутствии различий сдвига или же использовать метод для обнаружения произвольных альтернатив.

В результате вычисляли значение статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz), которые являются концептуальными аналогами статистик Вилкоксона и Ван дер Вардена.

Для каждой исходной статистики вычисляется нормальная аппроксимация (Z-статистика) и уровень значимости P нулевой гипотезы об отсутствии различий в разбросе значений двух выборок. Если />>0.05, нулевая гипотеза может быть принята.

Таким образом, предлагаемые выше методы математической статистики позволяют подтверждать достоверность различий

полученных результатов даже в небольших группах наблюдений, если различия достаточно значимы.

Иллюстрацией могут служить два клинических примера пациентов с костно-суставной патологией.

Клинический пример № 1. У 20 пациентов с кок-сартрозом применяли базовый лечебный комплекс, включающий пероральный прием нимесулида, хондропротекторов, внутримышечные инъекции витаминов и лечебную физкультуру. Кроме этого у 15 из них применяли физиотерапевтическое лечение, а у 6 пациентов - массаж. Таким образом, образовалось 3 группы пациентов с небольшим (от 5 до 8) числом наблюдений (табл. 2).

Среди прочих параметров перед началом лечения и после завершения курса (21±2 дня) оценивали интенсивность боли при движении и в покое по 100-бальной визуальной аналоговой шкале (ВАШ).

Использовались следующие методы статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz) (табл. 3).

Согласно полученным данным (табл. 3) было отмечено, что снижение боли в покое в группе 1 в конце наблюдения не являлось достоверным. Однако по всем другим изучаемым параметрам выявлены достоверные значения. Рассматриваемый клинический пример свидетельствует о возможности получения достоверных результатов на малом количестве выборки.

В клиническом примере № 2 рассматриваются в динамике лабораторные данные больного Б., страдающего хроническим подагрическим полиартритом, подагрической не-фропатией с явлениями ХПН, которые находились за пределами референсных значений (табл. 4).

Рассчитаем вероятность того, что результаты анализа статистически достоверно выходят за границы клинической нормы. Для этого используем вероятностный калькулятор статистического пакета «STATISTICA 6.0». В данном случае p-значение характеризует ошибку первого рода: вероятность отклонить правильную гипотезу, когда на самом деле она верна. В большинстве случаев результаты предпоследнего посещения статистически достоверно отличаются от нормы (рис. 2). Поскольку пороговый уровень значимости в данном случае мы принимаем равным 0,05, то результаты гематокрита, лимфоцитов, СОЭ, фибриногена статистически значимо улучшились при последнем посещении. Соответственно, клинические показатели мочевой кислоты, креатинина, паратиреоидного гормона и белка в моче, с точки зрения математической статистики, не улучшились.

Таким образом, при планировании исследования важно учитывать мощность применяемых статистических критериев, которые определяются вариабельностью выборки и заданным уровнем значимости.

Предлагаемый подход может быть интересен специалистам в области персонифицированной медицины для

анализа в динамике применяемых методов лечения и лекарственных средств, при контроле за проводимыми лечебными и диагностическими мероприятиями.

ЛИТЕРАТУРА

1. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука; 1995.

2. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука; 2003.

3. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ; 2006.

4. Правецкий Н.В., Носовский А.М., Матросова М.А., Холин С.Ф., Шакин В.В. Математическое обоснование достаточного количества измерений для достоверной оценки регистрируемых параметров в космической биологии и медицине. Космическая биология и авиакосмическая медицина. М.: Медицина; 1990; 5: 53-6.

5. ХоллендерМ., Вульф Д.А. Непараметрические методы статистики. М.: Финансы и статистика; 1983.

6. Носовский А.М. Применение вероятностных моделей на окружности в медико-биологических исследованиях. Космическая биология и авиакосмическая медицина. Тезисы докладов IX Всесоюзная конференция. Калуга, 19-21 июня 1990.

7. Носовский А.М., Правецкий Н.В., Холин С.Ф. Математический подход к оценке точности измерений физиологического параметра различными методами. Космическая биология и авиакосмическая медицина. М.: Медицина; 1991; 6: 53-5.

1. Bol"shev L.N., Smirnov N.V. Tables of Mathematical Statistics. Moscow: Nauka; 1995 (in Russian).

2. Korn G., Korn T. Mathematical Handbook for Scientists and Engineers. Moscow: Nauka; 2003 (in Russian).

3. Kobzar" A.I. Applied Mathematical Statistics. For engineers and scientists. Moscow: FIZMATLIT; 2006 (in Russian).

4. Pravetskiy N.V., Nosovskiy A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Mathematical justification of a sufficient number of measurements for reliable evaluation of recorded parameters in space biology and medicine. Space Biology and Aerospace Medicine. Moscow: Meditsina; 1990; 5: 53-6 (in Russian).

5. Khollender M., Vul"f D.A. Non-parametric statistical methods. Moscow: Finansy i statistika; 1983 (in Russian).

6. Nosovskiy A.M. The use of probabilistic models on the circle in biomedical research. Space Biology and Aerospace Medicine. Abstracts of the IX All-Union Conference. Kaluga, June 19-21, 1990 (in Russian).

7. Nosovskiy A.M., Pravetskiy N.V., Kholin S.F. Mathematical approach to estimation accuracy of the physiological parameter by different methods. Space Biology and Aerospace Medicine. Moscow: Me-ditsina; 1991; 6: 53-5 (in Russian).

Выборка – ограниченная по численности группа объектов (в психологии – испытуемых, респондентов) специально отбираемая из генеральной совокупности для изучения ее свойств .

Генеральная совокупность – это все множество объектов, в отношении которого формулируется исследовательская гипотеза .

Изучение на выборке свойств генеральной совокупности называется выборочным исследованием . Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.

Основное требование к выборке испытуемых – ее репрезентативность – представительность, показательность, соответствие характеристик, полученных в результате частичного (выборочного) обследования какой-либо группы, характеристикам этой группы в целом. . Исследователь должен помнить о возможности распространения выводов конкретного обследования на всю популяцию, частью которой является обследуемая группа.

Необходимо очень внимательно подходить к составлению выборки в испытуемых в эмпирическом исследовании. Важно учитывать пол, возраст, социальное положение, уровень образования, состояние здоровья, индивидуально-психологические особенности испытуемых и другие параметры, которые могут оказать влияние на результаты.

Выделяют два основных типа выборки: вероятностную (построенную на математических и статистических расчетах) ицелевую (заданную целью исследования и определяемую доступностью, типичностью и равным представительством испытуемых).

В строгом понимании репрезентативной может быть только вероятностная выборка, т.к. она соответствует принципу рандомизации: одинаково равной вероятности попадания каждого члена генеральной совокупности в выборочную совокупность. Существуют следующие виды вероятностной выборки: простая, случайная, систематическая, стратифицированная, кластерная, многоступенчатая .

Чаще всего в психологических исследованиях применяют целевой отбор, используют целевую выборку. Критериями для построения целевой выборки являются: доступность, типичность, равное представительство. В связи с этим можно выделить следующие виды выборки по принципу целевого отбора: выборка на основании принципа доступных случаев; отбор критических, либо типичных случаев; выборка, построенная на основании метода «снежного кома»; квотная выборка.

Выборка на основании принципа доступных случаев – наиболее распространенный вариант выборки испытуемых. Применяется при изучении больших по численности групп испытуемых, не обладающих уникальными, специфическими параметрами.

Выборка по принципу отбора критических, либо типичных случаев , построенана основаниитеоретических представлений или предшествующего эмпирического опыта исследователя. Из всей обследуемой совокупности испытуемых отбираются те, которые обладают необходимыми специфическими характеристиками.

Пример: Выборку исследования составляют родители, которыми ситуация поступления их ребенка в школу оценивается как стрессовая.

Выборка, построенная по методу «снежного кома» или методу «редких» совокупностей . Первоначально опрашиваются один или несколько человек интересующей исследователя выборочной совокупности, которые в дальнейшем служат источниками информации о других членах данной совокупности. Выборка расширяется в геометрической прогрессии, подобно формирующемуся «снежному кому». Данный метод применяется тогда, когда испытуемые по различным причинам не афишируют свою принадлежность к той или иной группе людей.

Пример: Выборку составляют ученые, исследования которых касаются узкой научной проблемы.

Квотная выборка связана с разбиением изучаемой совокупности на подгруппы на основании социально-демографических или иных характеристик, которые являются важными для проведения исследования. Опираясь на известные пропорции определенных групп в генеральной совокупности, исследователь выделяет «квоту» для каждой обследуемой подгруппы. (Социально-демографические данные можно найти в статистических сборниках, выпускаемых ежегодно отделами статистики регионов).

Пример: Выборка исследования включает мужчин и женщин предпенсионного возраста – 50-60 лет. По статистике мужчины данного возраста составляют 46%, а женщины – 54 % генеральной совокупности. Следовательно, при общей численности выборки 100 человек должно быть обследовано не менее 46 мужчин и 54 женщин.

Одни из важных вопросов психологического исследования является вопрос объема выборки испытуемых , который должен обеспечивать доказательность выводов научного исследования. Исходя из методов математической обработки, к объему выборки предъявляются следующие требования:

    Наибольший объем выборки необходим при разработке диагностической методики – от 200 до 1000-2500 человек.

    При сравнении двух выборок, их общая численность должна быть не менее 50 человек. При этом численность сравниваемых выборок должна быть примерно одинаковой.

    При изучении взаимосвязи между свойствами, чертами и т.п. объем выборки должен быть не меньше 30-35 человек.

    Если для обработки данных применяется факторный анализ, важно помнить, что надежные факторные решения можно получить лишь в том случае, если количество испытуемых превышает число регистрируемых переменных в три и более раз.

    Чем больше изменчивость изучаемого свойства, тем больше объем выборки. Изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т.д. Но возможности распространения выводов исследования на генеральную совокупность уменьшатся.

    Целесообразно увеличение количества испытуемых на 5-10 % по сравнению с планируемым, так как часть полученных бланков будет отбракована в ходе исследования (не поняли инструкцию, не приняли задачу, дали отклоняющиеся результаты и т.п.) .

Зависимые и независимые выборки

Часто исследование строится таким образом, что свойство, интересующее исследователя, изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различных соотношениях – в зависимости от цели и задач исследования.

Независимые выборк и характеризуются тем, что вероятность отбора любого испытуемого из одной выборки не зависит от отбора любого испытуемого другой выборки.

Зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.

Пример 1: Зависимые выборки – два ряда значений, полученных при обследовании одной и той же группы испытуемых: измерено состояние какого-либо свойства «до» и «после» экспериментального воздействия.

В этом случае выборки (одна – «до», другая – «после» воздействия) зависимы в максимально возможной степени, так как они включают одних и тех же испытуемых.

Пример 2: Зависимые выборки: мужья – 1 выборка, жены – 2 выборка.

Пример 3: Зависимые выборки: дети 5-7 лет – 1 выборка, их братья и сестры – 2 выборка.

В примерах 2,3 представлены варианты менее зависимых выборок.

В общем случае зависимые выборки предполагают попарный подбор испытуемых в сравниваемые выборки, а независимые выборки – независимый отбор испытуемых .

error: