Стереометрия широко использует статистические методы, так как результаты статистической обработки материала являются исходной информацией для объемной реконструкции плоскостных изображений. Это связано с тем, что исследователь не может провести замеры всей совокупности элементов анализируемой гистоструктуры и обычно довольствуется выборкой, т. е. измерением небольшого числа элементов объема ткани. Получаемый выборочный материал в последующем переносится на всю структуру в целом согласно законам распределения случайной величины. Кроме того, многие стереометрические методы основаны на принципах теории вероятностей и математической статистики.
Продолжение ниже ⇓
В настоящем разделе кратко излагаются описанные выше методы математической статистики, адаптированные для стереометрического анализа. Кроме хорошо известных методов вариационной и альтернативной статистики, описываются способы изучения усеченного распределения и некоторые непараметрические критерии. Последние можно использовать и при изучении качественных признаков, заданных в шкале балльных оценок.
Поведение случайной (мерной) величины или, другими словами, описание совокупности свойств всех структурных элементов ткани из одной генеральной совокупности можно охарактеризовать с помощью вариационной статистики такими параметрами, как средняя арифметическая и ее дисперсия. При этом дисперсию часто заменяют средним квадратическим отклонением (корень квадратный из дисперсии). Средняя арифметическая дает среднюю величину данного типа структурных элементов ткани, а дисперсия или среднее квадратическое отклонение показывает, насколько размеры каждого конкретного элемента могут отличаться от среднего значения [Автандилов Г. Г., 1973, 1980; Шорников Б. С., 1979; Автандилов Г. Г. и др., 1984; Непомнящих Л. М. и др., 1984],
В связи с тем, что обычно изучается не вся генеральная совокупность элементов ткани, а только их небольшая выборка, нужно знать, насколько установленные выборочные статистики отличаются от статистик генеральной совокупности, т. е. всего изучаемого органа, системы. Этим целям служит, как известно, определение ошибки средней арифметической, которая показывает, насколько выборочная средняя может отличаться от средней генеральной совокупности при выбранном уровне безошибочного суждения (3 порога надежности — 95; 97,5; 99,9%). В медико-биологических исследованиях 95% уровень значимости обычно считают достаточным для принятия гипотезы о представительности выборочных данных генеральной совокупности.
Обычно полагают, что среднее арифметическое с удвоенной сигмой заключает в себе 95% всех признаков морфологических элементов изученной выборочной совокупности. Фактически при нормальном распределении случайных величин средняя арифметическая и среднее квадратическое отклонение дают исчерпывающую информацию о распределении всех элементов изученной выборочной совокупности. Однако морфолог не всегда встречается с нормальным законом распределения, что связано, с одной стороны, с трудностями получения истинно репрезентативной выборочной совокупности для данной генеральной совокупности, а с другой — с тем, что при создании группы однородных явлений в выборке из данной генеральной совокупности могут встречаться отдельные элементы, принадлежащие другой генеральной совокупности. Например, при изучении какого-либо патологического процесса в простейшем случае морфолог может всю совокупность данного рода клеточных элементов разделить на две и более генеральных совокупностей: клетки с нормальной морфологией и клетки с патологическими изменениями (с признаками дистрофии и т. д.). На данном уровне исследования с учетом предела его разрешающей способности встретятся клетки в пограничных состояниях, которые без дополнительной информации могут быть отнесены как к одному, так и к другому подмножеству. В связи с этим полученные из них выборки могут содержать элементы другой генеральной совокупности. Это, естественно, отразится на распределении случайной величины. Оценка изменения закона распределения случайной величины дает возможность диагностировать изменения в структурах, которые обычными описательными методами на данных стадиях процесса не улавливаются. Таким образом, первичный статистический анализ еще без стереометрической обработки позволяет выявить существующие изменения и оказывается полезным в изучении разнообразия патологических процессов.
Проверка на нормальность закона распределения изучаемой случайной величины может быть проведена на основе коэффициентов асимметрии и эксцесса, которые соответственно находят по формулам.
Как отмечено выше, все параметры распределения случайной величины, полученные для выборочной совокупности, отражают только эту выборочную совокупность и поэтому не могут быть распространены на всю генеральную совокупность элементов, если не установлено, что выборочная совокупность представительна для генеральной совокупности. Эта задача обычно решается с использованием ошибки средней арифметической, определяемой по формуле.
Таким образом, уже после первичной статистической обработки материала без стереометрического анализа могут быть решены вопросы о существенности изменений в размерах тех или иных изучаемых структур при патологическом процессе данного типа. Заметим, что при & = 30 и более табл всегда равно 1,96, или 95% интервала достоверности (принятого в медико-биологических исследованиях), а в стереометрических разработках k всегда должно превышать 30 и поэтому нет необходимости использовать таблицу Стьюдента. Ниже показано, что данная задача (определение принадлежности выборочных совокупностей одной или разным генеральным совокупностям) может быть решена еще проще на основе использования одного из критериев непараметрической статистики, когда вообще нет необходимости в расчете статистик распределения элементов в выборочных совокупностях.
Когда различий между выборочными статистиками определить не удается и их относят к одной генеральной совокупности, полезно найти межвыборочные (межгрупповые) параметры распределения элементов данной генеральной совокупности, к которым относят межгрупповые среднюю арифметическую, дисперсию, среднее квадратическое отклонение и ошибку средней арифметической. Они могут быть найдены следующим образом: межгрупповая средняя арифметическая.
Оценка межгрупповых статистик является важным элементом стереометрического анализа. Обычно при стереометрических исследованиях на гистологических срезах используют препараты, взятые из разных участков органа. Очевидно, что измеряемые в них структурные элементы могут относиться как к одной, так и к разным генеральным совокупностям. В норме это связано с регионарными особенностями строения данных структурно-функциональных элементов органа, при патологии — с разной: выраженностью патологоанатомических изменений в различных его отделах. Для разных гистологических препаратов рекомендуется вычислять свои статистики (т. е. все элементы на данном гистологическом срезе принимают за одну выборку), после чего проводят проверку на их принадлежность одной генеральной совокупности. Только после того как статистический анализ показал, что по данному параметру разные срезы относятся: к одной генеральной совокупности, возможно объединение результатов замеров на разных объектах в одну межгрупповую совокупность с расчетом соответствующих параметров распределения.
Описанный метод статистической обработки результатов измерений на микропрепаратах используют тогда, когда удается получить представительную случайную выборку из генеральной совокупности. Между тем в практической работе патоморфолога выборочная совокупность иногда оказывается односторонне «усеченной». В таком случае обычно методы статистического исследования не могут быть использованы.
Оказывается, что если известна точка усечения выборочного распределения, то ее статистики можно определить на основе нормального усеченного распределения. Под точкой усечения понимают ту величину Z из выборочной совокупности, далее которой замеры не проводились [Янко Я., 1961]. В практической работе могут встречаться усеченные распределения, но исследователь и сам может специально усечь распределение с целью не проводить замеры малых структур, дающих большую относительную погрешность измерений, и уменьшить число проводимых замеров. Метод применим и тогда, когда по какой-либо причине ряд элементов данной структурной составляющей: препарата не выявляется и не может быть измерен.
Метод обработки материала по усеченному нормальному распределению при использовании ЭВМ не трудоемок и может быть рекомендован как метод выбора при обычной статистической обработке, когда можно получить полноценную выборочную совокупность, и как необходимый метод при получении усеченных распределений. Заметим, что данный метод, несмотря на перспективность, пока не получил распространения в морфологических лабораториях.
Кроме методов вариационной статистики, при проведении стереометрического анализа мерных величин можно использовать методы альтернативной статистики. Сущность метода альтернативной статистики, изучающей случайные события, состоит в следующем. Если рассматривается какое-либо событие, имеющее А равновероятных или разновероятных исключающих друг друга исходов, то вероятность появления любого из них можно оценить. При этом вероятность появления данного исхода есть отношение Р.
При проведении стереометрического анализа методы альтернативной статистики имеют большое значение.
Для оценки долевого вклада структурного элемента ткани органа в объем данной ткани или органа в целом используются и планиметрические методы. В частном случае для этих целей применяют метод «полей», когда структурные составляющие ткани случайно совмещаются с точками тестовой решетки. При этом полагают, что между общей величиной ткани и величиной ее структурных составляющих и между общим числом точек решетки и числом точек, пришедшихся на данные структурные составляющие ткани, устанавливается определенное соответствие. Это позволяет по общему числу точек, пришедшихся на орган (срез органа) в целом, и числу точек, пришедшихся на данный вид ткани, оценить долевую часть (долевой вклад) данной ткани в объекте. При наложении такой решетки на орган для каждой точки возможны два исхода, которые могут быть как равновероятными, так и разновероятными: точка может совпасть с изучаемой структурой или может совместиться с другими компонентами ткани, не учитываемыми в исследовании. Следовательно, один подсчет числа точек, приходящихся на данную структурную составляющую ткани, с определением общего числа точек, соответствующих всему образцу, и установлением доли данной структурной составляющей является недостаточным. При таком подходе у нас нет уверенности в том, что при повторных испытаниях (повторном наложении решетки и повторном проведении подсчетов) результаты будут воспроизведены. Как и при вариационно-статистическом анализе, возникает необходимость не только оценить долевой вклад данной структурной составляющей в объект, но и установить возможные колебания показателей с оценкой их репрезентативности для всего препарата. Эти величины получают с помощью альтернативной статистики, в которой используются показатели дисперсии, среднего квадратического отклонения и ошибки долевой части данной структурной составляющей в образце (т. е. вероятности положительного исхода, при котором точки приходятся на данную структуру).
Необходимое для получения достоверных данных число точек (Р) можно не только установить по формуле (92), но и найти, используя график [Weibel Е., 1963]. После подсчета 100 точек число точек, пришедшихся на исследуемую структуру, относят к 100. Соответственно значению этого отношения от оси ординат восстанавливают перпендикуляр до пересечения с кривой. От точки пересечения опускают второй перпендикуляр к оси абсцисс графика, на которой и получают число подсчетов точек, необходимое для проведения исследования.
Например, при предварительном подсчете точек с целью определения объемной доли на корковое вещество среза почки собаки пришлось 14 точек, что составляет на 100 точек 14: 100 = 0,14. Найдя на оси ординат графика соответствующую точку, проведем все указанные выше манипуляции. Тогда найдем, что для получения достоверных статистик, характеризующих удельный объем (W) и коркового вещества почки, необходимо подсчитать не менее 500 точек.
Различия в удельных объемах (площадях или длинах) для различных структурных составляющих одной точки или одной структурной составляющей для разных тканей оценивают согласно формуле (82), только значения М\ и М2 представляются как Vіу и V2v. Межгрупповые статистики оцениваются так же, как и при проведении вариационно-статистического исследования.
Другой пример: при исследовании среза колонбиоптата, окрашенного гематоксилином и эозином, методом полей определили объемную долю инфильтрата собственной пластинки толстой кишки. При большом увеличении светового микроскопа перемещали квадрат сетки Автандилова, имеющий 100 точек, 10 раз по изображению собственной пластинки (всего 1000 тест-точек). С лимфоцитами совпало 120 точек, с плазмоцитами — 92, что составляет от 1000 точек соответственно долю 0,12 и 0,092, в сумме 0,212. Ошибки выборки получают по формулам для вычисления ошибок для случайных событий.
Значительно упрощается определение и ядерно-цитоплазматических отношений при применении иммерсии или тест-системы с большим числом точек. Подсчитав количество точек, приходящихся на ядро, а затем на цитоплазму, и взяв их отношение, получают соответствующий индекс для каждой клетки.
Для определения существенности различий в структурной организации различных тканей, или тканей одного типа при патологических изменениях на основе как количественной информации, так и установления качественных оценок могут быть использованы непараметрические критерии статистики.
Приведем описание применения парного критерия Вилкоксона (Т) и критерия знаков (КЗ), а также покажем особенности их применения при решении задач морфометрического порядка. Остальные критерии следует использовать на основе аналогичных подходов, а их детальное описание можно найти в соответствующих руководствах [Гублер Е. В., Генкин А. А., 1973; Автандилов Г. Г., 1980; Автандилов Г. Г. и др., 1981]. Критерий знаков и парный критерий Вилкоксона используют в случае сравнения связанных (парных) выборок, а критерий Вилкоксона — Манна — Уитни (критерий U) применим при сравнении независимых выборочных совокупностей.
Рассмотрим способы сравнения связанных выборочных совокупностей. Если число пар наблюдений небольшое (не более 20), то применяют парный критерий Вилкоксона, если объем выборочных парных совокупностей больше, то прибегают к критерию знаков как к более простому.
Например, при патологическом процессе в одной группе препаратов были установлены изменения, а в другой группе таких изменений найти не удалось. Требуется определить, достоверны или случайны изменения в первой группе препаратов.
Проведем анализ с использованием парного критерия Вилкоксона. Для этих целей найдем разности между данными связанными парами наблюдений и пронумеруем их числами натурального ряда в возрастающей последовательности как 1, 2, 3... согласно абсолютным значениям разностей, взятым по модулю, т. е. без учета их знака (+ или —). Если окажется, что некоторые разности имеют одинаковый модуль, то им приписывают номера, равные их средним порядковым значениям (например, если на 3 одинаковые разности приходятся числа 4, 5, 6, то все они получают один и тот же ранговый номер, а именно 4+5+6=15:3 = 5). После этого находят сумму ранговых номеров для разностей с отрицательным знаком, ее принимают за экспериментальную оценку Т, которую необходимо поставить в соответствии с Т табличным. В таблице приведены те максимально допустимые значения чисел разностей с отрицательным знаком, при которых различия в выборках можно считать существенными.
Если число пар наблюдений превышает 20, то критерий Вилкоксона становится громоздким и отдают предпочтение «критерию знаков». Суть его состоит в следующем. В таблице для числа исходов с установленными изменениями находят то возможное число исходов, при котором изменения еще можно считать существенными. Если полученное в опыте число исходов отрицательного значения меньше табличного, то выявленные изменения считают характерными для данного патологического процесса.
Например, при изучении патологического процесса в 110 препаратах из 360 были установлены изменения определенного типа. Следует определить, действительно ли они характерны для изучаемого явления.
Согласно той же таблице считаем, что для принятия суждения о представительности установленных изменений изучаемому явлению необходимо и достаточно, чтобы число препаратов, в которых таких изменений не оказалось, не превышало 155. Так как в нашем случае оно равно 360—110 = 250 и превышает табличные значения, приходим к выводу, что установленные в препаратах изменения не типичны для изучаемого процесса.
Критерий Вилкоксона—Манна—Уитни (критерий U), как отмечалось выше, используют для сравнения независимых выборочных совокупностей. При числе наблюдений до 60 используют специальные таблицы [Гублер Е. В., Генкин А. А., 1973; Гублер Е. В., 1978; Автандилов Г. Г. и др., 1981, 1987].
Метод состоит в следующем. Два ряда наблюдений группируют в возрастающей последовательности в виде одного так называемого упорядоченного ряда.
Если два числа оказываются одинаковыми, то каждое из них ставят на первое или второе место с помощью таблиц случайных чисел. Приписывают каждому из них соответствующий номер, и то число, номер которого в таблице случайных чисел окажется первым, записывают первым. Если число одинаковых пар равное, то число располагают так, чтобы не отдать предпочтения ни одному ряду. После этого подсчитывают число инверсий, т. е. сколько раз в упорядоченном ряду цифры первого и второго ряда меняются местами. За одну инверсию принимают такое расположение чисел, при котором перед каким-либо числом первого ряда в упорядоченном ряду находится одно число из второго ряда. Если перед ним стоят два числа второго ряда, то соответственно считают, что имеются две инверсии, и т. д. Число инверсий обозначают буквой U, откуда и следует название критерия. Для определения достоверности различий между двумя выборками (двумя рядами в упорядоченном ряду) подсчитывают общее число инверсий. После этого по таблице для числа наблюдений в первой и второй выборках находят то максимальное теоретическое значение С/теор, при котором различия еще можно считать существенными. Если полученное в опыте число инверсий не превышает допустимого (табличного), то различия в выборках считают существенными.
© Авторы и рецензенты:
редакционный коллектив оздоровительного портала "На здоровье!". Все права защищены.