Что называют вариантами. V

В результате освоения дайной главы студент должен: знать

  • показатели вариации и их взаимосвязь;
  • основные законы распределения признаков;
  • сущность критериев согласия; уметь
  • рассчитывать показатели вариации и критерии согласия;
  • определять характеристики распределений;
  • оценивать основные числовые характеристики статистических рядов распределения;

владеть

Показатели вариации

При статистическом исследовании признаков различных статистических совокупностей большой интерес представляет изучение вариации признака отдельных статистических единиц совокупности, а также характера распределения единиц по данному признаку. Вариация - это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение. По степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию. Показатели вариации используются для характеристики и упорядочения статистических совокупностей.

Результаты сводки и группировки материалов статистического наблюдения, оформленные в виде статистических рядов распределения, представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по профессии, по полу, по цвету и т.д.). Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным (распределение по росту, весу, по размеру заработной платы и т.д.). Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, подсчитать число единиц совокупности с этими значениями (частоту), результаты оформить в таблицу.

Вместо частоты варианта возможно применение ее отношения к общему объему наблюдений, которое называется частостью (относительной частотой).

Выделяют два вида вариационного ряда: дискретный и интервальный. Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести число работников на предприятии, тарифный разряд, количество детей в семье и т.д. Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака. Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака возможно построение интервального вариационного ряда. Таблица при построении интервального вариационного ряда также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота). Частота (частота повторения) - число повторений отдельного варианта значений признака. Интервалы могут быть закрытые и открытые. Закрытые интервалы ограничены с обеих сторон, т.е. имеют границу как нижнюю («от»), так и верхнюю («до»). Открытые интервалы имеют какую-либо одну границу: либо верхнюю, либо нижнюю. Если варианты расположены по возрастанию или убыванию, то ряды называются ранжированными.

Для вариационных рядов существует два типа вариантов частотных характеристик: накопленная частота и накопленная частость. Накопленная частота показывает, в скольких наблюдениях величина признака приняла значения меньше заданного. Накопленная частота определяется путем суммирования значений частоты признака по данной группе со всеми частотами предшествующих групп. Накопленная частость характеризует удельный вес единиц наблюдения, у которых значения признака не превосходят верхнюю границу дайной группы. Таким образом, накопленная частость показывает удельный вес вариант в совокупности, имеющих значение не больше данного. Частота, частость, абсолютная и относительная плотности, накопленные частота и частость являются характеристиками величины варианта.

Вариации признака статистических единиц совокупности, а также характер распределения изучаются с помощью показателей и характеристик вариационного ряда, к числу которых относятся средний уровень ряда, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициенты осцилляции, вариации, асимметрии, эксцесса и др.

Для характеристики центра распределения применяются средние величины. Средняя представляет собой обобщающую статистическую характеристику, в которой получает количественное выражение типичный уровень признака, которым обладают члены изучаемой совокупности. Однако возможны случаи совпадения средних арифметических при разном характере распределения, поэтому в качестве статистических характеристик вариационных рядов рассчитываются так называемые структурные средние - мода, медиана, а также квантили, которые делят ряд распределения на равные части (квартили, децили, перцентили и т.д.).

Мода - это значение признака, которое встречается в ряду распределения чаще, чем другие его значения. Для дискретных рядов - это варианта, имеющая наибольшую частоту. В интервальных вариационных рядах с целью определения моды необходимо определить прежде всего интервал, в котором она находится, так называемый модальный интервал. В вариационном ряду с равными интервалами модальный интервал определяется по наибольшей частоте, в рядах с неравными интервалами - но наибольшей плотности распределения. Затем для определения моды в рядах с равными интервалами применяют формулу

где Мо - значение моды; х Мо - нижняя граница модального интервала; h - ширина модального интервала; / Мо - частота модального интервала; / Mo j - частота домодального интер- вала; / Мо+1 - частота послемодального интервала, а для ряда с неравными интервалами в данной формуле расчета вместо частот / Мо, / Мо, / Мо следует использовать плотности распределения Ум 0 _| , Ум 0> УМо+"

Если имеется единственная мода, то распределение вероятностей случайной величины называется унимодальным; если имеется более чем одна мода, оно называется многомодальным (полимодальным, мультимодальным), в случае двух мод - бимодальным. Как правило, многомодальность указывает, что исследуемое распределение не подчиняется закону нормального распределения. Для однородных совокупностей, как правило, характерны одновершинные распределения. Многовершинность свидетельствует также о неоднородности изучаемой совокупности. Появление двух и более вершин делает необходимой перегруппировку данных с целью выделения более однородных групп.

В интервальном вариационном ряду моду можно определить графически с помощью гистограммы. Для этого из верхних точек самого высокого столбца гистограммы до верхних точек двух смежных столбцов проводят две пересекающиеся линии. Затем из точки их пересечения опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее перпендикуляру, является модой. Во многих случаях при характеристике совокупности в качестве обобщенного показателя отдается предпочтение моде, а не средней арифметической.

Медиана - это центральное значение признака, им обладает центральный член ранжированного ряда распределения. В дискретных рядах, чтобы найти значение медианы, сначала определяется ее порядковый номер. Для этого при нечетном числе единиц к сумме всех частот прибавляется единица, число делится на два. При четном числе единиц в ряду будет две медианные единицы, поэтому в этом случае медиана определяется как средняя из значений двух медианных единиц. Таким образом, медианой в дискретном вариационном ряду является значение, которое делит ряд на две части, содержащие одинаковое число вариантов.

В интервальных рядах после определения порядкового номера медианы отыскивается медиальный интервал по накопленным частотам (частостям), а затем при помощи формулы расчета медианы определяется значение самой медианы:

где Me - значение медианы; х Ме - нижняя граница медианного интервала; h - ширина медианного интервала; - сумма частот ряда распределения; /Д - накопленная частота домедианного интервала; / Ме - частота медианного интервала.

Медиану можно отыскать графически с помощью куму- ляты. Для этого на шкале накопленных частот (частостей) кумуляты из точки, соответствующей порядковому номеру медианы, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Далее из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее проведенной ординате (перпендикуляру), является медианой.

Медиана характеризуется следующими свойствами.

  • 1. Она не зависит от тех значений признака, которые расположены по обе стороны от нее.
  • 2. Она имеет свойство минимальности, которое заключается в том, что сумма абсолютных отклонений значений признака от медианы представляет собой минимальную величину по сравнению с отклонением значений признака от любой другой величины.
  • 3. При объединении двух распределений с известными медианами невозможно заранее предсказать величину медианы нового распределения.

Эти свойства медианы широко используются при проектировании расположения пунктов массового обслуживания - школ, поликлиник, автозаправочных станций, водозаборных колонок и т.д. Например, если в определенном квартале города предполагается построить поликлинику, то расположить ее целесообразнее в такой точке квартала, которая делит пополам не длину квартала, а число жителей.

Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить симметричность распределения. Если х Me то имеет место правосторонняя асимметрия ряда. При нормальном распределении х - Me - Мо.

К. Пирсон на основе выравнивания различных типов кривых определил, что для умеренно асимметричных распределений справедливы такие приближенные соотношения между средней арифметической, медианой и модой:

где Me - значение медианы; Мо - значение моды; х арифм - значение средней арифметической.

Если возникает необходимость изучить структуру вариационного ряда более подробно, то вычисляют значения признака, аналогичные медиане. Такие значения признака делят все единицы распределения на равные численности, их называют квантилями или градиентами. Квантили подразделяются на квартили, децили, перцентили и т.п.

Квартили делят совокупность на четыре равные части. Первую квартиль вычисляют аналогично медиане по формуле расчета первой квартили, предварительно определив первый квартальный интервал:

где Qi - значение первой квартили; x Q ^ - нижняя граница первого квартильного интервала; h - ширина первого квартального интервала; /, - частоты интервального ряда;

Накопленная частота в интервале, предшествующем первому квартильиому интервалу; Jq { - частота первого квартильного интервала.

Первая квартиль показывает, что 25% единиц совокупности меньше ее значения, а 75% - больше. Вторая квартиль равна медиане, т.е. Q 2 = Me.

По аналогии рассчитывают третью квартиль, предварительно отыскав третий квартальный интервал:

где - нижняя граница третьего квартильного интервала; h - ширина третьего квартильного интервала; /, - частоты интервального ряда; /X" - накопленная частота в интервале, предшествующем

г

третьему квартильиому интервалу; Jq - частота третьего квартильного интервала.

Третья квартиль показывает, что 75% единиц совокупности меньше ее значения, а 25% - больше.

Разность между третьей и первой квартилями представляет собой межквартильный интервал:

где Aq - значение межквартильного интервала; Q 3 - значение третьей квартили; Q, - значение первой квартили.

Децили делят совокупность на 10 равных частей. Дециль - это такое значение признака в ряду распределения, которому соответствуют десятые доли численности совокупности. По аналогии с квартилями первый дециль показывает, что 10% единиц совокупности меньше его значения, а 90% - больше, а девятый дециль выявляет, что 90% единиц совокупности меньше его значения, а 10% - больше. Соотношение девятого и первого децилей, т.е. децильный коэффициент, широко применяется при изучении дифференциации доходов для измерения соотношения уровней доходов 10% наиболее обеспеченного и 10% наименее обеспеченного населения. Перцентили делят ранжированную совокупность на 100 равных частей. Расчет, значение и применение перцентилей аналогичны децилям.

Квартили, децили и другие структурные характеристики можно определить графически по аналогии с медианой с помощью кумуляты.

Для измерения размера вариации используются следующие показатели: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Величина размаха вариации целиком зависит от случайности распределения крайних членов ряда. Этот показатель представляет интерес в тех случаях, когда важно знать, какова амплитуда колебаний значений признака:

где R - значение размаха вариации; х тах - максимальное значение признака; х тт - минимальное значение признака.

При расчете размаха вариации значение подавляющего большинства членов ряда не учитывается, в то время как вариация связана с каждым значением члена ряда. Этого недостатка лишены показатели, представляющие собой средние, полученные из отклонений индивидуальных значений признака от их средней величины: среднее линейное отклонение и среднее квадратическое отклонение. Между индивидуальными отклонениями от средней и колеблемостью конкретного признака существует прямая зависимость. Чем сильнее колеблемость, тем больше абсолютные размеры отклонений от средней.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных величин отклонений отдельных вариантов от их средней величины.

Среднее линейное отклонение для несгруппированных данных

где / пр - значение среднего линейного отклонения; х,- - значение признака; х - п - число единиц совокупности.

Среднее линейное отклонение сгруппированного ряда

где / вз - значение среднего линейного отклонения; х, - значение признака; х - среднее значение признака для изучаемой совокупности; / - число единиц совокупности в отдельной группе.

Знаки отклонений в данном случае игнорируются, в противном случае сумма всех отклонений будет равна нулю. Среднее линейное отклонение в зависимости от группировки анализируемых данных рассчитывается по различным формулам: для сгруппированных и несгруниированных данных. Среднее линейное отклонение в силу его условности отдельно от других показателей вариации применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе оборота внешней торговли, состава работающих, ритмичности производства, качества продукции с учетом технологических особенностей производства и т.п.).

Среднее квадратическое отклонение характеризует, на сколько в среднем отклоняются индивидуальные значения изучаемого признака от среднего значения по совокупности, и выражается в единицах измерения изучаемого признака. Среднее квадратическое отклонение, являясь одной из основных мер вариации, широко используется при оценке границ вариации признака в однородной совокупности, при определении значений ординат кривой нормального распределения, а также в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик. Среднее квадратическое отклонение но несгруипированным данным исчисляется по следующему алгоритму: каждое отклонение от средней возводится в квадрат, все квадраты суммируются, после чего сумма квадратов делится на число членов ряда и из частного извлекается квадратный корень:

где a Iip - значение среднего квадратического отклонения; Xj - значение признака; х - среднее значение признака для изучаемой совокупности; п - число единиц совокупности.

Для сгруппированных анализируемых данных среднее квадратическое отклонение данных рассчитывается по взвешенной формуле

где - значение среднего квадратического отклонения; Xj - значение признака; х - среднее значение признака для изучаемой совокупности; f x - число единиц совокупности в отдельной группе.

Выражение под корнем в обоих случаях носит название дисперсии. Таким образом, дисперсия вычисляется как средний квадрат отклонений значений признака от их средней величины. Для невзвешенных (простых) значений признака дисперсия определяется следующим образом:

Для взвешенных значений признака

Существует также специальный упрощенный способ расчета дисперсии: в общем виде

для невзвешенных (простых) значений признака для взвешенных значений признака
с использованием метода отсчета от условного нуля

где а 2 - значение дисперсии; х,- - значение признака; х - среднее значение признака, h - величина группового интервала, т 1 - веса (А =

Дисперсия имеет самостоятельное выражение в статистике и относится к числу важнейших показателей вариации. Она измеряется в единицах, соответствующих квадрату единиц измерения изучаемого признака.

Дисперсия имеет следующие свойства.

  • 1. Дисперсия постоянной величины равна нулю.
  • 2. Уменьшение всех значений признака на одну и ту же величину Л не меняет величины дисперсии. Это означает, что средний квадрат отклонений можно вычислить не по заданным значениям признака, а по отклонениям их от какого-то постоянного числа.
  • 3. Уменьшение веех значений признака в k раз уменьшает дисперсию в k 2 раз, а среднее квадратическое отклонение - в k раз, т.е. все значения признака можно разделить на какое-то постоянное число (скажем, на величину интервала ряда), исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число.
  • 4. Если исчислить средний квадрат отклонений от любой величины А у в той или иной степени отличающейся от средней арифметической, то он всегда будет больше среднего квадрата отклонений, исчисленного от средней арифметической. Средний квадрат отклонений при этом будет больше на вполне определенную величину - на квадрат разности средней и этой условно взятой величины.

Вариация альтернативного признака заключается в наличии или отсутствии изучаемого свойства у единиц совокупности. Количественно вариация альтернативного признака выражается двумя значениями: наличие у единицы изучаемого свойства обозначается единицей (1), а его отсутствие - нулем (0). Долю единиц, обладающих изучаемым свойством, обозначают через Р, а долю единиц, не обладающих этим свойством, - через G. Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным свойством (Р), на долю единиц, данным свойством не обладающих (G). Наибольшая вариация совокупности достигается в случаях, когда часть совокупности, составляющая 50% от всего объема совокупности, обладает признаком, а другая часть совокупности, также равная 50%, не обладает данным признаком, при этом дисперсия достигает максимального значения, равного 0,25, т.е. Р = 0,5, G = 1 - Р = 1 - 0,5 = 0,5 и о 2 = 0,5 0,5 = 0,25. Нижняя граница этого показателя равна нулю, что соответствует ситуации, при которой в совокупности отсутствует вариация. Практическое применение дисперсии альтернативного признака состоит в построении доверительных интервалов при проведении выборочного наблюдения.

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичной будет средняя величина. В практике статистики часто возникает необходимость сравнения вариаций различных признаков. Например, интересным является сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для таких сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях. Для осуществления таких сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с разными средними арифметическими используются показатели вариации - коэффициент осцилляции, линейный коэффициент вариации и коэффициент вариации, которые показывают меру колебаний крайних значений вокруг средней.

Коэффициент осцилляции :

где V R - значение коэффициента осцилляции; R - значение размаха вариации; х -

Линейный коэффициент вариации".

где Vj - значение линейного коэффициента вариации; I - значение среднего линейного отклонения; х - среднее значение признака для изучаемой совокупности.

Коэффициент вариации :

где V a - значение коэффициента вариации; а - значение среднего квадратического отклонения; х - среднее значение признака для изучаемой совокупности.

Коэффициент осцилляции - это процентное отношение размаха вариации к среднему значению изучаемого признака, а линейный коэффициент вариации - это отношение среднего линейного отклонения к среднему значению изучаемого признака, выраженное в процентах. Коэффициент вариации представляет собой процентное отношение среднего квадратического отклонения к среднему значению изучаемого признака. Как величина относительная, выраженная в процентах, коэффициент вариации применяется для сравнения степени вариации различных признаков. С помощью коэффициента вариации оценивается однородность статистической совокупности. Если коэффициент вариации меньше 33%, то исследуемая совокупность является однородной, а вариация слабой. Если коэффициент вариации больше 33%, то исследуемая совокупность является неоднородной, вариация сильной, а средняя величина - нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности. Кроме того, коэффициенты вариации используются для сравнения колеблемости одного признака в различных совокупностях. Например, для оценки вариации стажа работы работников на двух предприятиях. Чем больше значение коэффициента, тем вариация признака существеннее.

На основе рассчитанных квартилей имеется возможность рассчитать также относительный показатель квартальной вариации по формуле

где Q2 и

Межквартильный размах определяется по формуле

Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:

Для неравноинтервальпых вариационных рядов рассчитывается также плотность распределения. Она определяется как частное от деления соответствующей частоты или частости на величину интервала. В неравноинтервальных рядах используются абсолютная и относительная плотности распределения. Абсолютная плотность распределения - это частота, приходящаяся на единицу длины интервала. Относительная плотность распределения - частость, приходящаяся на единицу длины интервала.

Все вышеотмеченное справедливо для рядов распределения, закон распределения которых хорошо описывается нормальным законом распределения или близок к нему.

Понятие вариационного ряда. Первым шагом систематизации материалов статистического наблюдения является подсчет числа единиц, обладающих тем или иным признаком. Расположив единицы в порядке возрастания или убывания их количественного признака и подсчитав число единиц с конкретным значением признака, получаем вариационный ряд. Вариационный ряд характеризует распределение единиц определенной статистической совокупности по какому–либо количественному признаку.

Вариационный ряд представляет собой две колонки, в левой колонке приводятся значения варьирующего признака, именуемые вариантами и обозначаемые (x), а в правой – абсолютные числа, показывающие, сколько раз встречается каждый вариант. Показатели этой колонки называются частотами и обозначаются (f).

Схематично вариационный ряд можно представить в виде табл.5.1:

Таблица 5.1

Вид вариационного ряда

Варианты (x)

Частоты (f)

В правой колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуют частостями и условно обозначают через , т.е. . Сумма всех частостей равна единице. Частости могут быть выражены и в процентах, и тогда их сумма будет равна 100%.

Варьирующие признаки могут носить разный характер. Варианты одних признаков выражаются в целых числах, например, число комнат в квартире, число изданных книг и т.д. Эти признаки именуют прерывными, или дискретными. Варианты других признаков могут принимать любые значения в определенных пределах, как, например, выполнение плановых заданий, заработная плата и др. Эти признаки называют непрерывными.

Дискретный вариационный ряд. Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд называют дискретным, его внешний вид представлен в табл. 5.2:

Таблица 5.2

Распределение студентов по оценкам, полученным на экзамене

Оценки (х)

Количество студентов (f)

В % к итогу ()

Характер распределения в дискретных рядах изображается графически в виде полигона распределения, рис.5.1.

Рис. 5.1. Распределение студентов по оценкам, полученным на экзамене.

Интервальный вариационный ряд. Для непрерывных признаков вариационные ряды строятся интервальные, т.е. значения признака в них выражаются в виде интервалов «от и до». При этом минимальное значение признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей интервала.

Интервальные вариационные ряды строят как для прерывных признаков (дискретных), так и для варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами. В экономической практике в большинстве своем применяются неравные интервалы, прогрессивно возрастающие или убывающие. Такая необходимость возникает особенно в тех случаях, когда колеблемость признака осуществляется неравномерно и в больших пределах.

Рассмотрим вид интервального ряда с равными интервалами, табл. 5.3:

Таблица 5.3

Распределение рабочих по выработке

Выработка, т.р. (х)

Число рабочих (f)

Кумулятивная частота (f´)

Интервальный ряд распределения графически изображается в виде гистограммы, рис.5.2.

Рис.5.2. Распределение рабочих по выработке

Накопленная (кумулятивная) частота. В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат – нарастающие итоги частот (кумулята), рис.5.3.

Рис. 5.3. Кумулята распределения рабочих по выработке

Если шкалы частот и вариантов поменять местами, т.е. на оси абсцисс отражать накопленные частоты, а на оси ординат – значения вариантов, то кривая, характеризующая изменение частот от группы к группе, будет носит название огивы распределения, рис.5.4.

Рис. 5.4. Огива распределения рабочих по выработке

Вариационные ряды с равными интервалами обеспечивают одно из важнейших требований, предъявляемых к статистическим рядам распределения, обеспечение сравнимости их во времени и пространстве.

Плотность распределения. Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения, т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Составление вариационного ряда и его графическое изображение является первым шагом обработки исходных данных и первой ступенью анализа изучаемой совокупности. Следующим шагом в анализе вариационных рядов является определение основных обобщающих показателей, именуемых характеристиками ряда. Эти характеристики должны дать представление о среднем значении признака у единиц совокупности.

Средняя величина . Средняя величина представляет собой обобщенную характеристику изучаемого признака в исследуемой совокупности, отражающая ее типический уровень в расчете на единицу совокупности в конкретных условиях места и времени.

Средняя величина всегда именованная, имеет ту же размерность, что и признак у отдельных единиц совокупности.

Перед вычислением средних величин необходимо произвести группировку единиц исследуемой совокупности, выделив качественно однородные группы.

Средняя, рассчитанная по совокупности в целом называется общей средней, а для каждой группы – групповыми средними.

Существуют две разновидности средних величин: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая); структурные (мода, медиана, квартили, децили).

Выбор средней для расчета зависит от цели.

Виды степенных средних и методы их расчета. В практике статистической обработки собранного материала возникают различные задачи, для решения которых требуются различные средние.

Математическая статистика выводит различные средние из формул степенной средней:

где средняя величина; x – отдельные варианты (значения признаков); z – показатель степени (при z = 1 – средняя арифметическая, z = 0 средняя геометрическая, z = - 1 – средняя гармоническая, z = 2 – средняя квадратическая).

Однако вопрос о том, какой вид средней необходимо применить в каждом отдельном случае, разрешается путем конкретного анализа изучаемой совокупности.

Наиболее часто встречающимся в статистике видом средних величин является средняя арифметическая . Она исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.

В зависимости от характера исходных данных средняя арифметическая определяется различными способами:

Если данные несгруппированные, то расчет ведется по формуле простой средней величины

Расчет средней арифметической в дискретном ряду происходит по формуле 3.4.

Расчет средней арифметической в интервальном ряду. В интервальном вариационном ряду, где за величину признака в каждой группе условно принимается середина интервала, средняя арифметическая может отличаться от средней, рассчитанной по несгруппированным данным. Причем, чем больше величина интервала в группах, тем больше возможные отклонения средней, вычисленной по сгруппированным данным, от средней, рассчитанной по несгруппированным данным.

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам. А затем рассчитывают среднюю величину по формуле средней арифметической взвешенной.

Свойства средней арифметической. Средняя арифметическая обладает некоторыми свойствами, которые позволяют упрощать вычисления, рассмотрим их.

1. Средняя арифметическая из постоянных чисел равна этому постоянному числу.

Если х = а. Тогда .

2. Если веса всех вариантов пропорционально изменить, т.е. увеличить или уменьшить в одно и то же число раз, то средняя арифметическая нового ряда от этого не изменится.

Если все веса f уменьшить в k раз, то .

3. Сумма положительных и отрицательных отклонений отдельных вариантов от средней, умноженных на веса, равна нулю, т.е.

Если , то . Отсюда .

Если все варианты уменьшить или увеличить на какое- либо число, то средняя арифметическая нового ряда уменьшится или увеличится на столько же.

Уменьшим все варианты x на a , т.е. x ´ = x a.

Тогда

Среднюю арифметическую первоначального ряда можно получить, прибавляя к уменьшенной средней ранее вычтенное из вариантов числа a , т.е. .

5. Если все варианты уменьшить или увеличить в k раз, то средняя арифметическая нового ряда уменьшится или увеличится во столько же, т.е. в k раз.

Пусть , тогда .

Отсюда , т.е. для получения средней первоначального ряда среднюю арифметическую нового ряда (с уменьшенными вариантами) надо увеличить в k раз.

Средняя гармоническая. Средняя гармоническая это величина обратная средней арифметической. Ее используют, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение (М= xf). Средняя гармоническая будет рассчитываться по формуле 3.5

Практическое применение средней гармонической – для расчета некоторых индексов, в частности, индекса цен.

Средняя геометрическая. При применении средней геометрической индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста.

Средняя геометрическая величина используется также для определения равноудаленной величины от максимального и минимального значений признака. Например, страховая компания заключает договоры на оказание услуг автострахования. В зависимости конкретного страхового случая страховая выплата может колебаться от 10000 до 100000 долл. в год. Средняя сумма выплат по страховке составит долл.

Средняя геометрическая это величина, используемая как средняя из отношений или в рядах распределения, представленных в виде геометрической прогрессии, когда z = 0. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел.

Формулы для расчета следующие

где – варианты осредняемого признака; – произведение вариантов; f – частота вариантов.

Средняя геометрическая используется в расчетах среднегодовых темпов роста.

Средняя квадратическая. Формула средней квадратической используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения. Так, при расчете показателей вариации среднюю вычисляют из квадратов отклонений индивидуальных значений признака от средней арифметической величины.

Средняя квадратическая величина рассчитывается по формуле

В экономических исследованиях средняя квадратическая в измененном виде широко используется при расчете показателей вариации признака, таких как дисперсия, среднее квадратическое отклонение.

Правило мажорантности. Между степенными средними существует следующая зависимость – чем больше показатель степени, тем больше значение средней, табл.5.4:

Таблица 5.4

Соотношение между средними величинами

Значение z

Соотношение между средними

Это соотношение называется правилом мажорантности.

Структурные средние величины. Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода, медиана, квартили и децили.

Мода. Модой (Мо) называется наиболее часто встречающееся значение признака у единиц совокупности. Модой называется то значение признака, которое соответствует максимальной точке теоретической кривой распределения.

Мода широко используется в коммерческой практике при изучении покупательского спроса (при определении размеров одежды и обуви, которые пользуются широким спросом), регистрации цен. Мод в совокупности может быть несколько.

Расчет моды в дискретном ряду. В дискретном ряду мода – это варианта с наибольшей частотой. Рассмотрим нахождение моды в дискретном ряду.

Расчет моды в интервальном ряду. В интервальном вариационном ряду модой приближенно считают центральный вариант модального интервала, т.е. того интервала, который имеет наибольшую частоту (частость). В пределах интервала надо найти то значение признака, которое является модой. Для интервального ряда мода будет определяться формулой

где – нижняя граница модального интервала; – величина модального интервала; – частота, соответствующая модальному интервалу; – частота, предшествующая модальному интервалу; – частота интервала, следующего за модальным.

Медиана. Медианой () называется значение признака у средней единицы ранжированного ряда. Ранжированный ряд – это ряд, у которого значения признака записаны в порядке возрастания или убывания. Или медиана это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значение варьирующего признака меньшие, чем средний вариант, а другая – большие.

Чтобы найти медиану, сначала определяется ее порядковый номер. Для этого при нечетном числе единиц к сумме всех частот прибавляется единица и все делится на два. При четном числе единиц медиана отыскивается как значение признака у единицы, порядковый номер который определяется по общей сумме частот, деленной на два. Зная порядковый номер медианы, легко по накопленным частотам найти ее значение.

Расчет медианы в дискретном ряду. По данным выборочного обследования получены данные о распределении семей по числу детей, табл. 5.5. Для определения медианы сначала определим ее порядковый номер

В этих семьях количество детей равно 2, следовательно, = 2. Таким образом, в 50% семей число детей не превышает 2.

–частота накопленная, предшествующая медианному интервалу;

С одной стороны, это весьма положительное свойство т.к. в этом случае учитывается действие всех причин, воздействующих на все единицы изучаемой совокупности. С другой стороны, даже одно наблюдение, попавшее в исходные данные случайно, может существенным образом исказить представление об уровне развития изучаемого признака в рассматриваемой совокупности (особенно в коротких рядах).

Квартили и децили. По аналогии с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Так, в частности, можно найти значение признака у единиц, делящих ряд на 4 равные части, на 10 и т.п.

Квартили. Варианты, которые делят ранжированный ряд на четыре равные части, называют квартилями.

При этом различают: нижний (или первый) квартиль (Q1) – значение признака у единицы ранжированного ряда, делящей совокупность в соотношении ¼ к ¾ и верхний (или третий) квартиль(Q3) – значение признака у единицы ранжированного ряда, делящий совокупность в соотношении ¾ к ¼.

– частоты квартильных интервалов (нижнего и верхнего)

Интервалы, в которых содержатся Q1 и Q3 определяют по накопленным частотам (или частостям).

Децили. Кроме квартилей рассчитывают децили – варианты, делящие ранжированный ряд на 10 равных частей.

Обозначаются они через D, первый дециль D1 делит ряд в соотношении 1/10 и 9/10, второй D2 – 2/10 и 8/10 и т.д. Вычисляются они по той же схеме, что и медиана и квартили.

И медиана, и квартили, и децили принадлежат к так называемым порядковым статистикам, под которым понимают вариант, занимающий определенное порядковое место в ранжированном ряду.

Вариационный ряд - это статистический ряд, показывающий распределение изучаемого явления по величине какого-либо количественного признака. Например, больных по возрасту, по срокам лечения, новорожденных по весу и т.п.

Варианта - отдельные значения признака, по которому проводится группировка (обозначается V ) .

Частота- число, показывающее, как часто встречается та или иная варианта (обозначается P ) . Сумма всех частот показывает общее число наблюдений и обозначается n . Разность между наибольшей и наименьшей вариантой вариационного ряда называется размахом или амплитудой .

Различают вариационные ряды:

1. Прерывные (дискретные) и непрерывные.

Ряд считается непрерывным, если группировочный признак может выражаться дробными величинами (вес, рост т.п.), прерывным, если группировочный признак выражается только целым числом (дни нетрудоспособности, число ударов пульса и т.п.).

2.Простые и взвешенные.

Простой вариационный ряд представляет собой ряд, в котором количественное значение варьирующего признака встречается один раз. Во взвешенном вариационном ряду количественные значения варьирующего признака повторяются с определённой частотой.

3. Сгруппированные (интервальные) и несгруппированые.

Сгруппированный ряд имеет варианты, объединённые в группы, объединяющие их по величине в пределах определённого интервала. В несгруппированном ряду каждой отдельной варианте соответствует определённая частота.

4. Четные и нечетные.

В чётных вариационных рядах сумма частот или общее число наблюдений выражено чётным числом, в нечётных ― нечётным.

5. Симметричные и асимметричные.

В симметричном вариационном ряду все виды средних величин совпадают или очень близки (мода, медиана, среднее арифметическое).

В зависимости от характера изучаемых явлений, от конкретных задач и целей статистического исследования, а также от содержания исходного материала, в санитарной статистике применяются следующие виды средних величин:

структурные средние (мода, медиана);

средняя арифметическая;

средняя гармоническая;

средняя геометрическая;

средняя прогрессивная.

Мода (М о ) - величина варьирующего признака, которая более часто встречается в изучаемой совокупности т.е. варианта, соответствующая наибольшей частоте. Находят ее непосредственно по структуре вариационного ряда, не прибегая к каким-либо вычислениям. Она обычно является величиной очень близкой к средней арифметической и весьма удобна в практической деятельности.

Медиана (М е ) - делящая вариационный ряд (ранжированный, т.е. значения вариант располагаются в порядке возрастания или убывания) на две равные половины. Медиана вычисляется при помощи так называемого нечетного ряда, который получают путем последовательного суммирования частот. Если сумма частот соответствует четному числу, тогда за медиану условно принимают среднюю арифметическую из двух средних значений.

Мода и медиана применяются в случае незамкнутой совокупности, т.е. когда наибольшая или наименьшая варианты не имеют точной количественной характеристики (например, до 15 лет, 50 и старше и т.п.). В этом случае среднюю арифметическую (параметрические характеристики) рассчитать нельзя.

Средня я арифметическая - самая распространенная величина. Средняя арифметическая обозначается чаще через М .

Различают среднюю арифметическую простую и взвешенную.

Средняя арифметическая простая вычисляется:

― в тех случаях, когда совокупность представлена простым перечнем знаний признака у каждой единицы;

― если число повторений каждой варианты нет возможности определить;

― если числа повторений каждой варианты близки между собой.

Средняя арифметическая простая исчисляется по формуле:

где V - индивидуальные значения признака; n - число индивидуальных значений;
- знак суммирования.

Таким образом, простая средняя представляет собой отношение суммы вариант к числу наблюдений.

Пример: определить среднюю длительность пребывания на койке 10 больных пневмонией:

16 дней - 1 больной; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

койко-дня.

Средняя арифметическая взвешенная исчисляется в тех случаях, когда индивидуальные значения признака повторяются. Ее можно вычислять двояким способом:

1. Непосредственным (среднеарифметическим или прямым способом) по формуле:

,

где P - частота (число случаев) наблюдений каждой варианты.

Таким образом, средняя арифметическая взвешенная представляет собой отношение суммы произведений вариант на частоты к числу наблюдений.

2. С помощью вычисления отклонений от условной средней (по способу моментов).

Основой для вычисления взвешенной средней арифметической является:

― сгруппированный материал по вариантам количественного признака;

― все варианты должны располагаться в порядке возрастания или убывания величины признака (ранжированный ряд).

Для вычисления по способу моментов обязательным условием является одинаковый размер всех интервалов.

По способу моментов средняя арифметическая вычисляется по формуле:

,

где М о - условная средняя, за которую чаще принимают величину признака, соответствующую наибольшей частоте, т.е. которая чаще повторяется (Мода).

i - величина интервала.

a - условное отклонение от условий средней, представляющее собой последовательный ряд чисел (1, 2 и т.д.) со знаком + для вариант больших условной средней и со знаком–(–1, –2 и т.д.) для вариант, которые ниже условной средней. Условное же отклонение от варианты, принятой за условную среднюю равно 0.

P - частоты.

- общее число наблюдений или n.

Пример: определить средний рост мальчиков 8 лет непосредственным способом (таблица1).

Т а б л и ц а 1

Рост в см

мальчиков P

Центральная

варианта V

Центральная варианта ― середина интервала ― определяется как полу сумма начальных значений двух соседних групп:

;
и т.д.

Произведение VP получают путем умножения центральных вариант на частоты
;
и т.д. Затем полученные произведения складывают и получают
, которую делят на число наблюдений (100) и получают среднюю арифметическую взвешенную.

см.

Эту же задачу решим по способу моментов, для чего составляется следующая таблица 2:

Т а б л и ц а 2

Рост в см (V)

мальчиков P

n=100

В качестве М о принимаем 122, т.к. из 100 наблюдений у 33 человек рост был 122см. Находим условные отклонения (a) от условной средней в соответствии с вышесказанным. Затем получаем произведение условных отклонений на частоты (aP) и суммируем полученные величины (
). В итоге получится 17. Наконец, данные подставляем в формулу:

При изучении варьирующего признака нельзя ограничиваться только вычислением средних величин. Необходимо вычислять и показатели, характеризующие степень разнообразия изучаемых признаков. Величина того или иного количественного признака неодинакова у всех единиц статистической совокупности.

Характеристикой вариационного ряда является среднее квадратичное отклонение (), которое показывает разброс (рассеивание) изучаемых признаков относительно средней арифметической, т.е. характеризует колеблемость вариационного ряда. Оно может определяться непосредственным способом по формуле:

Среднее квадратичное отклонение равняется квадратному корню из суммы произведений квадратов отклонений каждой варианты от средней арифметической (V–M) 2 на свои частоты деленной на сумму частот (
).

Пример вычисления: определить среднее число больничных листов, выдаваемых в поликлинике за день (таблица 3).

Т а б л и ц а 3

Число больничных

листов, выданных

врачом за день (V)

Число врачей (Р)

;

В знаменателе при числе наблюдений менее 30 необходимо от
отнимать единицу.

Если ряд сгруппирован с равными интервалами, тогда можно определить среднее квадратичное отклонение по способу моментов:

,

где i - величина интервала;

- условное отклонение от условной средней;

P - частоты вариант соответствующих интервалов;

- общее число наблюдений.

Пример вычисления : Определить среднюю длительность пребывания больных на терапевтической койке (по способу моментов) (таблица 4):

Т а б л и ц а 4

Число дней

пребывания на койке (V)

больных (Р)

;

Бельгийский статистик А. Кетле обнаружил, что вариации массовых явлений подчиняются закону распределения ошибок, открытому почти одновременно К. Гауссом и П. Лапласом. Кривая, отображающая это распределение, имеет вид колокола. По нормальному закону распределения колеблемость индивидуальных значений признака находится в пределах
, что охватывает 99,73% всех единиц совокупности.

Подсчитано, что если к средней арифметической прибавить и отнять 2, то в пределах полученных величин находится 95,45% всех членов вариационного ряда и, наконец, если к средней арифметической прибавить и отнять 1, то в пределах полученных величин будут находиться 68,27% всех членов данного вариационного ряда. В медицине с величиной
1связано понятие нормы. Отклонение от средней арифметической больше, чем на 1, но меньше, чем на 2является субнормальным, а отклонение больше, чем на 2ненормальным (выше или ниже нормы).

В санитарной статистике правило трех сигм применяется при изучении физического развития, оценке деятельности учреждений здравоохранения, оценке здоровья населения. Это же правило широко применяется в народном хозяйстве при определении стандартов.

Таким образом, среднее квадратичное отклонение служит для:

― измерения дисперсии вариационного ряда;

― характеристики степени разнообразия признаков, которые определяются коэффициентом вариации:

Если коэффициент вариации более 20% - сильное разнообразие, от 20 до 10% - среднее, менее 10% - слабое разнообразие признаков. Коэффициент вариации в известной мере является критерием надежности средней арифметической.

Вариация определяет различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период (момент времени). Причиной вариации бывают разные условия существования разных единиц совокупности. Например, даже близнецы в процессе жизни приобретают различия в росте, весе, а также в таких признаках, как уровень образования, доход, количество детей и т.д.

Вариация возникает в результате того, что сами значения признака складываются под суммарным влиянием разнообразных условий, которые разным образом сочетаются в каждом отдельном случае. Таким образом, величина любого варианта объективна.

Вариация характерна всем без исключения явлениям природы и общества, кроме законодательно закрепленных нормативных значений отдельных социальных признаков. Исследования вариации в статистике имеют огромное значение, помогают познать сущность изучаемого явления. Нахождение вариации, выяснение ее причин, выявление влияния отдельных факторов дают важную информацию для внедрения научно обоснованных управленческих решений.

Средняя величина дает обобщенную характеристику признака совокупности, но она не раскрывает её строения. Среднее значение не показывает, как располагаются вокруг нее варианты осредненного признака, распределены ли они вблизи средней или отклоняются от нее. Средняя в двух совокупностях может быть одинаковой, но в одном варианте все индивидуальные значения отличаются от нее незначительно, а в другом - эти отличия велики, т.е. в первом случае вариация признака мала, а во втором - велика, это имеет очень важное значение для характеристики значимости средней величины.

Для того, чтобы руководитель организации, управляющий, научный работник могли изучать вариацию и управлять ей, статистикой разработаны специальные методы исследования вариации (система показателей). С их помощью вариация находится, характеризуются ее свойства. К показателям вариации относятся : размах вариации, среднее линейное отклонение, коэффициент вариации.

Вариационный ряд и его формы

Вариационный ряд - это упорядоченное распределение единиц совокупности чаще по возрастающим (реже убывающим) значениям признака и подсчет числа единиц с тем или иным значением признака. Когда численность единиц совокупности большая, ранжированный ряд становится громоздким, его построение занимает длительное время. В такой ситуации вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака.

Существуют следующие формы вариационного ряда :

  1. Ранжированный ряд представляет собой, перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака.
  2. Дискретный вариационный ряд - это таблица, состоящая из двух строк или граф: конкретных значений варьирующего признака х и числа единиц совокупности с данным значение f - признака частот. Он строится тогда, когда признак принимает наибольшее число значений.
  3. Интервальный ряд .

Размах вариации определяется как абсолютная величина разности между максимальными и минимальными значениями (вариантами) признака:

Размах вариации показывает только крайние отклонения признака и не отражает отдельных отклонений всех вариантов в ряду. Он характеризует пределы изменения варьирующего признака и зависим от колебаний двух крайних вариантов и абсолютно не связан с частотами в вариационном ряду, т. е. с характером распределения, что придает этой величине, случайный характер. Для анализа вариации нужен показатель, который отражает все колебания вариационного признака и даёт общую характеристику. Простейший показатель такого вида — среднее линейное отклонение.

Вариационные ряды: определение, виды, основные характеристики. Методика расчета
моды, медианы, средней арифметической в медико-статистических исследованиях
(показать на условном примере).

Вариационный ряд – это ряд числовых значений изучаемого признака, отличающихся друг от друга по своей величине и расположенных в определенной последовательности(в восходящем или убывающем порядке). Каждое числовое значение ряда называют вариантой (V), а числа, показывающие, как часто встречается та или иная варианта в составе данного ряда, называется частотой (р).

Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n. Различие в значении изучаемых признаков называется вариацией. В случае если варьирующий признак не имеет количественной меры, вариацию называют качественной, а ряд распределения – атрибутивным (например, распределение по исходу заболевания, по состоянию здоровья и т.д.).

Если варьирующий признак имеет количественное выражение, такую вариацию называют количественной, а ряд распределения – вариационным.

Вариационные ряды делятся на прерывные и непрерывные – по характеру количественного признака, простые и взвешенные – по частоте встречаемости вариант.

В простом вариационном ряду каждая варианта встречается только один раз (р=1), во взвешенном – одна и та же варианта встречается несколько раз (р>1). Примеры таких рядов будут рассмотрены далее по тексту. Если количественный признак носит непрерывный характер, т.е. между целыми величинами имеются промежуточные дробные величины, вариационный ряд называется непрерывным.

Например: 10,0 – 11,9

14,0 – 15,9 и т.д.

Если количественный признак носит прерывный характер, т.е. отдельные его значения (варианты) отличаются друг от друга на целое число и не имеют промежуточных дробных значений, вариационный ряд называют прерывным или дискретным.

Используя данные предыдущего примера о частоте пульса

у 21 студентов, построим вариационный ряд (табл. 1).

Таблица 1

Распределение студентов-медиков по частоте пульса (уд/мин)

Таким образом, построить вариационный ряд – означает имеющиеся числовые значения (варианты) систематизировать, упорядочить, т.е. расположить в определенной последовательности (в восходящем или убывающем порядке) с соответствующими им частотами. В рассматриваемом примере варианты расположены в восходящем порядке и выражены в виде целых прерывных (дискретных) чисел, каждая варианта встречается несколько раз, т.е. мы имеем дело со взвешенным, прерывным или дискретным вариационным рядом.

Как правило, если число наблюдений в изучаемой нами статистической совокупности не превышает 30, то достаточно все значения изучаемого признака расположить в вариационном ряду в нарастающем, как в табл. 1, или убывающем порядке.

При большом количестве наблюдений (n>30) число встречающихся вариант может быть очень большим, в этом случае составляется интервальный или сгруппированный вариационный ряд, в котором для упрощения последующей обработки и выяснения характера распределения варианты объединены в группы.

Обычно число групповых вариант колеблется от 8 до 15.

Их должно быть не меньше 5, т.к. иначе это будет слишком грубое, чрезмерное укрупнение, что искажает общую картину варьирования и сильно сказывается на точности средних величин. При числе групповых вариант более 20-25 увеличивается точность вычисления средних величин, но существенно искажаются особенности варьирования признака и усложняется математическая обработка.

При составлении сгруппированного ряда необходимо учесть,

− группы вариант должны располагаться в определенном порядке (в восходящем или нисходящем);

− интервалы в группах вариант должны быть одинаковыми;

− значения границ интервалов не должны совпадать, т.к. неясно будет, в какие группы относить отдельные варианты;

− необходимо учитывать качественные особенности собираемого материала при установлении пределов интервалов (например, при изучении веса взрослых людей интервал 3-4 кг допустим, а для детей первых месяцев жизни он не должен превышать 100 г.)

Построим сгруппированный (интервальный) ряд, характеризующий данные о частоте пульса (число ударов в минуту) у 55 студентов-медиков перед экзаменом: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Для построения сгруппированного ряда необходимо:

1. Определить величину интервала;

2. Определить середину, начало и конец групп вариант вариационного ряда.

● Величина интервала (i) определяется по числу предполагаемых групп (r), количество которых устанавливается в зависимости от числа наблюдений (n) по специальной таблице

Число групп в зависимости от числа наблюдений:

В нашем случае, для 55 студентов, можно составить от 8 до 10 групп.

Величина интервала (i) определяется по следующей формуле –

i = V max-V min/r

В нашем примере величина интервала равна 82- 58/8= 3.

Если величина интервала представляет собой дробное число, полученный результат следует округлить до целого числа.

Различают несколько видов средних величин:

● средняя арифметическая,

● средняя геометрическая,

● средняя гармоническая,

● средняя квадратическая,

● средняя прогрессивная,

● медиана

В медицинской статистике наиболее часто пользуются средними арифметическими величинами.

Средняя арифметическая величина (М) является обобщающей величиной, которая определяет то типичное, что характерно для всей совокупности. Основными способами расчета М являются: среднеарифметический способ и способ моментов (условных отклонений).

Среднеарифметический способ применяется для вычисления средней арифметической простой и средней арифметической взвешенной. Выбор способа расчета средней арифметической величины зависит от вида вариационного ряда. В случае простого вариационного ряда, в котором каждая варианта встречается только один раз, определяется средняя арифметическая простая по формуле:

где: М – средняя арифметическая величина;

V – значение варьирующего признака (варианты);

Σ – указывает действие – суммирование;

n – общее число наблюдений.

Пример расчета средней арифметической простой. Частота дыхания (число дыхательных движений в минуту) у 9 мужчин в возрасте 35 лет: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Для определения среднего уровня частоты дыхания у мужчин в возрасте 35 лет необходимо:

1. Построить вариационный ряд, расположив все варианты в возрастающем или убывающем порядке Мы получили простой вариационный ряд, т.к. значения вариант встречаются только один раз.

M = ∑V/n = 171/9 = 19 дыхательных движений в минуту

Вывод. Частота дыхания у мужчин в возрасте 35 лет в среднем равна 19 дыхательным движениям в минуту.

Если отдельные значения вариант повторяются, незачем выписывать в линию каждую варианту, достаточно перечислить встречающиеся размеры вариант (V) и рядом указать число их повторений (р). такой вариационный ряд, в котором варианты как бы взвешиваются по числу соответствующих им частот, носит название – взвешенный вариационный ряд, а рассчитываемая средняя величина – средней арифметической взвешенной.

Средняя арифметическая взвешенная определяется по формуле: M= ∑Vp/n

где n – число наблюдений, равное сумме частот – Σр.

Пример расчета средней арифметической взвешенной.

Длительность нетрудоспособности (в днях) у 35 больных острыми респираторными заболеваниями (ОРЗ), лечившихся у участкового врача на протяжении I-го квартала текущего года составила: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 дней.

Методика определения средней длительности нетрудоспособности у больных с ОРЗ следующая:

1. Построим взвешенный вариационный ряд, т.к. отдельные значения вариант повторяются несколько раз. Для этого можно расположить все варианты в возрастающем или убывающем порядке с соответствующими им частотами.

В нашем случае варианты расположены в возрастающем порядке

2. Рассчитаем среднюю арифметическую взвешенную по формуле: M = ∑Vp/n = 233/35 = 6,7 дней

Распределение больных с ОРЗ по длительности нетрудоспособности:

Длительность нетрудоспособности (V) Число больных (p) Vp
∑p = n = 35 ∑Vp = 233

Вывод. Длительность нетрудоспособности у больных с острыми респираторными заболеваниями составила в среднем 6,7 дней.

Мода (Мо) – наиболее часто встречающаяся варианта в вариационном ряду. Для распределения, представленного в таблице, моде соответствует варианта, равная 10, она встречается чаще других – 6 раз.

Распределение больных по длительности пребывания на больничной койке (в днях)

V
p

Иногда точную величину моды установить трудно, поскольку в изучаемых данных может существовать несколько наблюдений, встречающихся «наиболее часто».

Медиана (Ме) – непараметрический показатель, делящий вариационный ряд на две равные половины: в обе стороны от медианы располагается одинаковое число вариант.

Например, для распределения, указанного в таблице, медиана равна 10, т.к. по обе стороны от этой величины располагается по 14 вариант, т.е. число 10 занимает центральное положение в этом ряду и является его медианой.

Учитывая, что число наблюдений в этом примере четное (n=34), медиану можно определить таким образом:

Me = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Это означает, что середина ряда приходится на семнадцатую по счету варианту, которой соответствует медиана, равная 10. Для распределения, представленного в таблице, средняя арифметическая равна:

M = ∑Vp/n = 334/34 = 10,1

Итак, для 34 наблюдений из табл. 8, мы получили: Мо=10, Ме=10, средняя арифметическая (М) равна 10,1. В нашем примере все три показателя оказались равными или близкими друг к другу, хотя они совершенно различны.

Средняя арифметическая является результативной суммой всех влияний, в формировании ее принимают участие все без исключения варианты, в том числе и крайние, часто нетипичные для данного явления или совокупности.

Мода и медиана, в отличие от средней арифметической, не зависят от величины всех индивидуальных значений варьирующего признака (значений крайних вариант и степени рассеяния ряда). Средняя арифметическая характеризует всю массу наблюдений, мода и медиана – основную массу