Диаграмма – это средство наглядного графического изображения информации, предназначенное для сравнения нескольких величин или нескольких значений одной. Операторы сравнения. Из всех типов операторов отношения чаще всего используются операторы сравнения –

02.05.2021

2

Я слушал лекцию по измерению производительности компьютера, и профессор дал аналогию с измерением производительности самолетов. Он показал таблицу, которая содержала различные параметры различных летательных аппаратов, таких как:

Aircrafts: Passenger Capcity Speed Concord 132 1350 mph DC9 146 544 mph

тогда он задавал вопросы от студентов, что «Насколько быстрее Конкорд по сравнению с DC9 ?». Затем он объяснил это более чем в 2 раза. Мой вопрос: почему он использовал Дивизион для сравнения двух значений, а не вычитания? Я знаю его очень фундаментальный вопрос, но, пожалуйста, извините мою некомпетентность за это.

0

Иногда вам приходится использовать соотношение для описания явлений, например, вероятность выигрыша игры. Иногда это необязательно, как в вашем случае. Вы можете найти это интересно: https: //en.wikipedia.org/wiki/Relative_change_and_difference - NoChance 06 мар. 16 2016-03-06 17:40:56

  • 2 ответа
  • Сортировка:

    Активность

0

Я разместил тот же вопрос на Dr.Maths и получил следующий ответ, который, на мой взгляд, более точный и подробный.

Ask yourself which would be more meaningful to you: The Concord is 806 mph faster than the DC9. The Concord is 2.5 times as fast as the DC9. If you have no idea how fast the DC9 is, the first statement would be nearly meaningless -- you can"t tell whether it"s just a small improvement (from, say 100,000 mph to 100,806 mph!) or a huge improvement (from 10 mph to 816 mph). I"m exaggerating to make a point: interpreting the significance of the number depends on having at least some knowledge of related numbers. The ratio, on the other hand, requires no such knowledge. Also, and perhaps even more important, the ratio will be the same regardless of the units used. We don"t need to know whether the speeds were measured in mph or kph or inches per second. In effect, the ratio amounts to using the DC9 itself as a unit of measurement -- the Concord flies at 2.5 DC9"s. The same is probably true in comparing computer speeds. Who knows, these days, what is a good speed? But anyone can tell that twice as fast is a lot better. This is something we can visualize a lot better than nanoseconds or gigabytes!

1

Рассмотрите ситуацию - я съел $1000$ яблок. Мой друг съел яблоки на $1050$ .

Два statements- Мой друг съел $50$ яблок больше, чем я от разницы, Мой друг съел $1,05$ раз количество яблок, как мне из соотношения.

Рассмотрим другую ситуацию, когда я ел $100$ яблоки и мой друг $105$

Два заявления будет Мой друг съел $5$ яблоки больше, чем меня и
Мой друг съел $1,05$ раза больше яблок, как мне

Третий Я ел с ситуациями $1$ яблоко, мой друг ел $51$

два заявления - Мой друг съел $50$ яблок более-й МЭ и
Мой друг съел $51$ раз количество яблок, как мне

Заключение - Нам нужно как разность и отношение четко знать ситуацию. Однако мы используем разные вещи в разных сценариях, которые, как я надеюсь, ясны из приведенного выше примера.

Ознакомление с величиной является одной из задач сенсорного и умственного воспитания детей дошкольного возраста.

В процессе повседневной жизни, вне специального обучения дети не овладевают общепринятыми способами измерения , они лишь с большей или меньшей степенью успешности пытаются копи­ровать внешние действия взрослых, зачастую не вникая в их зна­чение и содержание.

Исходя из особенностей детских представлений о величине предметов, педагогическая работа строится в определенной после­довательности.

Вначале формируетсяпредставление о величине как прост­ранственном признаке предмета. Детей учат выделять данный признак наряду с другими, пользуясь специальными приемами об­следования : приложением и наложением .

Практически сравнивая (соизмеряя) контрастные и одинаковые по величине предметы, малыши устанавливают отношения «равенства - неравенства».

СРАВНЕНИЕМ называется операция установления сходства и различия между предметами и явлениями реального мира.

Ре­зультаты сравнения отражаются в речи с помощью прилагатель­ных: длиннее, короче, одинаковые (равные по длине), шире, уже, одинаковые (равные по ширине), выше, ниже, одинаковые (рав­ные по высоте), больше, меньше, одинаковые (равные по величи­не) и т. д. Таким образом, первоначально предусматривается лишь попарное сравнение предметов по одному признаку.

На этой основе продолжается дальнейшая работа , в процессе которой детей учат при сравнении нескольких предметов одним из них пользоватьсякак образцом.

Практические приемы приложе­ния и наложения применяются для составления упорядоченного (сериационного) ряда. Затем дети учатся создавать его по правилу . Располагая предметы (3-5 штук) в возрастающем или убывающем порядке по длине, ширине, высоте и другим признакам, они отражают это в речи: самая широкая, уже, еще уже, самая узкая и др.

Задача последующей работы - закрепить умение строить сериационный ряд предметов по длине, ширине, высоте и другим признакам, правильно отражая это в речи, развивать глазомер детей, учить на глаз определять размеры различных предметов, сопоставляя их с величиной известных предметов, а также пользуясь условной меркой.



Таким образом,

- в младшем и среднем дошкольном возрасте дети определяют размеры предметов путем непосредственного их сравнения (приложения или наложения);

В старшем - применяет­ся и опосредованный способ сравнения (оценка размеров воспри­нимаемых предметов в сравнении с хорошо известными, встречаю­щимися в опыте ребенка ранее, измерение условной меркой).

ИЗМЕРЕНИЕ включает в себя две логические операции :

Первая - это процесс разделения , который позволяет ребенку понять, что целое можно раздробить на части;

Вторая - это операция замещения , состоящая в соединении отдельных частей.

Сущность измерения состоит в количественном дроблении измеряемых объектов и установлении величины данного объекта по отношению к принятой мере. Посредством операции измерения устанавливается численное отношение между измеряемой величиной и заранее выбранной единицей измерения, масштабом или эталоном.

Деятельность измерения довольно сложна. Она требует специфических умений, знакомства с системой мер, применения измерительных приборов. Использование условных мер делает доступным измерение детям . Термин «измерение условными мерками» означает возможность использовать средства измерения.

В детском саду ребята овладевают несколькими видами ИЗМЕРЕНИЯ УСЛОВНОЙ МЕРКОЙ .

К первому виду следует отнести линейное измерение , когда дети с помощью полоски бумаги, палочек, веревок, шагов и других условных мерок учатся измерять длину, ширину, высоту различных предметов.

Второй вид измерения - определение с помощью условной мерки объема сыпучих веществ : дети учатся кружкой, стаканом, ложкой и другими емкостями вымерять количество крупы, сахарного песка в пакете.

Третий вид - это измерение условной меркой жидкостей, чтобы узнать, сколько стаканов воды в графине и т. п.

Применение мерок придает точность устанавливаемым в процессе измерения отношениям «равенство - неравенство», «часть - целое», позволяет полнее и глубже выявить их свойства.

Таким образом, в дошкольном образовательном учреждении измерительная деятельность носит элементарный, пропедевтический характер. Ребенок вначале учится измерять объекты условными мерками, и лишь в результате этого создаются предпосылки для овладения «настоящим» измерением.

Ориентировка детей в величине предметов во многом определяется ГЛАЗОМЕРОМ - важнейшей сенсорной способностью. Развитие глазомера непосредственно связано с овладением специальными способами сравнения предметов. Вначале сравнение предметов по длине, ширине, высоте детьми проводится практическим путем наложения и приложения, а затем на основе измерения. Глаз как бы обобщает практические действия руки.

В средней группе большое внимание уделяется развитию глазомера . Детям дают «задания найти из четырех-пяти предметов равный по своим размерам образцу или большего, меньшего размера (найди такой же длины, найди длиннее, короче и т. д.). Чтобы осуществить все задания, предусмотренные программой средней группы, надо провести не менее 10-12 занятий.

Знания и умения, полученные на таких занятиях, необходимо систематически закреплять и применять в других видах деятельности :

· сравнивать размеры разных частей растений,

· подбирать полоски нужных размеров для ремонта книг,

· рисовать, лепить предметы соответствующих размеров,

· наблюдать, как изме­няются размеры строящегося дома, и т.д.

Большое внимание уделяют развитию у детей глазомера. На основе овладения приемами непосредственного сопоставления размера предметов (наложение, приложение, измерение при помощи мерки) дети учатся решать задачи, требующие все более и более, сложных глазомерных действий.

Старшие дошкольники выполняют более сложные, чем в средней группе, задания на развитие глазомера :

· найти на глаз предметы большего или меньшего размера, чем образец;

· подобрать два предмета, чтобы вместе они были равны образцу и др.

Постепенно расширяют и площадь, на которой осуществляется поиск предметов нужного размера.

В качестве образца могут служить разные предметы. В то же время один и тот же образец может использоваться для сравнения предметов и по длине, и по ширине, и т. д. Каждый раз дети проверяют правильность решения глазомерной задачи, пользуясь приемом приложения (вплотную) или измерения меркой. Аналогичные задачи можно ставить перед детьми в разных видах деятельности.

В процессе упражнения детей в построении упорядоченного ряда педагог вводит правило: прикладывать и переставлять предметы нельзя. Каждый следующий элемент среди оставшихся дети находят на глаз.

Можно предлагать и более сложные задачи . Например, выбрать на глаз 2 предмета и составить из них третий, равный образцу; установить соответствие между несколькими (2-3) рядами предметов, упорядоченных по размеру.

Данной работе необходимо уделить внимание не столько на занятиях по математике, сколько в часы игр. Вне занятий используют дидактические игры "Сложи дощечки", "Расставь по порядку", "В какую коробочку?", "Кто первый?" (автор Т. Г. Васильева).

В книге рассмотрены основные приемы работы на компьютере Macintosh. Показаны особенности работы в операционной системе Mac OS X: пользовательский интерфейс, установка/удаление программ, прожиг CD/DVD, печать документов, подключение к сети Интернет и др. Описаны основные приложения, входящие в состав ОС: почтовый клиент Mail; web-браузер Safari; календарь-ежедневник iCal; приложение, управляющее виджетами, Dashboard; программа Photo Booth для работы со встроенной цифровой камерой; музыкальный редактор GarageBand; приложение Time Machine для резервного копирования и др. Рассмотрена работа с приложениями интегрированной среды iWork: текстовым редактором Pages, электронными таблицами Numbers, программой для создания презентаций Keynote. Показаны особенности клавиатуры Macintosh и проведены аналогии с клавиатурой компьютера IBM PC. Компакт-диск содержит задания для самостоятельной работы с Mac OS X и приложениями iWork, материалы для выполнения заданий, примеры презентаций.

Для начинающих пользователей.

Книга:

Разделы на этой странице:

Диаграмма - графическое представление данных из выбранного диапазона.

Для построения диаграммы придерживайтесь следующего алгоритма

1. Создать таблицу расчетных значений.

2. Выделить нужный диапазон (он может состоять из не смежных прямоугольных диапазонов).

3. Выбрать необходимый вид диаграммы из списка, организованного кнопкой Charts (Диаграммы):


Или из перечня меню Insert (Вставка) ? Chart (Диаграмма).

4. Произвести настройки параметров созданной диаграммы в окне инспектора на вкладке Chart (Диаграмма).

Подробно рассматривать настройки параметров диаграммы в этом разделе мы не будем, так как этот вопрос разбирался ранее в приложении Pages (см. разд. 5.1.14), а практика работы с диаграммами будет разобрана в разд. 6.2.8.

Виды диаграмм и примеры их использования

Приложение Numbers предлагает тот же перечень диаграмм, что и Pages. Работа с диаграммами в Pages была рассмотрена в разд. 5.1.14, в котором обращалось внимание только на различные настройки диаграмм, но не была приведена сравнительная характеристика различных видов. В этом разделе разберем несколько примеров использования некоторых видов диаграмм, которые наглядно демонстрируют их область применения.

Круговая диаграмма

Круговая диаграмма (Pie) и объемный ее вариант (3D Pie) используются для сравнения нескольких величин в одной точке или нескольких частей одного целого. Как следует из названия, диаграмма представляет собой круг, который разбит на секторы. Круг соответствует суммарному количеству всех данных и составляет 100 %, каждый сектор соответствует одному данному, представляющему собой часть (процентную долю) от общего количества.

Пример 1. Однажды дядя Федор пошел в лес по грибы и собрал: 24 лисички, 9 моховиков, 15 волнушек, 5 белых. Построить круговую диаграмму сбора грибов, показывающую какой процент от общего количества составляют белые грибы.

Предварительно следует подготовить таблицу значений, по которым будет осуществляться построение диаграммы. В таблицу необходимо занести наименования грибов и числовые данные, затем выделить диапазон A1:D2 (рис. 5.86) и выбрать тип диаграммы Pie (Круговая). Ячейки первой строки выделенного диапазона являются названиями секторов круга, ячейки второй строки содержат числовые данные диаграммы. Весь круг составляет общее количество собранных грибов - 45, каждый сектор отражает процентную долю каждого наименования гриба от общего количествами, рис. 5.86).


Использование круговой диаграммы не всегда удобно и наглядно, например, увеличение числа собранных грибов приведет к увеличению секторов, что пагубно скажется на информативности диаграммы. В этом случае следует использовать другие виды.

Столбцовые диаграммы

Numbers предлагает несколько вариантов столбцовой диаграммы: Column (Столбцовая) - вертикальные столбцы, Bar (Гистограмма) - горизонтальные столбцы, 3D Columnn (Трехмерная столбцовая), 3D Bar (Трехмерная гистограмма).

Столбцовая диаграмма и различные ее варианты служат для сравнения нескольких величин в нескольких точках, но также могут быть использованы и для сравнения нескольких величин в одной точке, как в предыдущем примере (см. рис. 5.86).

Как следует из названия, столбцовая диаграмма состоит из столбиков, высота которых соответствует значениям сравниваемых величин, в примере 1 высота столбиков определяется количеством собранных грибов. Каждый столбик привязан к некоторой опорной точке. В примере 1 опорная точка соответствует наименованию гриба, сколько наименований (4), столько и столбиков (см. рис. 5.86).

Рассмотрим задачу, для решения которой круговая диаграмма не годится. В примере 2 требуется несколько раз сравнивать несколько величин.

Пример 2. Предположим, к дяде Федору по сбору грибов присоединились его друзья: кот Матроскин и пес Шарик, данные приведены в таблице (рис. 5.87). Построить диаграмму, в которой отражены результаты всех сборщиков.


Высота столбца отражает, как и в примере 1, количество собранных грибов, по-прежнему остается 4 опорных точки, но в отличие от примера 1, в каждой опорной точке расположено не по одному столбцу, а по три (один столбик для каждого сборщика). Все столбики одного сборщика будут закрашены одним цветом. Для построения диаграммы следует выделить диапазон А1:Е4 (см. рис. 5.87), на рис. 5.87 использован тип диаграммы Column (Столбцовая).

Линейная диаграмма

Линейная диаграмма (Line ) предназначена для того, чтобы проследить за изменениями нескольких величин при переходе от одной точки к другой.

Пример 3. Построить линейную диаграмму на основе таблицы из примера 2, отражающую изменение количества собранных грибов в зависимости от их вида.

Опорных точек по-прежнему остается четыре по числу разновидностей грибов. Количество собранных грибов отмечается на графике метками, соединенными друг с другом отрезками. В результате чего график представляет собой ломаную линию, состоящую из нескольких отрезков, отсюда данный вид диаграмм так и называется - линейная. Диаграмма, изображенная на рис. 5.88, содержит три линии, каждая из которых соответствует одному сборщику. Линии отличаются друг от друга: цветом, толщиной, типом штриха, маркерами.

Диаграмма площадей

Диаграмма площади представляет гибрид линейной и столбцовой диаграмм, нагляднее отражает сравнение нескольких величин в одной точке.

Пример 4. Построить диаграмму площади на основе таблицы из примера 1, отражающую сбор дяди Федора.

Если на вершинах столбцов, приведенных на рис. 5.86, отметить точки, соединить их отрезками и полученную площадь закрасить каким-либо цветом, то получится диаграмма площади, представленная на рис. 5.88. Для отображения нескольких сборщиков этот вид диаграммы не информативен.

Numbers предлагает два варианта диаграммы площади: Area (Площадь) и ее объемный вариант 3D Area (Трехмерная площадь).


Многоярусные диаграммы

Многоярусная диаграмма позволяет наглядно сравнить суммы нескольких величин в нескольких точках, и при этом показать вклад каждой величины в общую сумму.

Пример 5. Построить многоярусные диаграммы на основе таблицы из примера 2.

Numbers предлагает шесть вариантов многоярусной диаграммы: Stacked Column (Многоярусные столбцы) и ее объемный вариант 3D Stacked Column (Трехмерные многоярусные столбцы), Stacked Bar (Многоярусная гистограмма) и 3D Stacked Bar (Трехмерная многоярусная гистограмма), Stacked Area (Многоярусная площадь) и 3D Stacked Area (Трехмерная многоярусная площадь).

Сначала рассмотрим задачу сравнения величины измеряемой в эксперименте, с константой а. Величину можно определить лишь приближенно, вычисляя среднее по измерениям. Надо узнать, выполняется ли соотношение . В этом случае ставят две задачи, прямую и обратную:

а) по известной величине найти константу а, которую превосходит с заданной вероятностью

б) найти вероятность того, что , где а - заданная константа.

Очевидно, если то вероятность того, что меньше 1/2. Этот случай не представляет интереса, и далее будем считать, что

Задача сводится к задачам, разобранным в п. 2. Пусть по измерениям определены X и его стандарт

Число измерений будем считать не очень малым, так что есть случайная величина с нормальным распределением. Тогда из критерия Стьюдента (9) при учете симметрии нормального распределения следует, что для произвольно выбранной вероятности выполняется условие

Полагая перепишем это выражение в следующем виде:

где - заданные в таблице 23 коэффициенты Стьюдента. Тем самым, прямая задача решена: найдена константа а, которую с вероятностью превышает

Обратная задача решается при помощи прямой. Перепишем формулы (23) следующим образом:

Это значит, что надо вычислить t по известным значениям а, выбрать в таблице 23 строку с данным - и найти по величине t соответствующее значение Оно определяет искомую вероятность

Две случайные величины. Часто требуется установить влияние некоторого фактора на исследуемую величину - например, увеличивает ли (и насколько) прочность металла определенная присадка. Для этого надо измерить прочность исходного металла и прочность легированного металла у и сравнить эти две величины, т. е. найти

Сравниваемые величины являются случайными; так, свойства металла определенной марки меняются от плавки к плавке, поскольку сырье и режим плавки не строго одинаковы. Обозначим эти величины через . Величина исследуемого эффекта равна и требуется определить, выполняется ли условие

Таким образом, задача свелась к сравнению случайной величины с константой а, разобранному выше. Прямая и обратная задачи сравнения в этом случае формулируются следующим образом:

а) по результатам измерений найти константу а, которую превосходит с заданной вероятностью (т. е. оценить величину исследуемого эффекта);

б) определить вероятность того, что где а - желательная величина эффекта; при это означает, чтонадо определить вероятность, с которой

Для решения этих задач надо вычислить z и дисперсию этой величины. Рассмотрим два способа их нахождения.

Независимые измерения. Измерим величину в экспериментах, а величину экспериментах, независимых от первых экспериментов. Вычислим средние значения по обычным формулам:

Эти средние сами являются случайными величинами, причем их стандарты (не путать со стандартами единичных измерений!) приближенно определяются несмещенными оценками:

Поскольку эксперименты независимы, то случайные величины х и у также независимы, так что при вычислении их математические ожидания вычитаются, а дисперсии складываются:

Несколько более точная оценка дисперсии такова:

Таким образом, и ее дисперсия найдены, и дальнейшие вычисления производятся по формулам (23) или (24).

Согласованные измерения. Более высокую точность дает другой способ обработки, когда в каждом из экспериментов одновременно измеряют . Например, после выпуска половины плавки в оставшийся в печи металл добавляют присадку, а затем сравнивают образцы металла из каждой половины плавки.

При этом, по существу, в каждом эксперименте измеряют сразу значение одной случайной величины , которую надо сравнить с константой а. Обработка измерений тогда производится по формулам (21)-(24), где вместо надо всюду подставить z.

Дисперсия при согласованных измерениях будет меньше, чем при независимых, поскольку она обусловлена только частью случайных факторов: те факторы, которые согласованно меняют , не влияют на разброс их разности. Поэтому такой способ позволяет получить более достоверные выводы.

Пример. Любопытной иллюстрацией сравнения величин является определение победителя в тех видах спорта, где судейство ведется «на глазок» - гимнастика, фигурное катание и т. д.

Таблица 24. Судейские оценки в баллах

В таблице 24 приведен протокол соревнований по выездке на Олимпийских играх 1972 г. Видно, что разброс судейских оценок велик, причем ни одну оценку нельзя признать грубо ошибочной и откинуть. На первый взгляд кажется, что достоверность определения победителя невелика.

Рассчитаем, насколько правильно определен победитель, т. е. какова вероятность события . Поскольку оценки обеим всадницам выставлялись одними и теми же судьями, можно воспользоваться способом согласованных измерений. По таблице 24 вычисляем подставляя в формулу (24) эти значения и получим .

Выбирая в таблице 23 строку находим, что этому значению t соответствует Отсюда т. е. с вероятностью 90% золотая медаль присуждена правильно.

Сравнение по способу независимых измерений даст несколько худшую оценку, поскольку оно не использует информацию о том, что оценки выставляли одни и те же судьи.

Сравнение дисперсий. Пусть требуется сравнить две методики эксперимента. Очевидно, точнее та методика, у которой дисперсия единичного измерения меньше (разумеется, если при этом не увеличивается систематическая ошибка). Значит, надо установить, выполняется ли неравенство .

Параметрические критерии, которые мы рассматривали до сих пор, основаны на том, что сравниваемые выборки можно охарактеризовать двумя параметрами: средним и стандартным отклонением (или какой-то иной мерой изменчивости). А что делать, если распределение в выборках (или, точнее, в той генеральной совокупности, откуда были получены эти выборки) является совсем иным?

Если численность каждой из сравниваемых выборок достаточно велика (больше ста), параметрические критерии можно использовать все равно. Какое бы распределение ни имели эти выборки, их средние "ведут себя" примерно так же, как средние выборок с нормальным распределением. Однако если численность выборок более низкая, следует использовать непараметрические критерии.

Например, непараметрическим аналогом t-критерия Стьюдента является U-критерий Манна-Уитни. Критерий Стьюдента построен на основе распределения, которое описывает отклонения среднего значения выборки определенной численности вокруг генеральной средней нормально распределенной величины . Чем сильнее отклонение от , тем ниже вероятность того, что оно получилось в силу случайности при формировании выборки. А как действовать, если мы ничего не знаем о характере распределения генеральных совокупностей?

Рассмотрим достаточно простой пример, поясняющий, как работает большая группа непараметрических методов, - ранговые критерии . У нас есть две выборки. Расположим их элементы в порядке возрастания: первая - a1, a2, a3, a4, a5; вторая - b1, b2, b3, b4, b5, b6. Составим из элементов этих выборок общий ряд, построенный в порядке возрастания их значений. Сравним три разных случая:
№ 1: a1, a2, a3, a4, a5, b1, b2, b3, b4, b5, b6;
№ 2: a1, a2, a3, a4, b1, a5, b2, b3, b4, b5, b6;
№ 3: b1, a1, b2, a2, b3, a3,b4, b5, a4, a5, b6.

В случае № 1 все элементы одной выборки расположены с одной стороны общего ряда, а все элементы другого ряда - с другой стороны. В случае № 2 одной перестановки (элементов b1 и a5) было бы достаточно, чтобы порядок элементов стал, как в случае № 1. Наконец, в случае № 3 элементы двух выборок перепутаны, и чтобы выстроить их в ряд, где будут сначала стоять одни, а потом - другие, надо сделать 5 перестановок. Нам нужно выбрать между альтернативной гипотезой (согласно которой выборки a и b взяты из разных совокупностей) и нулевой гипотезой (согласно которой эти выборки взяты из одной совокупности). Одинаковы ли вероятности альтернативной и нулевой гипотез для показанных нами трех разных случаев? Нет; альтернативная гипотеза более вероятна в первом случае, а нулевая - в третьем.

Идея рангового непараметрического критерия состоит в том, что мы можем использовать количество необходимых перестановок как меру для оценки нулевой и альтернативной гипотезы. Конкретные величины, которые высчитываются при применении непараметрических критериев, оказываются иными, но логика сравнения примерно соответствует рассмотренному нами примеру.

Итак, благодаря применению остроумных подходов, для параметрических методов сравнения выборок подобраны их непараметрические аналоги (табл. 4.8.1). Чаще всего непараметрические методы обладают меньшей мощностью (т.е. чаще отвергают альтернативную гипотезу в той ситуации, когда она на самом деле верна), но зато позволяют работать с разнообразно распределенными данными и менее чувствительны к малой численности сравниваемых выборок.

Таблица 4.8.1. Непараметрические аналоги параметрических методов

Тип сравнения

Параметрические методы

Непараметрические методы

Сравнение значений величины в двух независимых выборках

t-критерий Стьюдента;
Дисперсионный анализ (ANOVA)

U-критерий Манна-Уитни ;
Критерий серий Вальда-Вольфовица;
Двухвыборочный критерий Колмогорова-Смирнова

Сравнение значений величины в двух зависимых выборках

t-критерий Стьюдента для парных сравнений

Критерий знаков
Критерий Вилкоксона

Сравнение значений величины в нескольких независимых выборках

Дисперсионный анализ (ANOVA)

Ранговый дисперсионный анализ Краскела-Уоллиса ;

Медианный тест

4.9. U-критерий Манна-Уитни

Чтобы рассмотреть применение критерия Манна-Уитни на нашем файле-примере Pelophylax_example.sta нам придется использовать несколько искуственный пример. В качестве примера величины, распределение которой сильно отличается от нормального, мы можем использовать признак, который называется DNA - содержание ДНК на клетку (в пикограммах, пг), измеренное с помощью проточной ДНК-цитометрии.

Рис. 4.9.1. Признак "DNA" имеет распределение, резко отличающееся от нормального

Выясним, отличаются ли по значению этого признака самки и самцы Pelophylax esculentus . Чтобы воспользоваться критерием Манна-Уитни перейдем в меню Statistics / Nonparametrics. Обратите внимание на пиктограммы в меню: они соответствуют тем, которые используются для аналогичных сравнений с помощью t-теста.

Рис. 4.9.2. U-критерий Манна-Уитни вычисляется здесь

В диалоговом окне надо указать зависимую (Dependent) и группирующую (Grouping) переменные; если группирующая переменная имеет более двух значений, надо выбрать те два значения, которым будут соответствовать сравниваемые выборки. Чтобы выбрать только представителей Pelophylax esculentus , воспользуемся окошком Select cases и используем текстово-цифровые обозначения, введенные в пункте 3.1, при описании файла-примера.

Рис. 4.9.3. Установки, выбираемые для описываемого сравнения

Вы можете увидеть, что Statistica вычисляет все три упомянутых в табл. 4.9.1. критерия, которые используются для сравнения двух независимых выборок, но "рекомендует" (запускает с кнопки, расположенной в левом верхнем углу) критерий Манна-Уитни. Вычислим его и убедимся, что отличия между самками и самцами по количеству ДНК, приходящемуся на клетку, статистически незначимы.

Рис. 4.9.4. Результат сравнения по Манну-Уитни

Если нас не интересует односторонний критерий, целесообразно использовать значение p, вычисленное с поправкой (то, которое находится после столбца "Z adjusted, т.е. 0,906780). Эта поправка повыщает мощность критерия в случае выборок, численность которых превышает 20. Так или иначе, никакой сколь-нибудь существенной разницы между самцами и самками не обнаружено.

Использованный нами диалог для сравнения по Манну-Уитни предусматривает возможность построения коробчатых графиков. Поскольку мы используем непараметрический метод, на графике не тражаются параметры выборки (например, ее среднее значение), а используются непараметрические меры - медиана и квартили (значения, "отрезающие" по четвертой части распределения).

Рис. 4.9.5. Графическое сравнение распределений значения признака DNA для самок и самцов Pelophylax esculentus

Может показаться странным, почему первая (от Min до 25%) и последняя (от 75% до Max) четверти настолько уже, чем вторая и третья? Чтобы это понять, построим категоризованную гистограмму.

Рис. 4.9.6. Гистограмма, показывающая распределения значения признака DNA, зарегистрированные для самок и самцов Pelophylax esculentus

Становится понятно, что удивившее нас свойство показанных на предыдущем рисунке распределений является следствием бимодальности рассматриваемого нами признака.

4.10. Критерий знаков для парных сравнений

В нашем файле-примере Pelophylax_example.sta отсутствуют данные, которые требуют сравнения значений двух связанных выборок, поэтому мы создадиим их искусственно. Представим себе, что выборку из 25 лягушек измерили два человека. Их результаты измерений находятся в столбцах First и Second. Размерное распределение в данной выборке изначально было далеким от нормального.

Рис. 4.10.1. Распределение размеров лягушек (в 0,1 мм) по данным измерений, выполненных двумя людьми на одном и том же материале

Тем не менее, для многих из лягушек результаты измерений, сделанных первым и вторым исследователем, отличаются. Наша задача - установить, одинаково ли измеряют длину лягушек два исследователя. Для поиска ответа на этот вопрос воспользуемся критерием знаков.

Рис. 4.10.2. Использование критерия знаков для сравнения результатов измерений, сделанных двумя разными исследователями

Критерий знаков попросту определяет долю случаев, в которых значение из одной выборки больше, чем значение из другой выборки.

Рис. 4.10.3. Отличия статистически значимы!

Мы можем установить, что второй исследователь статистически значимо чаще завышал результаты измерений по сравнению с первым исследователем.

Сравним полученный результат с результатом от использования параметрического метода - t-критерия для парных выборок.

Рис. 4.10.4. Параметрический метод дал тот же результат, но с несколько большей надежностью

Более низкое значение p, определенное с помощью параметрического критерия, вполне согласуется с упомянутым выше фактом, что параметрические методы обладают большей мощностью, чем непараметрические. Но правомочно ли мы использовали параметрический критерий? На самом деле, правомочно. Парные сравнения рассматривают не совокупность значений в первой и второй выборке, а разницу по каждому элементу между первой и второй выборкой. Построим распределение разницы между выборками First и Second.

Рис. 4.10.5. Распределение разницы между измерениями двух исследователей

Можно увидеть, что отклонение распределения разницы между двумя измерениями от нормального является статистически незначимым. Использование параметрического теста было вполне правомочным.

А могли ли мы использовать методы для сравнения независимых выборок? В случае сравнения независимых выборок то, что распределение интересующих нас величин сильно отличается от нормального, оказывается важным. Таким образом, мы должны использовать не t-критерий, а U-критерий. Для того, чтобы использовать U-критерий Манна-Уитни, файл с данными придется перестроить: все измерения должны находиться в одном столбце, а второй столбец станет группирующим.

Рис. 4.10.6. По Манну-Уитни результаты измерений, выполненных двумя разными людьми, не отличаются

Как пояснить такое отличие? Как и во многих других случаях, первое, что нужно сделать в случае какого-то непонимания - надо посмотреть на распределение интересующих нас величин.

Рис. 4.10.7. Распределения результатов измерений, выполненных двумя людьми, практически одинаковы. Но, все-таки, как свидетельствует рис. 4.10.3, для 75% лягушек результаты измерения второго исследователя оказываются большими, чем результаты измерения первого исследователя!

Конечно, полученный результат вполне закономерен. Используя критерий Манна-Уитни вместо критерия знаков (или критерия Вилкоксона), мы утратили важнейшую информацию, характеризующую закономерности изменений рассматриваемой нами величины.

Кстати, использованные нами данные были сгенерированы искусственно. Столбец First был фрагментом из файла Pelophylax_example.sta, куда попали в основном самые мелкие и самые крупные особи, а столбец Second был получен с помощью формулы =Trunc(First-2,4+Rnd(8)). Вам ведь понятно, что и как "делает" эта формула?

4.11. Ранговый дисперсионный анализ Краскела-Уоллиса

До нестоящего времени мы использовали только попарные сравнения выборок. Сейчас мы рассмотрим метод, позволяющий сравнивать друг с другом одновременно несколько выборок. Тест Краскела-Уоллиса является непараметрическим аналогом дисперсионного анализа (ANOVA), который подробно обсуждается в следующем разделе нашего пособия. С вычислительной точки зрения он является многомерным обобщением теста Манна-Уитни. Хотя тест Краскела-Уоллиса в некоторых отношениях и уступает дисперсионному анализу (например, в том, что не позволяет одновременно оценивать действия двух или большего количества факторов), он является мощным инструментом, который оказывается пригодным для решения многих задач.

Покажем действие теста Краскела-Уоллиса на примере нашего файла Pelophylax_example.sta (см. пункт 3.1). Нам надо выяснить, отличаются ли представители разных генотипов по длине внутреннего пяточного бугра статистически значимо. Это вполне осмысленная задача, ведь размер и форма внутреннего пяточного бугра являются важным диагностическим признаком, полезным для определения разных форм зеленых лягушек.

Рис. 4.11.1. Обратите внимание на выделенную пиктограмму, соответствующую сравнению нескольких независимых групп

Естественно, что зависимой переменной является длина пяточного бугра (Ci), а группирующей - генотип.

Рис. 4.11.2. Установки выбраны. Если надо сравнивать не все значения группирующей переменной, следует воспользоваться диалогом, который вызывает кнопка Code

Нажав на кнопку Summary, вы получите результаты сразу двух тестов: непараметрического дисперсионного анализа Краскела-Уоллиса и медианного теста, который основан на методе Пирсона. Использование подробнее обсуждается в одной из следующих глав данного пособия, а здесь достаточно сказать, что этот метод используется для непараметрического сравнения распределений. Если распределения зависимой величины для разных групп, выделенных по значению группирующего признака, оказываются различными, это свидетельствует о том, что группирующая и зависимая переменная связаны. Метод же Краскела-Уолиса, как вы помните, относится к ранговым непараметрическим методам. Эти два метода работают по разным принципам и часто дают достаточно сильно отличающиеся результаты.

Рис. 4.11.3. Оба метода демонстрируют статистически значимое влияние группирующей переменной на зависимую переменную. Метод Краскела-Уоллиса дает p=0,0047, а медианный тест - p=0,0112

Обратите внимание: в силу какого-то непонятного снобизма в некоторых окнах программы Statistica 0 перед десятичным разделителем (при используемых настройках операционной системы - запятой) не ставится.

Нажав на кнопку Multiple comparisons of mean ranks for all groups можно получить результаты попарного сравнения всех групп. Фактически, это эквивалентно выполнению сравнения по Манну-Уитни для всех возможных пар групп. Программа при этом выводит два окна: значения величины z, используемой в вычислениях по Манну-Уитни, и расчитанный для каждой пары уровень статистической значимости различий.

Рис. 4.11.4. Попарные сравнения групп в диалоге теста Краскела-Уоллиса эквивалентны множественным сравнениям с помощью критерия Манна-Уитни

Обратите внимание на то, что при проведении множественных сравнений появляется опасность совершить статистическую ошибку I рода (принять альтернативную гипотезу в то время, когда верна нулевая). Чтобы избежать этой опасности, следует использовать описанную выше поправку на множественные сравнения.

Наконец, кнопка Box & whisker позволяет зримо сравнить распределения разных групп.

Рис. 4.11.5. Сравнение распределений длины пяточного бугра у представителей разных генотипов

Еще одна из "графических" кнопок обсуждаемого диалога позволяет построить категоризованные гистограммы для сравниваемых групп; с точки зрения автора, этот способ вывода результатов является менее наглядным.