8.5 Агрегирование данных

На базе значений одной или нескольких группирующих переменных (переменных разбиения) можно объединить наблюдения в группы (агрегировать) и создать новый файл данных, содержащий по одному наблюдению для каждой группы разбиения. Для этого SPSS предоставляет большое количество функций агрегирования.

В сельскохозяйственном исследовании рассматривалось содержание свиней в двух различных типах свинарников. При этом в каждом из двух свинарников осуществлялся мониторинг поведения восьми свиней в течение двадцатидневного периода. На протяжении этого периода фиксировалась длительность определенных действий животных (то есть сколько времени свиньи рылись, ели, чесали голову и туловище). Данные хранятся в файле schwein.sav, содержащем следующие переменные:

Имя переменной

Пояснение

stall

Тип свинарника (1 или 2)

nr

Порядковый номер свиньи (от 1 до 8)

zert

Номер дня (от 1 до 20)

wuehlen

Длительность рытья (в секундах)

fressen

Длительность кормежки (в секундах)

massage

Длительность чесания (в секундах)

Следует выяснить, значительно ли различается по длительности эти три действия в свинарниках обоих типов, для чего необходимо применить соответствующий статистический текст, например, тест Стьюдента (см. главу 13).

В каждой из двух выборок для каждого из трех действий имеется по 8 + 20=160 измерений. Однако выполнение статистического тест на основе этих данных будет не совсем корректно, так как они относятся к восьми особям, для каждой из которых было проведено по двадцать измерений.

Поэтому мы просуммируем длительности для каждой отдельной свиньи и для каждого отдельного действия. Затем полученные наборы сумм мы сравним при помощи теста Стьюдента. Это типичный пример агрегирования данных.

 Откроется диалоговое окно Aggregate Data (Агрегировать данные).

Будут показаны три новые переменные wuehle_l, fresse_l и massag_l, имена которых состоят из первых шести букв имен соответствующих переменных агрегирования и комбинации символов _1. По умолчанию в качестве функции агрегирования принято среднее значение. Мы должны выбрать вместо него сумму.

Можно выбрать одну из шестнадцати функций агрегирования, имена которых не требуют особых пояснений.

Рис. 8.8: Диалоговое окно Aggregate Data

Рис. 8.9: Диалоговое окно Aggregate Data: Aggregate Function

После щелчка на кнопке Отбудет создан новый файл, содержащий 2 х 8=16 наблюдений и переменные stall, nr, wuehle_l, fresse_l и massag_l.

Group Statistics (Статистика группы)

STALL

N

Mean (Среднее значение)

Std. Deviation (Стандартное отклонение)

Std. Error Mean (Стандартная ошибка среднего значения)

FRESSE 1 1

 2

8

8

339,0125 231,6750

98,2384 109,5381

34,7325 38,7276

MASSAG 1 1

 2

8

8

2,2875 40,3625

3,3689 54,1795

1,1911 19,1553

WUEHLE 1 1

 2

8

8

1996,587 1964.600

326,3919 642,5314

115,3970 227,1692

Independent Samples Test (Тест для независимых выборок)

 

Levne's Test forEquality of Variancies

(Tecт Левена на равенство дисперсий)  

Т-Test for Equality of Means (Тест Стьюдента на равенство средних)

F

Значи-мость

Т

df

(дву сторон-няя)

Разность средних

Стан-дартная ошибка разницы

95% доверительный интервал разности 

 Нижняя и Верхняя          

FRES-SE_.1

Equal variances assumed (Дис-персии равны) Equal variances not assumed (Дис-персии не равны)

.128

.726

2,063 2,063

14 13, 837

,058 ,058

107 ,3375 107 ,3375

52, 0209 52 ,0209

-4,2362 -4,3594

218, 9112 219, 0344

MAS-SAG 1

Equal variances assumed (Дис-персии равны) Equal variances not assumed (Дис-персии не равны)

7.390

,017

-1,984 -1,984

14 7,054

,067 ,087

-38, 0750 -38,0750

19, 1923 19. 1923

-79,2385 -83,3872

3,0885 7,2372

WU-EHLE_1

variances assumed (Дис-персии равны) Equal variances not assumed (Дис-персии не равны)

2,274

,154

,126 ,126

14 10 ,387

,902 ,902

31, 9875 31 ,9875

254 ,7985 254 ,7985

-514 ,5010 -532, 8844

578. 4760 596 ,8594

В первом свинарнике свиньи ели в продолжение наблюдаемого периода в среднем 339,0 секунд в день, а в другом — только 231,7 секунд. Это различие является почти статистически значимым (р= 0,058).

Сайт управляется системой uCoz