Обзор методов математической обработки данных в психологии

  • Вид работы:
    Статья
  • Предмет:
    Психология
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    6,85 kb
  • Опубликовано:
    2011-10-10
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Обзор методов математической обработки данных в психологии













Статья

Обзор методов математической обработки данных в социальных науках

Ильин А.А.

Одна из главных задач социальных и гуманитарных наук (психологии, социологии, экономики, истории и др.) состоит в объяснении различных аспектов человеческого поведения. Например, нас может интересовать объяснение того, почему одни люди более агрессивны, чем другие. Один из способов определения адекватности или действительности объяснений состоит в том, чтобы собрать данные, характеризующие изучаемые характеристики людей, и найти, до какой степени эти данные совместимы с предлагаемыми объяснениями. Данные согласующиеся с объяснением, поддерживают его в той степени, в которой они противоречат другим объяснениям. Данные, противоречащие объяснению, являются доказательными лишь настолько, насколько корректно операционализированы признаки, имеющие отношение к рассматриваемому явлению. Операционализация включает управление признаками или их измерение.

Очевидно, что доказательными данными обладает лишь то исследование, где результаты получены в виде чисел. При этом естественно, что просто собрать данные недостаточно. Даже объективно и корректно собранные данные ничего не говорят. Исследователю необходимо умение организовать их, обработать и проинтерпретировать, что невозможно без применения математических методов. Конечно, можно сослаться на наличие современных компьютерных программ, применение которых сейчас становится нормой для исследователя. Но любая программа обработки данных переводит один набор чисел в другой набор чисел. При этом предлагается богатый набор способов такого преобразования, замечательным образом расширяющий возможности анализа данных. И для использования этих возможностей исследователь должен уметь: а) организовать исследование так, чтобы его результаты были доступны обработке в соответствии с проблемами исследования; б) правильно выбрать метод обработки; в) содержательно интерпретировать результаты обработки. Эти умения не заменят ни компьютерная программа, ни «живой» математик - ее создатель. Таким образом, применение математики как общенаучного метода, наряду с экспериментом, неизбежно приобретает во всех социальных и гуманитарных науках свои особенности, связанные со спецификой конкретного предмета. В настоящее время неотъемлемой частью подготовки практически любого полноценного специалиста, будь то психолог, социолог, экономист и пр., является изучение математических методов исследования.

За последнюю четверть XX в. за рубежом достигнуты большие успехи в области статистики с точки зрения как развития науки (появились новые методы статистического анализа), так и программного обеспечения (все больше методов реализуется в широко используемых статистических пакетах), а также в области методологии (понимания того, какие методы и в каких случаях использовать). Западные исследователи активно применяют статистические методы разной степени сложности, о которых наши ученые узнают либо из публикуемых статей, либо из выступлений на конференциях.

За последние годы было издано достаточно много монографий и учебных пособий, написанных российскими авторами. Но они охватывают в основном простейшие и самые распространенные способы статистического анализа: описательную статистику, сопоставление двух выборок, а все выходящее за рамки этого обязательного минимума рассматривается только в ознакомительном формате (А.Д. Наследов, 2004; А.П. Кулаичев, 2006) либо посвящено отдельным методам (А.Н. Гусев, 2000; О.В. Митина, И.Б. Михайловская, 2001). В результате большое количество методов, уже широко известных и активно используемых коллегами за рубежом, позволяющих проверять более интересные и дифференцированные гипотезы, до настоящего времени известны узкому кругу исследователей, применяются крайне редко (например, дискриминантный анализ, анализ ковариаций) или не используются вообще (логлинейный анализ).

Далее будет дан краткий обзор статистических методов, чтобы помочь всем интересующимся, которые не очень хорошо представляют, какой из методов наиболее адекватен для анализа их данных.

Логлинейный анализ - метод, позволяющий одновременно рассматривать три и более качественных переменных. Например, нас может интересовать соотношение между психическим расстройством (указанным по классификации тревога, депрессия, тревога и депрессия одновременно), религиозной ориентацией (отсутствует, протестант, католик) и детским семейным статусом (жил с обоими родителями, только с матерью, только с отцом). Логлинейный анализ используется, чтобы ответить на два связанных между собой типов вопросов. Первый вопрос: отличается ли статистически значимо частота интересующих исследователя наблюдений от случайной, в терминах взаимодействия между тремя или более качественными переменными? Другими словами, должны ли мы рассматривать более двух переменных для объяснения распределения интересующих нас наблюдений в зависимости от этих переменных? Второй вопрос: какие из переменных и/или их взаимодействия необходимы для объяснения распределения наблюдений? Этот вопрос отличается от первого тем, что в данном случае наряду с влиянием отдельны переменных и их двусторонних взаимодействий с другими переменными рассматриваются и взаимодействия более высокого порядка.

Если одну из качественных переменных необходимо рассматривать как зависимую (например, классифицированные психические расстройства), а другие качественные переменные как независимые, то логистическая регрессия является наиболее адекватным методом, поскольку она рассматривает только взаимосвязи между зависимой переменной и независимыми переменными. Другими словами, она исключает из рассмотрения взаимосвязи независимых переменных между собой (например, отношения между религиозной ориентацией и семейным статусом). Наиболее часто используемым типом логистической регрессии является бинарная логистическая регрессия, где зависимая переменная состоит из двух категорий. Множественная логистическая регрессия, или логитрегрессия, используется, чтобы определить, какие качественные и количественные переменные и их взаимодействие наиболее сильно связаны с вероятностью осуществления определенной категории зависимой переменной, при этом учитываются их связи с другими независимыми переменными, участвующими в анализе. Качественные переменные должны быть преобразованы в фиктивные двоичные переменные.

Дискриминантный анализ может использоваться для определения той количественной переменной, которая лучше всего предсказывает, в какую категорию попадет объект, при условии, что данные отвечают следующим требованиям. Число объектов в категориях зависимой переменной не должно сильно различаться. Независимые переменные должны иметь нормальное распределение, а внутригрупповые дисперсии - быть одинаковыми. Независимые переменные порождают новую составную переменную, называемую дискриминантной функцией. Максимальное число рассматриваемых дискриминантных функций не должно превышать число предикатов, с одной стороны, и быть, как минимум, на единицу меньше числа групп - с другой.

Множественная регрессия используется, чтобы определить, какие количественные и качественные независимые переменные и их взаимодействия наиболее сильно связаны с количественной переменной-откликом. Качественные переменные необходимо рассматривать как фиктивные переменные.

Анализ путей применяют, чтобы определить силу связи в гипотетической последовательности, или ряду, количественных эндогенных (экзогенных) переменных и ту степень, в которой выбранные пути обеспечивают удовлетворительное описание или величину критерия согласия между всеми переменными. Качественные переменные могут быть включены в анализ как экзогенные переменные, когда они преобразованы в фиктивные двоичные переменные. В самом простом случае рассмотрения трех переменных анализ путей может использоваться, чтобы оценить, в какой степени одна из переменных является прямой функцией двух других и косвенной функцией одной из них.

Дисперсионный анализ используется, чтобы определить, связаны ли значимо одна или несколько качественных независимых переменных и их взаимодействия с количественным откликом или зависимой переменной. Если качественная переменная состоит только из двух категория (является бинарной), значимая связь означает, что средние значения откликов в двух группах, принадлежность к которым определяется по значению качественной переменной, значимо различаются. Если качественная переменная включает более двух категорий, значимая связь подразумевает, что средние значения откликов двух и более групп (соответствующих различным категориям независимой переменной) значимо различаются. Если имеются веские основания для того, чтобы прогнозировать, какие из этих средних различаются, значимость этих различий может быть определена с использованием одностороннего критерия Стъюдента. Если никаких различий не прогнозировалось или не было веских причин полагать какие-либо различия, то значимость различий необходимо анализировать с помощью апостериорных критериев.

Ковариационный анализ позволяет фиксировать влияние независимых количественных переменных, связанных с количественной переменной-откликом.

Возможность группировки связанных количественных переменных в меньшее число объемлющих их факторов или кластеров позволяют факторный анализ и кластерный анализ. Например, нас может интересовать, можно ли сгруппировать пункты опросника, измеряющего тревогу и депрессию, соответственно, в два фактора или кластера, представляющие эти два типа вопросов. Разновидность эксплораторного (разведочного) факторного анализа, называемая методом главных компонент, является разведочным в том смысле, что способ возможной группировки переменных не предопределен заранее, как это имеет место в случае конфирматорного (подтверждающего) факторного анализа. Конфирматорный факторный анализ дает статистическую меру для определения того, что насколько удовлетворительно заранее определенная структура группировки наблюдаемых признаков объясняет реально существующие связи (вычисленные по экспериментальным данным) между ними. Другим методом группировки является кластерный анализ. Кластерный анализ дает группировку на основе совокупного интегрального критерия, в то время как при факторизации задается система взаимосвязанных между собой категорий, позволяющих дифференцировать различения классов по набору критериев. Однако при проведении кластерного анализа исследователь имеет возможность учесть всю информацию, в то время как при факторизации необходимо искусственно оставить лишь небольшое число факторов, а значит, пренебречь каким-то объемом информации (иногда эти потери информации составляют более половины). Таким образом, можно говорить о том, что кластерный и факторный анализы не конкурируют, а взаимодополняют друг друга, позволяя более выпукло представить модель.

ЛИТЕРАТУРА

статистическая математика психологическое исследование

1.Дункан Крамер. Математическая обработка данных в социальных науках: современные подходы : учебное пособие для студ. высших учеб. заведений; пер. с англ. И.В. Тимофеева, Я.И. Киселева; науч. Ред. О.В. Митина - М.: Издательский центр «Академия», 2007 - 288 с.

.Ермолаев О.Ю. Математическая статистика для психологов: Учебник / О.Ю. Ермолаев. - 2-е изд., испр. - М.: Московский психолого-социальный институт: Флинта, 2003. - 366 с.

.Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. Учебное пособие. - СПб.: Речь, 2004. - 329 с.


Не нашел материал для своей работы?
Поможем написать качественную работу
Без плагиата!