Русская версия сайта English version

Международная научная интернет-конференция "Человек@Религия@Интернет"
международная научная интернет-конференция

 

 

Секции > Компьютерные технологии в религиоведении  > Контент-анализ в религиоведческих исследованиях

Связаться с автором по электронной почте Перейти к обсуждению доклада

КОНТЕНТ-АНАЛИЗ В РЕЛИГИОВЕДЧЕСКИХ ИССЛЕДОВАНИЯХ

Фолиева Татьяна Александровна

научный сотрудник

АНО «Независимый научно-исследовательский центр»

tatiana_folieva@yahoo.com

 

  Контент-анализ – это статистическая семантика, которая позволяет выявить частоту появления терминов и определить их характеристику во внеязыковой реальности. Процедура контент-анализа включает в себя:

1.                 определение смысловых единиц;
2.
                 определение единиц счета;
3.
                 классификация терминов;
4.
                 интерпретация.

  Все эти этапы контент-анализа должны базироваться на рабочей программе, которая разрабатывается по стандартным правилам прикладного статистического исследования.
  В зарубежной науке метод контент-анализа применяется достаточно часто в гуманитарных и общественных науках. Разработанные, Клаусом Криппендорфом еще в 1967 году [1, 2,
L], принципы позволяют провести анализ, как печатных источников, так и аудио, видео, телевизионных материалов, произведений искусства, расширяя, тем самым, область научных изысканий [на запрос «контент-анализ» Springer Link выдает более 251 тысячи текстов, C, J]. Многообразие источников влияет на многообразие тем, приемов и концептуальных подходов, в том числе и в религиоведении. При этом работы затрагивают не только нарративные, но и видео, аудио, визуальные источники [см. к примеру, 3, G].
  В отечественной науке, как обычно, складывается иная ситуация: исследований, основанных на применении контент-анализа, очень мало. Метод используется в журналистике, социологии, психолингвистике, истории и маркетинговых работах [4, 5, 7, 9, 10, 11, 16], но, как утверждали Е.А.
 Каневский и Г.И. Саганенко: «ни одной монографической работы контент-анализу не было посвящено. В отдельных публикациях принципиального развития метод не получает… За два десятка лет появилось не более полудюжины статей, заслуживающих определенного внимания. С учебной литературой ситуация еще менее утешительная…» [8:1-2] К большому сожалению за десять лет, которые прошли с выхода статьи ситуация не изменилась [можно отметить только два хороших учебника по данной теме 6, 14].

  Подобная ситуация объясняется не столько существующей методологической сумятицей в гуманитарных науках, сколько прежде всего отсутствием достойного и доступного программного обеспечения для проведения контент-анализа, обработка же материалы «в ручную» трудоемкое и достаточно тяжелое занятие. Среди программ работающих с «русскоязычными» материалами стоит отметить:

- «
Content Analyzer» и «Site Content Analyzer» –условно бесплатные программы для проведения анализа web-сайтов, html-страниц, порталов и других гиперттекстовых материалов размещенных on- и of-line. Они индексируют содержимое Интернет-ресурса, выделяют частоту появления тех или иных единиц счета, создают META-теги, что позволяет роботами поисковикам вносить их в базы данных серверов. «Site Content Analyzer» позволяет создать графическую шкалу Q-сортировки. При работе с программами текст исследуемого источника следует не только перевести в электронный вид, но и отформатировать на языке Html. К недостатку обеих программ следует отнести получение результатов либо во внутреннем приложении («Content Analyzer»). «Content Analyzer» и «Site Content Analyzer» могут быть использованы на первоначальном этапах, при выделении единиц счета и анализе первичных данных [B, D].
- «
Wordstat» (не стоит путать с оригинальной программой «WordStat») - предоставляется в виде «as is» («как есть») и распространяется на условиях freeware. Она позволяет подсчитать, сколько раз то или иное слово встречается в выбранном тексте. Текст можно взять либо из простого текстового файла (*.txt), либо из файла гипертекста (*.htm или *.html). Результат работы сохраняется во внешний файл. У программы простые функции, которых хватает только на первом этапе работы [E].
- «
TACT» - одна из самых «древних» программ, работающая еще под системой DOS. Она была создана в одном из университетов Канады, русифицирована отечественным учеными и используется достаточно часто историками при изучении специфических текстов. Несмотря на «серьезный возраст» имеет достаточно много функций, однако, иногда, из-за проблем русификации дает сбои при работе [A]
- «
VAAL» («ВААЛ») - одна из самых известных отечественных программ контент-анализа. Совершает весь цикл работы с текстом, имеет множество дополнительных функций (в том числе фоносемантической оценки слов и текста, что было выделено в маркетинговой freeware программе «ВААЛ-мини») и позволяет создавать графические объекты. Описание всех функций программы можно посмотреть в книге автора ее создателя – В.И. Шалака [15] и на сайте [K]. Несмотря на научно-исследовательские работы [11, 12], чаще всего, как отмечают сами создатели «VAAL», она применяется в маркетинговых и политологических исследованиях, что объясняется главным недостатком программы - ее относительно высокой ценной (стоимость самого дешевого комплекта «VAAL» составляет 450 евро), что не позволяет ей получить более широкое распространение.

  В литературе можно обнаружить так же описание системы «ДИСКАНТ», которая была создана питерскими ученными, но, к сожалению, не удалось найти ее описание или сайт [8]. Несомненно, существует и другой софт для проведения контент-анализа, но информация по нему очень скудна и практически невозможно найти хотя бы демо или бета версии программ. Возникает риторический вопрос: каким программным продуктом пользуется отечественный ученый при использовании метода контент-анализа в ходе работы с тем или иным источником? К большому сожалению, авторы не указывают, что они применяли, поэтому очень часто приходится либо доверять автору, либо проверять его выводы «на уровне интуиции», либо сомневаться в полученных результатах. У нас нет ни гипотетической ни реальной возможности проверить данные, которые получил автор, что снова ставит под вопрос использование этого метода.

  На западном рынке софта для контент-анализа можно увидеть иную ситуацию – перечислим только ряд основных условно-бесплатных, бесплатных и платных программ: «PLCA», «KWALITAN», «CETA», «AQUAD», «WINMAX», «ТEXTPACK PC», «CATPAC», «CONCORDANCE», «
WordStat» и множество других [F, H, I].

  Итак, в отечественной науке нет хорошей методологической базы, мало прикладных работ и отсутствует доступное программное обеспечение, которое позволило бы применять метод контент-анализа. Стоит ли тогда ставить о вопрос о применении этого метода в религиоведческих исследованиях?
  Рассмотрим продуктивность контент-анализа на одном документе, при использовании только начальных этапов этого метода.

  С помощью одной программы (
Wordstat) был проведен предварительный анализ первых трех глав официальной программной доктрины РПЦ (МП) - «Основ социальной концепции Русской православной церкви»:

I.    Основные богословские положения.
II.
   Церковь и нация.
III.  Церковь и государство.

  Доктрина были переведена в формат *.txt, с которым работает программа. Был проведен анализ с условием: не накапливать сумму результатов, сортировка по алфавиту, количество словоформ в строку. На основании работы с программой была выявлена погрешность менее 0,5% от общего количества терминов. Полученные результаты представлены в таблице.

 

Таблица №1 Распределение словоформ

Словоформы

Глава I

Глава II

Глава III

Количество

946

1305

4825

Основные

Церковь

27

Народ

41

Государство

155

служение

22

нация

24

Церковь

142

мир

16

Церковь

18

Власть

89

Отечество

17

Общество

39

Отношения

21

   Какие выводы мы можем сделать по данным (первичным) результатам? В первой главе явно прослеживается взаимосвязь трех понятий «Церковь» - «служение» - «мир», но еще не понятно (без дополнительного анализа и на этом этапе) противопоставлены ли «Церковь» и «мир» или как их связывает термин «служение». Отметим, из полученных результатов не ясно, понимается ли под «миром» государство или же общество в целом. Если в первой главе, которая посвящена богословским основаниям деятельности РПЦ в обществе, термин «Церковь» доминирует, то в последующих двух главах он отходит на второй план.
  В главе
II термин «народ» является объектом размышлений в социальной доктрине, понятие «нация», по мнению авторов социальной концепции (что подтверждается и самим авторами в гл. II.1), вторично и имеет более широкую трактовку и размытые смысловые границы.
  В главе
III «Церковь и государство» смысловыми единицами являются понятия: «государство», «Церковь», «власть», «общество». В контексте социальных доктрин, государственные структуры и РПЦ имеют практически одинаковое статистическое значение, что подчеркивает их если не равноправное положение, то равноправное звучание.

  Хотя еще достаточно рано говорить об иерархичности терминов, статистическое значение повтора терминов символично и может послужить многогранной интерпретации. Триада «церковь – служение - мир» может трактоваться следующим образом:

1.                 церковь (РПЦ) находиться в «непрестанном» служении обществу;

2.                 основная социальная функция церкви – служение (помощь) обществу;

3.                 церковь связана с миром только служением.

  Термины второй главы могут свидетельствовать о том, что:

1.                 народ в частности, нация в целом и церковь составляют основу отечества;

2.                 народ является доминирующим элементом в церкви и отечестве;

3.                 народ и нация два разных понятия, объединенных через церковь в отечество.

  Подобную трактовку можно провести и с терминами главы III. Хотелось бы выделить только один аспект: простейшее прочтение статистической выборки позволяет трактовать взаимосвязь терминов следующим образом - государство и церковь обладают властью над обществом.
  Данные выводы частотного повтора можно проверить «в ручную».
  Во-первых, по формуле условных частот:

pr(c, t) = f(c, t)/ L(t)

где:

pr – условная частота (доли единиц по отношению к длине текста);
f –
частота встречаемости;
L – длина текста

  Во-вторых, введем среднестатистическую норму условной частоты.
  В-третьих, рассмотрим, насколько условная частота отличается от нормы по формуле:

pn(c, t) = pr(c, t) / nr (c, t)

где:

nr – норма характеристики.

  Формулы связи категорий применяться не будут, попытаемся ввести условные модели.
  Формула условных частот показала следующее распределение единиц:

 Таблица №2 Распределение условных частот.

Глава I

Глава II

Глава III

Всего слов

1

Всего слов

1

Всего слов

1

Церковь

0,028

Отечество

0,012

Государство

0,031

Мир

0,028

Церковь

0,013

Церковь

0,029

Служение

0,017

Нация

0,017

Власть

0,018

Народ

0,030

Общество

0,008

Отношения

0,004

 Распределение условных частот в тексте трех глав выглядит следующим образом:

 

  Непрерывность условных частот, таким образом, можно наблюдать только в главе три, что свидетельствует об их логической взаимосвязи. При этом, наблюдается доминирование понятий «государство» и «церковь» над термином «общество».
  На данный момент рано говорить о норме и устойчивом отличии ее от выявленных частот. Частота, которая проявила себя во всех трех главах – «церковь», ее норма составляет 0,023, при этом коэффициент отличия в двух случаях равен примерно 1,2 и только в одной главе составляет 0,6, что находится в рамках предела. Это позволяет предположить, что в последующих главах понятие «церковь» вряд ли будет ниже коэффициента 0,5, но можно допустить, что положение его будет варьироваться.
  Результаты обработки материалов с помощью компьютерной программы и обработка «в ручную» с помощью статистических формул, в принципе, совпадает, погрешность составляет менее 0,5%. Существующие отклонения трудно объяснить на данном этапе – либо это ошибки программного обеспечения либо человеческий фактор (невнимательность и «статистическая усталость»). Однако при использовании статистических формул, можно проследить те аспекты, которые при использовании простейшего софта не выявляются.
  Несомненно, метод контент-анализа, несмотря на всю свою сложность, позволяет исследователю взглянуть на источник с позиции статистической семантики и выявить те смыслы, которые хотя и могут быть вторичными, но существуют в текстах и скрыты изначально. Применение стандартных методов и методов количественных, как думается, следует объединять при изучении текстов, поскольку именно такой поход является наиболее продуктивным. Объектами внимания могут быть не только письменные источники, но аудио и видео материалы, визуальные объекты (например, иконы).
  Проблемы, которые возникают при работе с методом и которые уже озвучивались, осложняются так же еще двумя факторами. Во-первых, религиоведы, в большинстве случаев, имеют гуманитарный профиль, и работать с математическими методами, им очень сложно. Во-вторых, большинство гуманитариев не могут сами создавать и/или адаптировать программное обеспечение, поэтому подчас приходится привлекать сторонних специалистов, что усложняет и, порой, удорожает, работу исследователя. Впрочем, и первое препятствие, и второе легко можно преодолеть еще на начальных этапах подготовки религиоведов. Внедрение новых информационных технологий в исследования – одна из главных задач развития религиоведения.

 

Литература

 1. Krippendorff K. An Examination of Content Analysis: A Proposal for a Framework and an Information Calculus for Message Analytic Situations, Ph.D. Dissertation, Urbana, 1967.
2.
  Krippendorff K. Content Analysis: An Introduction to its Methodology, Beverly Hills CA, 1980.
3.
  Maguire B., Georgie Ann Weatherby G.A.The secularization of religion and television commercials // Sociology of Religion, Summer, 1998
4.
  Алексеев А.К, Дудченко B.C. Контент-анализ как специфический способ «прочтения» текстов // Смысловое восприятие речевого сообщения (в условиях массовой коммуникации). М., 1976.
5.
 Алексеев А.Н. Метод Жака Кейзера. Из опыта исследований французской ежедневной прессы // Проблемы современной зарубежной печати. Л., 1969.
6.
   Богомолова Н.Н., Стефаненко Т.Г. Контент-анализ. Спецпрактикум по социальной психологии. М., 1992.
7.
   Жукова Я. Возможности контент-анализа рекламных и PR-материалов // Практический маркетинг. №4, 1997, С. 3-4.
8.
   Каневский Е.А., Саганенко Г.И. Концептуальное обоснование компьютерного анализа массивов с текстами // Социология, 1997, №9. С. 1-8.
9.
   Методологические и методические проблемы контент-анализа. Тезисы докладов рабочего совещания социологов. Вып. 1.; вып. 2. М., Л., 1973.
10.
Проблемы контент-анализа в социологии // Мат-лы Сибирского семинара социологов. Новосибирск, 1970.
11.
Проблемы психологии дискурса / Отв.ред. Н.Д. Павлова, И.Д. Зачесова. – М., 2005.
12.
Психологические исследования дискурса. Сборник научных трудов / Отв.ред. Н.Д. Павлова. М., 2002.
13.
 Семенов В.Е. Метод изучения документов в социально-психологических исследованиях. Л., 1983.
14.
Федотова Л.Н. Контент-аналитические исследования средств массовой информации и пропаганды. Учебно-метод. пособие. М., 1988.
15.
Шалак В.И. Контент-анализ. Приложения в области: политологии, психологии, социологии культурологи, экономики, рекламы. М., 2004.
16.
Манекин Р.В. Контент-анализ как метод исторического исследования // /«Клио». Международный ежеквартальный научно-исторический журнал Донецкого отделения Советской Ассоциации Молодых Историков и Агентства «Информсервис», №2 от 01.05.1991. С. 30-36.

 Интернет-ресурсы

A.               http://www.chass.utoronto.ca/cch/tact.html

B.                http://www.sitecontentanalyzer.com/index-rus.html

C.               http://www.springerlink.com/content/?k=content+analysis

D.               http://www.agcproduct.com/

E.                http://dubinsky.ru/

F.                http://academic.csuohio.edu/kneuendorf/content/cpuca/ccap.htm

G.               http://www.lboro.ac.uk/research/mmethods/resources/analysis/ca_software.html

H.               http://www.apb.cwc.net/homepage.htm

I.                 http://www.provalisresearch.com/wordstat/wordstat.html

J.                http://academic.csuohio.edu/kneuendorf/content/

K.               http://www.vaal.ru

L.               http://www.asc.upenn.edu/usr/krippendorff/

 

 Связаться с автором по электронной почте Перейти к обсуждению доклада

Секции > Компьютерные технологии в религиоведении  > Контент-анализ в религиоведческих исследованиях

 
 
 
 
 
 
 
 

Главная     Участникам     Докладчики     Секции     Обсуждение     Контакты     Ссылки   

 


© Московское религиоведческое общество, 2007.
© Коллектив авторов, 2007.
 

Московское религиоведческое общество Философский факультет МГУ имени М.В. Ломоносова Молодежная ассоциация религиоведов (Киев, Украина) Научное общество студентов, аспирантов и молодых ученых (Санкт-Петербург) Центр религиоведческих исследований «Этна» (Санкт-Петербург, Россия)