|
КОНТЕНТ-АНАЛИЗ В
РЕЛИГИОВЕДЧЕСКИХ ИССЛЕДОВАНИЯХ
Фолиева Татьяна Александровна
научный сотрудник
АНО «Независимый
научно-исследовательский центр»
tatiana_folieva@yahoo.com
Контент-анализ – это статистическая семантика,
которая позволяет выявить частоту появления терминов и определить их характеристику
во внеязыковой реальности.
Процедура контент-анализа включает в себя:
1.
определение
смысловых единиц;
2.
определение
единиц счета;
3.
классификация
терминов;
4.
интерпретация.
Все эти этапы контент-анализа должны
базироваться на рабочей программе, которая разрабатывается по стандартным
правилам прикладного статистического исследования.
В зарубежной науке метод контент-анализа
применяется достаточно часто в гуманитарных и общественных науках.
Разработанные, Клаусом Криппендорфом еще в 1967 году [1, 2,
L], принципы
позволяют провести анализ, как печатных источников, так и аудио, видео,
телевизионных материалов, произведений искусства, расширяя, тем самым, область
научных изысканий [на запрос «контент-анализ»
Springer Link выдает более 251
тысячи текстов, C,
J].
Многообразие источников влияет на многообразие тем, приемов и концептуальных
подходов, в том числе и в религиоведении. При этом работы затрагивают не только
нарративные, но и видео, аудио, визуальные источники [см. к примеру, 3,
G].
В отечественной науке, как обычно, складывается
иная ситуация: исследований, основанных на применении контент-анализа, очень
мало. Метод используется в журналистике, социологии, психолингвистике, истории и
маркетинговых работах [4, 5, 7, 9, 10, 11, 16], но, как утверждали Е.А. Каневский
и Г.И. Саганенко: «ни одной монографической работы контент-анализу не было
посвящено. В отдельных публикациях принципиального развития метод не получает…
За два десятка лет появилось не более полудюжины статей, заслуживающих
определенного внимания. С учебной литературой ситуация еще менее утешительная…»
[8:1-2] К большому сожалению за десять лет, которые прошли с выхода статьи
ситуация не изменилась [можно отметить только два хороших учебника по данной
теме 6, 14].
Подобная ситуация объясняется не столько
существующей методологической сумятицей в гуманитарных науках, сколько прежде
всего отсутствием достойного и доступного программного обеспечения для
проведения контент-анализа, обработка же материалы «в ручную» трудоемкое и
достаточно тяжелое занятие. Среди программ работающих с «русскоязычными»
материалами стоит отметить:
- «Content Analyzer»
и «Site Content Analyzer»
–условно бесплатные программы для проведения анализа
web-сайтов,
html-страниц,
порталов и других гиперттекстовых материалов размещенных
on- и
of-line.
Они индексируют содержимое Интернет-ресурса, выделяют частоту появления тех или
иных единиц счета, создают META-теги,
что позволяет роботами поисковикам вносить их в базы данных серверов. «Site
Content Analyzer» позволяет создать графическую
шкалу Q-сортировки.
При работе с программами текст исследуемого источника следует не только
перевести в электронный вид, но и отформатировать на языке
Html. К
недостатку обеих программ следует отнести получение результатов либо во
внутреннем приложении («Content
Analyzer»). «Content
Analyzer» и «Site
Content Analyzer» могут быть использованы на
первоначальном этапах, при выделении единиц счета и анализе первичных данных [B,
D].
- «Wordstat»
(не стоит путать с оригинальной программой «WordStat»)
- предоставляется в виде «as is»
(«как есть») и распространяется на условиях
freeware. Она позволяет подсчитать,
сколько раз то или иное слово встречается в выбранном тексте. Текст можно взять
либо из простого текстового файла (*.txt), либо из файла гипертекста (*.htm или
*.html). Результат работы сохраняется во внешний файл. У программы простые
функции, которых хватает только на первом этапе работы [E].
- «TACT» -
одна из самых «древних» программ, работающая еще под системой
DOS. Она была
создана в одном из университетов Канады, русифицирована отечественным учеными и
используется достаточно часто историками при изучении специфических текстов.
Несмотря на «серьезный возраст» имеет достаточно много функций, однако, иногда,
из-за проблем русификации дает сбои при работе [A]
- «VAAL»
(«ВААЛ») - одна из самых известных отечественных программ контент-анализа.
Совершает весь цикл работы с текстом, имеет множество дополнительных функций (в
том числе фоносемантической оценки слов и текста, что было выделено в
маркетинговой freeware
программе «ВААЛ-мини») и позволяет создавать графические объекты. Описание всех
функций программы можно посмотреть в книге автора ее создателя – В.И. Шалака
[15] и на сайте [K].
Несмотря на научно-исследовательские работы [11, 12], чаще всего, как отмечают
сами создатели «VAAL»,
она применяется в маркетинговых и политологических исследованиях, что
объясняется главным недостатком программы - ее относительно высокой ценной
(стоимость самого дешевого комплекта «VAAL»
составляет 450 евро), что не позволяет ей получить более широкое
распространение.
В литературе можно обнаружить так же описание
системы «ДИСКАНТ», которая была создана питерскими ученными, но, к сожалению, не
удалось найти ее описание или сайт [8]. Несомненно, существует и другой софт для
проведения контент-анализа, но информация по нему очень скудна и практически
невозможно найти хотя бы демо или бета версии программ. Возникает риторический
вопрос: каким программным продуктом пользуется отечественный ученый при
использовании метода контент-анализа в ходе работы с тем или иным источником? К
большому сожалению, авторы не указывают, что они применяли, поэтому очень часто
приходится либо доверять автору, либо проверять его выводы «на уровне интуиции»,
либо сомневаться в полученных результатах. У нас нет ни гипотетической ни
реальной возможности проверить данные, которые получил автор, что снова ставит
под вопрос использование этого метода.
На западном рынке софта для контент-анализа
можно увидеть иную ситуацию – перечислим только ряд основных условно-бесплатных,
бесплатных и платных программ: «PLCA», «KWALITAN», «CETA», «AQUAD», «WINMAX», «ТEXTPACK
PC», «CATPAC», «CONCORDANCE», «WordStat»
и множество других [F,
H,
I].
Итак, в отечественной науке нет хорошей
методологической базы, мало прикладных работ и отсутствует доступное программное
обеспечение, которое позволило бы применять метод контент-анализа. Стоит ли
тогда ставить о вопрос о применении этого метода в религиоведческих
исследованиях?
Рассмотрим продуктивность контент-анализа на
одном документе, при использовании только начальных этапов этого метода.
С помощью одной программы (Wordstat)
был проведен предварительный анализ первых трех глав официальной программной
доктрины РПЦ (МП) - «Основ социальной концепции Русской православной церкви»:
I.
Основные богословские положения.
II.
Церковь и нация.
III. Церковь и государство.
Доктрина были переведена в формат *.txt,
с которым работает программа. Был проведен анализ с условием: не накапливать
сумму результатов, сортировка по алфавиту, количество словоформ в строку. На
основании работы с программой была выявлена погрешность менее 0,5% от общего
количества терминов. Полученные результаты представлены в таблице.
Таблица №1 Распределение словоформ
|
Словоформы |
Глава
I |
Глава
II |
Глава
III |
|
Количество |
946 |
1305 |
4825 |
|
Основные |
Церковь |
27 |
Народ |
41 |
Государство |
155 |
|
служение |
22 |
нация |
24 |
Церковь |
142 |
|
мир |
16 |
Церковь |
18 |
Власть |
89 |
|
Отечество |
17 |
Общество |
39 |
|
Отношения |
21 |
Какие
выводы мы можем сделать по данным (первичным) результатам? В первой главе явно
прослеживается взаимосвязь трех понятий «Церковь» - «служение» - «мир», но еще
не понятно (без дополнительного анализа и на этом этапе) противопоставлены ли
«Церковь» и «мир» или как их связывает термин «служение». Отметим, из полученных
результатов не ясно, понимается ли под «миром» государство или же общество в
целом. Если в первой главе, которая посвящена богословским основаниям
деятельности РПЦ в обществе, термин «Церковь» доминирует, то в последующих двух
главах он отходит на второй план.
В главе
II термин «народ» является объектом
размышлений в социальной доктрине, понятие «нация», по мнению авторов социальной
концепции (что подтверждается и самим авторами в гл.
II.1), вторично и имеет более
широкую трактовку и размытые смысловые границы.
В главе
III «Церковь и государство»
смысловыми единицами являются понятия: «государство», «Церковь», «власть»,
«общество». В контексте социальных доктрин, государственные структуры и РПЦ
имеют практически одинаковое статистическое значение, что подчеркивает их если
не равноправное положение, то равноправное звучание.
Хотя еще достаточно рано говорить об
иерархичности терминов, статистическое значение повтора терминов символично и
может послужить многогранной интерпретации. Триада «церковь – служение - мир»
может трактоваться следующим образом:
1.
церковь (РПЦ) находиться в «непрестанном»
служении обществу;
2.
основная социальная функция
церкви – служение (помощь) обществу;
3.
церковь связана с миром
только служением.
Термины
второй главы могут свидетельствовать о том, что:
1.
народ в частности, нация в целом и церковь
составляют основу отечества;
2.
народ является доминирующим
элементом в церкви и отечестве;
3.
народ и нация два разных
понятия, объединенных через церковь в отечество.
Подобную трактовку можно провести и с терминами главы
III. Хотелось бы выделить только
один аспект: простейшее прочтение статистической выборки позволяет трактовать
взаимосвязь терминов следующим образом - государство и церковь обладают властью
над обществом.
Данные выводы частотного повтора можно
проверить «в ручную».
Во-первых, по формуле условных частот:
pr(c,
t) =
f(c,
t)/
L(t)
где:
pr
– условная частота (доли единиц по отношению к длине текста);
f – частота встречаемости;
L – длина
текста
Во-вторых, введем среднестатистическую норму условной частоты.
В-третьих, рассмотрим, насколько условная
частота отличается от нормы по формуле:
pn(c, t) = pr(c, t) /
nr (c, t)
где:
nr
– норма характеристики.
Формулы
связи категорий применяться не будут, попытаемся ввести условные модели.
Формула условных частот показала следующее
распределение единиц:
Таблица
№2 Распределение условных частот.
|
Глава I |
Глава II |
Глава III |
|
Всего
слов |
1 |
Всего
слов |
1 |
Всего
слов |
1 |
|
Церковь |
0,028 |
Отечество |
0,012 |
Государство |
0,031 |
|
Мир |
0,028 |
Церковь |
0,013 |
Церковь |
0,029 |
|
Служение |
0,017 |
Нация |
0,017 |
Власть |
0,018 |
|
Народ |
0,030 |
Общество |
0,008 |
|
Отношения |
0,004 |
Распределение условных частот в тексте
трех глав выглядит следующим образом:

Непрерывность
условных частот, таким образом, можно наблюдать только в главе три, что
свидетельствует об их логической взаимосвязи. При этом, наблюдается
доминирование понятий «государство» и «церковь» над термином «общество».
На данный момент рано говорить о норме и
устойчивом отличии ее от выявленных частот. Частота, которая проявила себя во
всех трех главах – «церковь», ее норма составляет 0,023, при этом коэффициент
отличия в двух случаях равен примерно 1,2 и только в одной главе составляет 0,6,
что находится в рамках предела. Это позволяет предположить, что в последующих
главах понятие «церковь» вряд ли будет ниже коэффициента 0,5, но можно
допустить, что положение его будет варьироваться.
Результаты обработки материалов с помощью
компьютерной программы и обработка «в ручную» с помощью статистических формул, в
принципе, совпадает, погрешность составляет менее 0,5%. Существующие отклонения
трудно объяснить на данном этапе – либо это ошибки программного обеспечения либо
человеческий фактор (невнимательность и «статистическая усталость»). Однако при
использовании статистических формул, можно проследить те аспекты, которые при
использовании простейшего софта не выявляются.
Несомненно, метод контент-анализа, несмотря на
всю свою сложность, позволяет исследователю взглянуть на источник с позиции
статистической семантики и выявить те смыслы, которые хотя и могут быть
вторичными, но существуют в текстах и скрыты изначально. Применение стандартных
методов и методов количественных, как думается, следует объединять при изучении
текстов, поскольку именно такой поход является наиболее продуктивным. Объектами
внимания могут быть не только письменные источники, но аудио и видео материалы,
визуальные объекты (например, иконы).
Проблемы, которые возникают при работе с
методом и которые уже озвучивались, осложняются так же еще двумя факторами.
Во-первых, религиоведы, в большинстве случаев, имеют гуманитарный профиль, и
работать с математическими методами, им очень сложно. Во-вторых, большинство
гуманитариев не могут сами создавать и/или адаптировать программное обеспечение,
поэтому подчас приходится привлекать сторонних специалистов, что усложняет и,
порой, удорожает, работу исследователя. Впрочем, и первое препятствие, и второе
легко можно преодолеть еще на начальных этапах подготовки религиоведов.
Внедрение новых информационных технологий в исследования – одна из главных задач
развития религиоведения.
Литература
1. Krippendorff
K. An Examination of Content
Analysis: A Proposal for a Framework and an Information Calculus for Message
Analytic Situations, Ph.D. Dissertation, Urbana,
1967.
2. Krippendorff
K. Content Analysis:
An Introduction to its Methodology, Beverly Hills CA,
1980.
3. Maguire
B., Georgie Ann Weatherby G.A.The
secularization of religion and television commercials //
Sociology of Religion, Summer, 1998
4.
Алексеев А.К, Дудченко B.C.
Контент-анализ как специфический способ «прочтения» текстов // Смысловое
восприятие речевого сообщения (в условиях массовой коммуникации). М., 1976.
5.
Алексеев А.Н.
Метод Жака Кейзера. Из опыта исследований французской ежедневной прессы //
Проблемы современной зарубежной печати. Л., 1969.
6.
Богомолова Н.Н.,
Стефаненко Т.Г. Контент-анализ. Спецпрактикум по социальной психологии. М.,
1992.
7.
Жукова
Я. Возможности контент-анализа рекламных и PR-материалов // Практический
маркетинг. №4, 1997, С. 3-4.
8.
Каневский Е.А., Саганенко Г.И.
Концептуальное обоснование компьютерного анализа массивов с текстами //
Социология, 1997, №9. С. 1-8.
9.
Методологические и методические проблемы
контент-анализа. Тезисы докладов рабочего совещания социологов. Вып. 1.; вып. 2.
М., Л., 1973.
10.
Проблемы контент-анализа в социологии //
Мат-лы Сибирского семинара социологов. Новосибирск, 1970.
11.
Проблемы психологии дискурса / Отв.ред.
Н.Д. Павлова, И.Д. Зачесова. – М., 2005.
12.
Психологические исследования дискурса.
Сборник научных трудов / Отв.ред. Н.Д. Павлова. М., 2002.
13. Семенов
В.Е. Метод изучения документов в социально-психологических исследованиях. Л.,
1983.
14.
Федотова Л.Н.
Контент-аналитические исследования средств массовой информации и
пропаганды. Учебно-метод. пособие. М., 1988.
15.
Шалак В.И.
Контент-анализ. Приложения в
области: политологии, психологии, социологии культурологи, экономики, рекламы.
М., 2004.
16.
Манекин Р.В. Контент-анализ как метод
исторического исследования // /«Клио». Международный ежеквартальный
научно-исторический журнал Донецкого отделения Советской Ассоциации Молодых
Историков и Агентства «Информсервис», №2 от 01.05.1991. С. 30-36.
Интернет-ресурсы
A.
http://www.chass.utoronto.ca/cch/tact.html
B.
http://www.sitecontentanalyzer.com/index-rus.html
C.
http://www.springerlink.com/content/?k=content+analysis
D.
http://www.agcproduct.com/
E.
http://dubinsky.ru/
F.
http://academic.csuohio.edu/kneuendorf/content/cpuca/ccap.htm
G.
http://www.lboro.ac.uk/research/mmethods/resources/analysis/ca_software.html
H.
http://www.apb.cwc.net/homepage.htm
I.
http://www.provalisresearch.com/wordstat/wordstat.html
J. http://academic.csuohio.edu/kneuendorf/content/
K.
http://www.vaal.ru
L.
http://www.asc.upenn.edu/usr/krippendorff/
|
|