Вычислительная социальная наука, что это и почему это важно

Цифровизация гуманитарных наук затрагивает всё большие области познания, в том числе и социологические науки, в связи с этим, появляются и развиваются новые направления исследований, получившие название вычислительные социальные науки (computational social science).

Вычислительная социальная наука, что это и почему это важно
На этом рисунке представлена структура связей в сообществе политических блогов (за 2004 год), где красные узлы обозначают консервативные блоги, а синие — либеральные.
Lazer D, et al. Computational social science. Science (80-) 2009;323:721–723. doi: 10.1126/science.1167742.

Все большая часть человеческого взаимодействия оставляет после себя огромный цифровой след. Его изучение позволяет нам получить беспрецедентное представление о том, что такое общество и как оно работает, включая его запутанные социальные сети, которые долгое время оставались непонятными.

Вычислительные мощности позволяют нам обнаруживать скрытые закономерности с помощью таких аналитических инструментов, как глубокое обучение и обработка естественного языка. Наконец, компьютерные симуляции позволяют нам исследовать гипотетические ситуации, которые, возможно, даже не существуют в реальности, но которые мы хотели бы проверить. Если просмотреть ведущие научные журналы по экономике, социологии и политологии, то можно обнаружить минимум свидетельств зарождения вычислительной социальной науки, занимающейся количественным моделированием этих новых видов цифровых следов. Тем не менее, вычислительная социология имеет место, причем в больших масштабах, в таких местах, как Google, Yahoo.( Lazer D1, Pentland A, Adamic L, Aral S, Barabasi AL, Brewer D, Christakis N, Contractor N, Fowler J, Gutmann M, Jebara T, King G, Macy M, Roy D, Van Alstyne M Social science. Computational social science. ) Вычислительная социальная наука может легко стать почти исключительным доменом частных компаний и правительственных агентств.

Перспективы больших данных для социальных наук заключаются в том, что поведение людей все чаще оставляет цифровые следы, которые можно собирать и анализировать, чтобы делать выводы об этом поведении. Дорогостоящие коллекции данных заменяются недорогими «найденными» данными, а выборка может быть заменена анализом N = All. Цифровые следы могут быть намеренными, например, сообщения в ВКонтакте или Одноклассниках или обсуждения в дискуссионных списках Интернета. Многие следы являются непреднамеренными: мобильные телефоны предоставляют информацию о местоположении; телефонные звонки в целом отслеживаются провайдерами, которые хранят данные о местоположении, кто кому звонит и продолжительности звонка. Все эти следы поведения можно собирать и анализировать.

Одним из методов анализа больших данных является машинное обучение с учителем.  Одно из ключевых отличий аналитики машинного обучения от обычной статистики социальных наук заключается в том, что в ней сильный акцент делается на прогнозировании новых данных. В статистике социальных наук акцент делается на моделировании имеющихся данных как можно лучше, используя модель, которая имеет явную и достаточно простую структуру, например, модель структурных уравнений. Модели машинного обучения не обязательно являются регрессионными моделями, они также могут быть сформулированы как набор правил, которые преобразуют независимые переменные определенным образом для получения прогнозируемых результатов. Поскольку эти правила преобразования являются явными, им можно дать содержательную интерпретацию, в отличие от ситуации в нейронных сетях, где система прогнозирования представляет собой «черный ящик», поскольку правила неизвестны.

Hox, J. J. Computational social science methodology, anyone? Methodology: European Journal of Research Methods for the Behavioral and Social Sciences.
Hox, J. J. Computational social science methodology, anyone? Methodology: European Journal of Research Methods for the Behavioral and Social Sciences.

Методы, используемые для прогнозирования, были разработаны в контексте больших наборов данных с большим количеством переменных. Большинство моделей явно или неявно исследуют нелинейные эффекты и взаимодействия, а в аналитике больших данных, как правило, используется также выбор переменных-предсказателей.

Методы использования имитационных моделей так же могут быть использованы для социологических исследований. В методологии социальных наук и статистике под имитацией обычно понимается статистическое моделирование. В статистическом моделировании данные генерируются в соответствии с определенной моделью, с некоторым нарушением допущений метода оценки.

Генерируется большое количество наборов данных, оценки параметров суммируются и сравниваются с известными параметрами популяции, чтобы выяснить, в какой степени нарушения допущений приводят к недостоверным результатам. В вычислительной социальной науке под имитацией обычно понимается имитация на основе моделей или имитация на основе агентов. При моделировании на основе моделей компьютерная модель задается для представления сложной системы с помощью большого набора уравнений и правил. Такие модели понимаются как более простые, чем система, которую они имитируют, но достаточно сложные, чтобы быть полезными для прогнозирования и понимания. (Hox, J. J. Computational social science methodology, anyone? Methodology: European Journal of Research Methods for the Behavioral and Social Sciences.)

Агентное моделирование помещает виртуальных агентов в созданную компьютером среду и позволяет этим агентам взаимодействовать в соответствии с определенными правилами. Агентное моделирование часто используется для изучения того, как индивидуальные правила поведения и взаимодействия между отдельными агентами приводят к закономерностям на макроуровне. Простой целью агентного моделирования является прогнозирование, например, когда моделируется поведение большого количества автомобилей, чтобы предсказать, когда и где образуются пробки. Более важной целью социальных наук является использование агентного моделирования для понимания социальных систем. Очень ранним примером агентного моделирования является программа ALDOUS Джона Лоэлина. ( Loehlin, J. C. “Interpersonal” experiments with a computer model of personality. Journal of Personality and Social Psychology, 2, 580–584.) Программа реагировала на стимулы, которые различались по своим значениям атрибутов влечения, гнева и страха. Джон Лоэлин создал программу, в которой две копии персонажа взаимодействовали в единой компьютерной среде. Значения двух персонажей по трем атрибутам были подвергнуты экспериментальному манипулированию. По словам Джона Лоэлина, последовательности взаимодействия были удивительно разнообразны и имели некоторое сходство с человеческим поведением. Этот ранний пример имеет все элементы агент-ориентированной симуляции. Есть несколько агентов, агенты имеют различные атрибуты и реагируют друг на друга в серии столкновений. Даже эта очень простая симуляция дала результаты, которые не были полностью предсказуемы системой, основанной на правилах.

Дилемма заключенного.
Дилемма заключенного.

Более сложным примером агент-ориентированного моделирования является работа Роберта Аксельрода. Аксельрод изучает, как может развиваться сотрудничество, если существует конкуренция за ресурсы и нет центральной власти, принуждающей к сотрудничеству. Центральным инструментом в исследовании Аксельрода является игра «дилемма заключенного». Есть два игрока, и у каждого есть выбор между сотрудничеством и дезертирством. Если оба игрока сотрудничают, они оба выигрывают. Если оба игрока дезертируют, они оба проигрывают. Если один из игроков сотрудничает, а другой дезертирует, то сотрудничающий игрок проигрывает, а дезертирующий игрок выигрывает. В этой игре дезертирство всегда лучше, чем сотрудничество. Дилемма заключается в том, что если оба игрока дезертируют, то они оба проигрывают, причем хуже, чем если бы оба сотрудничали. Аксельрод предполагает, что если оба игрока взаимодействуют только один раз, то они оба будут дезертировать. Однако при непрерывном взаимодействии, итерированной дилемме заключенного, существует возможность развития сотрудничества, поскольку в долгосрочной перспективе оба игрока выиграют от этой стратегии. Чтобы исследовать это, Аксельрод организовал компьютерный турнир для оценки эффективных стратегий. Теоретикам игр было предложено прислать стратегии для итерированной дилеммы заключенного. Каждая заявка сталкивалась со всеми другими заявками на 200 итерационных встреч, плюс копия себя и случайная ответная заявка. Весь турнир повторялся пять раз, чтобы получить более стабильные оценки коэффициента успешности каждой заявки. В турнирах участвовали 14 игроков, 120 000 ходов и 240 000 отдельных вариантов. ( Axelrod, R. (1984). The evolution of cooperation. New York, NY: Basic Books. )

В итоге явным победителем стала партия под названием Tit-For-Tat. Тит-Фор-Тат сотрудничает на первом ходу и впоследствии отвечает взаимностью на все действия другого игрока на последнем ходу. Против сотрудничающего соперника Тит-Фор-Тат всегда будет сотрудничать, а против соперника, который сотрудничает, он будет дезертировать. После первого турнира результаты были опубликованы, и был проведен второй турнир. Тит-Фор-Тат снова победил. При более детальном анализе стало ясно, что «хорошие» стратегии хорошо работают, вызывая сотрудничество со стороны других «хороших» стратегий.

Моделирование Аксельрода на основе агентов положило начало целому ряду исследований, изучающих условия, способствующие эволюции сотрудничества, некоторые из них основаны на дальнейших симуляциях, другие изучают, насколько реалистичны эти симуляции.

Мы перечислили лишь малое количество методов, которые можно заимствовать из науки о данных в социологию и малое количество методов, которые социология может привнести при использовании больших массивов данных. Главной же идеей данной работы является симбиоз двух дифференцированных дисциплин. Новые методы и гипотезы, которые они могут привнести друг другу.

 

Источник

Читайте также