Вестник Балтийского федерального университета им. И. Канта. Серия: филология, педагогика, психология

2024 Выпуск №4

Назад к списку Скачать статью

Метод выделения сюжетных линий, основанный на анализе ономастикона литературного произведения

DOI
10.5922/vestnikpsy-2024-4-5
Страницы / Pages
47-60

Аннотация

Одной из отраслей цифровых гуманитарных исследований является анализ структуры литературных произведений. Среди направлений исследований такого рода наиболее популярно создание социальной сети взаимодействия персонажей. Другую важную задачу составляет анализ структуры произведения, выделение фабульных единиц, их сравнение между собой. В статье предложен количественный метод выделения сюжетных линий, основанный на анализе употребления имен персонажей и названий локаций. В качестве единицы анализа используется авторское разделение текста на главы как наиболее адекватно выражающее общий замысел. Метод основан на поиске пересечений ономастиконов глав, пересечение оценивается с использованием коэффициента Дайса. Наличие метрики позволяет построить граф связности глав, из которого при помощи Лувенского алгоритма можно извлечь наиболее связанные фрагменты. Метод апробирован на материале текста романа М. А. Булгакова «Мастер и Маргарита». В первую очередь сюжетная линия Иешуа и Пилата в Ершалаиме была отделена от событий в Москве. Московские события разделены на три подсюжета: история массолитовцев и их отношения с мастером, московское Варьете и его сотрудники, история Маргариты. История Воланда и его свиты оказалась плотно связана с другими сюжетами и не выделилась в самостоятельный фрагмент.


Список литературы

1. Пропп В. Я. Морфология сказки. М., 1969.

2. Moretti F. Conjectures on World Literature // New Left Review. 2000. № 1. Р. 54—68.

3. Moretti F. Graphs, Maps, Trees: Abstract Models for Literary History. L., 2005.

4. Цифровые гуманитарные исследования : монография. Красноярск, 2023.

5. Moretti F. Network theory, plot analysis // New Left Review. 2011. № 68. Р. 80—102.

6. Bonch-Osmolovskaya A., Skorinkin D., Pavlova I. et al. Tolstoy semanticized: Constructing a digital edition for knowledge discovery // Journal of Web Semantics. 2019. Vol. 59 (2). Аrt. № 100483.

7. Северина Е. М. Бонч-Осмоловская А. А., Кудин А. М. Цифровые филологические практики: проект «Chekhov Digital» // Актуальные проблемы филологии и педагогической лингвистики. 2022. № 2. С. 153—165. doi: 10.1016/j.websem.2018.12.001.

8. Lee J., Yeung C. Y. Extracting Networks of People and Places from Literary Texts // Proceedings of the 26th Pacific Asia Conference on Language, Information, and Computation / ed. by R. Manurung, F. Bond. Faculty of Computer Science, Universitas Indonesia, 2012. P. 209—218.

9. Li H., Srihari R. K., Niu C., Li W. Location normalization for information extraction // COLING 2002: The 19th International Conference on Computational Linguistics. 2002. URL: https://aclanthology.org/C02-1127 (дата обращения: 01.05.2024).

10. Purves R. S., Clough P., Jones C. B. et al. The design and implementation of SPIRIT:
a spatially aware search engine for information retrieval on the Internet // International Journal of Geographical Information Science. 2007. Vol. 21 (7). Р. 717—745. doi: 10.1080/13658810601169840.

11. Jones C. B., Purves R. S. Geographical information retrieval // International Journal of Geographical Information Science. 2008. № 22 (3). Р. 219—228.

12. Marazzato R., Sparavigna A. C. Extracting Networks of Characters and Places from Written Works with CHAPLIN // ArXiv. URL: https://arxiv.org/abs/1402.4259 (дата обращения: 10.05.2024).

13. Rhody L. M. Topic Modeling and Figurative Language // Journal of Digital Humanities. 2012. Vol. 2 (1). URL: http://journalofdigitalhumanities.org/2-1/topic-modeling-and-figurative-language-by-lisa-m-rhody/ (дата обращения: 10.05.2024).

14. Митрофанова О. А. Вероятностное моделирование тематики русскоязычных корпусов текстов с использованием компьютерного инструмента GenSim // Корпусная лингвистика — 2015 : тр. междунар. конф. СПб., 2015. С. 332—343.

15. Mitrofanova O. A., Sedova A. G. Topic Modelling in Parallel and Comparable Fiction Texts (the case study of English and Russian prose) // Information Technology and Computational Linguistics (ITCL-2017). Association for Computing Machinery, 2017.

16. Митрофанова О. А. Исследование структурной организации художественного произведения с помощью тематического моделирования: опыт работы с текстом романа «Мастер и Маргарита» М. А. Булгакова. // Корпусная лингвистика — 2019 : тр. междунар. конф. СПб., 2019. С. 387—394.

17. Zykova V. I., Klyshinsky E. S. Remus, Lupin and Moony Walk in a Bar… Grouping of Proper Names Related to the Same Denotation in Large Literary Texts Collections // Computational Linguistics and Intellectual Technologies : Proceedings of the International Conference «Dialogue 2023». URL: https://www.dialog-21.ru/media/5882/zykovaviplusklyshinskyes105.pdf (дата обращения: 10.05.2024).

18. Blondel V. D., Guillaume J.-L., Lambiotte R., Lefebvre E. Fast unfolding of communities in large networks // Journal of Statistical Mechanics: Theory and Experiment. 2008. Vol. 10. Art. № P10008. doi: 10.1088/1742-5468/2008/10/P10008.

19. Вулис А. З. Роман М. А. Булгакова «Мастер и Маргарита». М., 1991.