Розробка моделі системи уникнення ефекту «бульбашки» в соціальних мережах

Заголовок (англійською): 
Model development of the system for avoiding echo chambers in social networks
Автор(и): 
Стецик О. А.
Теренчук C. А.
Автор(и) (англ): 
Stetsyk, O.
Terenchuk, S.
Ключові слова (укр): 
алгоритм K-середніх; соціальна бульбашка; Kafka; кластеризація; масштабованість; PostgreSQL; рекурентна нейронна мережа
Ключові слова (англ): 
clusterization; echo chambers; Kafka; K-means; PostgreSQL; recurrent neural network; scalability
Анотація (укр): 
У статті розглянуто можливості сучасних соціальних медіа та проблем, що з’являються в процесі розвитку соціальних мереж. Фокус дослідження спрямовано на ефект «бульбашки» в різних соціальних мережах. З’ясовано, що ефект «бульбашки» є результатом роботи глибинної нейронної мережі, яка аналізує інтереси і пріоритет кожного користувача соціальної мережі, перевіряє інші подібні публікації та пріоритети інших користувачів, після чого формує «коло» однодумців для кожного користувача. Таким чином в соціальних мережах з’являються кластери користувачів, які мають однакову думку щодо суперечливої теми. «Соціальні бульбашки» з’являються, коли кількість з'єднань між користувачами одного кластера величезна, а з’єднання між користувачами різних кластерів рідкісні. Отже, основним недоліком стандартного алгоритму генерації контенту є добірка лише публікацій і коментарів, що підтримують позицію користувача. Метою дослідження є архітектура програмного забезпечення для вирішення проблеми «бульбашки» у високонавантажених соціальних мережах у реальному часі. Основна ідея полягала в кластеризації думок у суперечливих темах і включення у вміст контенту користувача думок користувачів з різних кластерів. Дані щодо суперечливих тем збираються з новин, наукових статей, публікацій і коментарів із хеш тегами. Зібрані теми кластеризуються за допомогою алгоритму K-середніх. Для знаходження оптимальної кількості кластерів використовується метод «ліктя». Потім у різних кластерах користувачів розміщуються тексти з різними думками щодо певних тем. Результати кластеризації думок за темою надаються як вхідні дані для генерації стрічки новин рекурентною нейронною мережею. Отже, алгоритм генерації контенту вибрано як основний компонент вирішення проблеми виникнення «соціальної бульбашки». При цьому запропоновано удосконалити алгоритм генерації стрічки новин за допомогою машинного навчання і нейронних мереж. Також в цій статті запропоновано ефективну архітектуру системи для генерації стрічки новин. У системі використовується Kafka як посередник повідомлень між мікросервісами і Ажур блоб-сховище для зберігання публікацій і коментарів. Обидва рішення обґрунтовані високою масштабованістю. Реляційна база даних PostgreSQL використовується для метаданих публікацій, коментарів, користувачів та зв’язків між користувачами. При розробці архітектури системи передбачено виникнення певних проблем і окреслено шляхи їх вирішення. Наприклад, якщо в майбутньому виникнуть проблеми з масштабованістю, то для їх вирішення можна використати шардинг за user_id; якщо будуть виникати проблеми, спричинені затримкою запитів, то можна використовувати індекси бази даних на основі B-дерева або Log-Structured Merge-дерева, залежно від того, чи буде більше запитів на читання, чи на запис.
Анотація (англ): 
This article examines the problems that appear in the process of the development of social networks. The focus of the study is on the echo chamber effect in various social networks. It turned out that the echo chamber effect is the result of the work of a deep neural network, which analyzes the interests and priorities of each social network user, checks other similar posts and priorities of other users, and then forms a “circle” of like-minded people for each user. Thus, the main drawback of the standard content generation algorithm is the selection of only publications and comments that support the user’s position. The goal of the study is a software architecture to solve the echo chamber problem in highly loaded social networks in real-time. The main idea was to cluster opinions on controversial topics and include user opinions from different clusters in user content. Data on controversial topics is collected from news, scholarly articles, publications, and comments with hashtags. The collected topics are clustered using the K-means algorithm and the “elbow” method is used to find the optimal number of clusters. The result of the clustering of opinions by topic is provided as input data for the generation of a news feed by a recurrent neural network. The system uses Kafka as a message broker between microservices and AZURE blob storage for storing publications and comments. Both solutions support high scalability.
Публікатор: 
Київський національний університет будівництва і архітектури
Назва журналу, номер, рік випуску (укр): 
Управління розвитком складних систем, номер 57, 2024
Назва журналу, номер, рік випуску (англ): 
Management of Development of Complex Systems, number 57, 2024
Мова статті: 
English
Формат документа: 
application/pdf
Документ: 
Дата публікації: 
22 Апрель 2024
Номер збірника: 
Розділ: 
ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ УПРАВЛІННЯ
Університет автора: 
Київський національний університет будівництва і архітектури, Київ
Литература: 
  1. Adisa, D. (2023, October 30). Everything you need to know about social media algorithms. Sprout Social. URL: https://sproutsocial.com/insights/social-media-algorithms/
  2. Lada, A., Wang, M. & Yan, T. (2021, January 26). How machine learning powers Facebook’s News Feed ranking algorithm. Core Infra, ML Applications. URL: https://engineering.fb.com/2021/01/26/ml-applications/news-feed-ranking/
  3. Koumchatzky, N. & Andryeyev, A. (2017, May 9). Using deep learning at scale in Twitter’s timelines. Twitter Engineering Blog. URL: https://blog.twitter.com/engineering/en_us/topics/insights/2017/using-deep-learning-at-scale-in-twitters-timelines.
  4. Hetler, A. (2023, January 30). 6 common social media privacy issues. TechTarget. URL: https://www.techtarget.com/whatis/feature/6-common-social-media-privacy-issues.
  5. Stetsyk, O., Pasieka, P, & Yeremenko, B. (2023). Designing an Effective System Architecture for Detecting Propaganda and Spam in Social Media News Feed. In 2023 IEEE 4th KhPI Week on Advanced Technology (KhPIWeek). IEEE. DOI: https://doi.org/10.1109/khpiweek61412.2023.10312932.
  6. Peebles, E. (2014). Cyberbullying: Hiding behind the screen. Paediatrics & Child Health, 19(10), 527–528. DOI: https://doi.org/10.1093/pch/19.10.527.
  7. Pantic, I. (2014). Online social networking and mental health. Cyberpsychology, Behavior, and Social Networking, 17(10). DOI: https://doi.org/10.1089/cyber.2014.0070.
  8. Alatawi, F.H., Cheng, L., Tahir, A., Karami, M., Jiang, B., Black, T. & Liu, H. (2021). A Survey on Echo Chambers on Social Media: Description, Detection and Mitigation DOI: https://doi.org/10.48550/arXiv.2112.05084.
  9. Cinelli, M., De Francisci Morales, G., Galeazzi, A., Quattrociocchi, W. & Starnini, M. (2021). The echo chamber effect on social media. Proceedings of the National Academy of Sciences, 118(9), Article e2023301118. DOI: https://doi.org/10.1073/pnas.2023301118.
  10. Moehring, A. (2022). News Feeds and User Engagement: Evidence from the Reddit News Tab. Massachusetts Institute of Technology (MIT) - Sloan School of Management. pp. 4–6.
  11. Garimella, K., De Francisci Morales, G., Gionis, A. & Mathioudakis, M. (2018). Political Discourse on Social Media. In the 2018 World Wide Web Conference. ACM Press. DOI: https://doi.org/10.1145/3178876.3186139.
  12. Du, S. & Gregory, S. (2016). The Echo Chamber Effect in Twitter: does community polarization increase? Studies in Computational Intelligence, 373–378. Springer International Publishing. DOI: https://doi.org/10.1007/978-3-319-50901-3_30.
  13. Choi, D., Chun, S., Oh, H., Han, J. & Kwon, T. (2020). Rumor Propagation is Amplified by Echo Chambers in Social Media. Scientific Reports, 10 (1). DOI: https://doi.org/10.1038/s41598-019-57272-3.
  14. Baumann, F., Lorenz-Spreen, P., Sokolov, I. M. & Starnini, M. (2020). Modeling Echo Chambers and Polarization Dynamics in Social Networks. Physical Review Letters, 124(4), 048301. DOI: https://doi.org/10.1103/PhysRevLett.124.048301.
  15. Khuong, B. (2019, June 24). The basics of recurrent neural networks (RNNs). Towards AI. Retrieved July 25, 2023, URL: https://towardsai.net/p/machine-learning/the-basics-of-recurrent-neural-networks-rnns.
  16. Ahmed, M., Seraj, R. & Islam, S. M. S. (2020). The k-means Algorithm: A Comprehensive Survey and Performance Evaluation. Electronics, 9(8), 1295. DOI: https://doi.org/10.3390/electronics9081295.
  17. Umargono, E., Suseno, J. E. & Gunawan, S. K. V. (2020). K-Means Clustering Optimization Using the Elbow Method and Early Centroid Determination Based on Mean and Median Formula. In Proceedings of the 2nd International Seminar on Science and Technology (ISSTEC 2019). DOI: https://doi.org/10.2991/assehr.k.201010.019.
  18. John, V. & Liu, X. (2017, April 3). A Survey of Distributed Message Broker Queues. arXiv:1704.00411. https://doi.org/10.48550/arXiv.1704.00411.
  19. Stetsyk, O. & Terenchuk, S. (2021). Comparative analysis of NoSQL databases architecture. Management of Development of Complex Systems, 47, 78–82, dx.doi.org\10.32347/2412-9933.2021.47.78-82.
  20. Microsoft Azure. (n.d.). What is Azure Blob storage? Retrieved February 27, 2024, URL: https://learn.microsoft.com/en-us/azure/storage/blobs/storage-blobs-introduction.
References: 
  1. Adisa, D. (2023, October 30). Everything you need to know about social media algorithms. Sprout Social. URL: https://sproutsocial.com/insights/social-media-algorithms/
  2. Lada, A., Wang, M. & Yan, T. (2021, January 26). How machine learning powers Facebook’s News Feed ranking algorithm. Core Infra, ML Applications. URL: https://engineering.fb.com/2021/01/26/ml-applications/news-feed-ranking/
  3. Koumchatzky, N. & Andryeyev, A. (2017, May 9). Using deep learning at scale in Twitter’s timelines. Twitter Engineering Blog. URL: https://blog.twitter.com/engineering/en_us/topics/insights/2017/using-deep-learning-at-scale-in-twitters-timelines.
  4. Hetler, A. (2023, January 30). 6 common social media privacy issues. TechTarget. URL: https://www.techtarget.com/whatis/feature/6-common-social-media-privacy-issues.
  5. Stetsyk, O., Pasieka, P, & Yeremenko, B. (2023). Designing an Effective System Architecture for Detecting Propaganda and Spam in Social Media News Feed. In 2023 IEEE 4th KhPI Week on Advanced Technology (KhPIWeek). IEEE. DOI: https://doi.org/10.1109/khpiweek61412.2023.10312932.
  6. Peebles, E. (2014). Cyberbullying: Hiding behind the screen. Paediatrics & Child Health, 19(10), 527–528. DOI: https://doi.org/10.1093/pch/19.10.527.
  7. Pantic, I. (2014). Online social networking and mental health. Cyberpsychology, Behavior, and Social Networking, 17(10). DOI: https://doi.org/10.1089/cyber.2014.0070.
  8. Alatawi, F.H., Cheng, L., Tahir, A., Karami, M., Jiang, B., Black, T. & Liu, H. (2021). A Survey on Echo Chambers on Social Media: Description, Detection and Mitigation DOI: https://doi.org/10.48550/arXiv.2112.05084.
  9. Cinelli, M., De Francisci Morales, G., Galeazzi, A., Quattrociocchi, W. & Starnini, M. (2021). The echo chamber effect on social media. Proceedings of the National Academy of Sciences, 118(9), Article e2023301118. DOI: https://doi.org/10.1073/pnas.2023301118.
  10. Moehring, A. (2022). News Feeds and User Engagement: Evidence from the Reddit News Tab. Massachusetts Institute of Technology (MIT) - Sloan School of Management. pp. 4–6.
  11. Garimella, K., De Francisci Morales, G., Gionis, A. & Mathioudakis, M. (2018). Political Discourse on Social Media. In the 2018 World Wide Web Conference. ACM Press. DOI: https://doi.org/10.1145/3178876.3186139.
  12. Du, S. & Gregory, S. (2016). The Echo Chamber Effect in Twitter: does community polarization increase? Studies in Computational Intelligence, 373–378. Springer International Publishing. DOI: https://doi.org/10.1007/978-3-319-50901-3_30.
  13. Choi, D., Chun, S., Oh, H., Han, J. & Kwon, T. (2020). Rumor Propagation is Amplified by Echo Chambers in Social Media. Scientific Reports, 10 (1). DOI: https://doi.org/10.1038/s41598-019-57272-3.
  14. Baumann, F., Lorenz-Spreen, P., Sokolov, I. M. & Starnini, M. (2020). Modeling Echo Chambers and Polarization Dynamics in Social Networks. Physical Review Letters, 124(4), 048301. DOI: https://doi.org/10.1103/PhysRevLett.124.048301.
  15. Khuong, B. (2019, June 24). The basics of recurrent neural networks (RNNs). Towards AI. Retrieved July 25, 2023, URL: https://towardsai.net/p/machine-learning/the-basics-of-recurrent-neural-networks-rnns.
  16. Ahmed, M., Seraj, R. & Islam, S. M. S. (2020). The k-means Algorithm: A Comprehensive Survey and Performance Evaluation. Electronics, 9(8), 1295. DOI: https://doi.org/10.3390/electronics9081295.
  17. Umargono, E., Suseno, J. E. & Gunawan, S. K. V. (2020). K-Means Clustering Optimization Using the Elbow Method and Early Centroid Determination Based on Mean and Median Formula. In Proceedings of the 2nd International Seminar on Science and Technology (ISSTEC 2019). DOI: https://doi.org/10.2991/assehr.k.201010.019.
  18. John, V. & Liu, X. (2017, April 3). A Survey of Distributed Message Broker Queues. arXiv:1704.00411. https://doi.org/10.48550/arXiv.1704.00411.
  19. Stetsyk, O. & Terenchuk, S. (2021). Comparative analysis of NoSQL databases architecture. Management of Development of Complex Systems, 47, 78–82, dx.doi.org\10.32347/2412-9933.2021.47.78-82.
  20. Microsoft Azure. (n.d.). What is Azure Blob storage? Retrieved February 27, 2024, URL: https://learn.microsoft.com/en-us/azure/storage/blobs/storage-blobs-introduction.