Разработка охватывает тексты на русском и казахском языкахПрофессор, заведующий кафедрой математического моделирования механико-математического факультета Новосибирского государственного университета (НГУ) Владимир Барахнин сообщил, что ученые вуза совместно с коллегами из Казахстана разработали алгоритм, позволяющий выявлять деструктивную информацию в интернет-пространстве. Алгоритм анализирует тексты на русском и казахском языках, учитывая их морфологические особенности.
© Ferra.ru
Алгоритм базируется на методах машинного обучения и искусственного интеллекта. Он способен определять начальную форму слова или, наоборот, генерировать его варианты, что особенно важно для казахского языка с его сложной системой окончаний. Это позволяет анализировать смысл текста и искать признаки деструктивной информации.
Ключевыми критериями для анализа стали: отсутствие проверяемых фактов, политизация, манипулятивный характер, негативная тональность и призывы к действиям. Алгоритм также учитывает достоверность данных и выводы авторов публикаций.
Для исследования ученые создали корпус текстов из более чем 4 миллионов публикаций казахстанских СМИ и 2 миллионов текстов российских медиа. Всего было изучено 36 казахстанских источников, каждый из которых предоставил не менее 500 публикаций. Это позволило провести сравнительный анализ активности в медиапространстве двух стран.