НЦМУ «Центр междисциплинарных исследований человеческого потенциала»

4.1.1 Научный проект «Развитие методов и инструментов интеллектуального анализа больших данных применительно к исследованиям человеческого потенциала»

Кузьминов Илья Филиппович
Руководитель (2020-2022)

Вишневский Константин Олегович
Руководитель (2022)

Период реализации проекта 

2020-2022

Связь научного проекта с тематикой человеческого потенциала

Выявление перспективных направлений науки и технологий, способных внести заметный вклад в развитие человеческого потенциала, требует постоянного сканирования, мониторинга и анализа больших данных и ежедневно пополняемых коллекций документов. С этой целью предполагаются проведение интеллектуального анализа больших данных с помощью новейших семантических методов, подготовка комплексных описаний и визуальных представлений динамики и структуры указанных направлений.

Реализуемая в рамках научного проекта «Развитие методов и инструментов интеллектуального анализа больших данных применительно к исследованиям человеческого потенциала» интеграция, модификация и дополнение лучших существующих моделей векторных представлений фраз позволяет реализовать модель для частичной автоматизации выявления и сравнительного межстранового анализа трендов в сфере управления человеческим потенциалом и создания разработок для радикального повышения объективности и эффективности проводимых исследований. Алгоритмы сбора, обработки и анализа больших данных на основе искусственного интеллекта будут использоваться для выявления вызовов и анализа глобальной повестки развития человеческого потенциала, картирования научно-технологического ландшафта, поиска и оценки глобальных и российских центров компетенций (организаций, коллективов, персон), определения зарождающихся трендов, слабых сигналов и джокеров.

Цель проекта:

Разработка и совершенствование методов и инструментов интеллектуального анализа больших данных, их апробация и практическое применение с целью анализа данных о перспективах развития человеческого потенциала и усиления экспертной аналитики в сфере исследований человеческого потенциала

Задачи проекта:

  1. Разработка и совершенствование методов и инструментов интеллектуального анализа больших данных, их апробация и практическое применение с целью анализа данных о перспективах развития человеческого потенциала
  2. Тестирование информационной ценности и предсказательной силы текст-майнинговых индикаторов и их комбинаций (скоринговых метрик) путем экспертной оценки (разметки) результатов текст-майнингового картирования трендов, событий, прогнозов и факторов развития человеческого потенциала
  3. Совершенствование алгоритмов извлечения, индексирования, ранжирования и интеллектуального анализа научных, технологических, экономических, социальных, гуманитарных и иных терминов по тематикам человеческого потенциала, социальных и гуманитарных наук на основе исследования прикладных информационно-технологических продуктов для инфраструктуры обработки больших данных

Ключевые результаты

2020 г.

Созданы и апробированы алгоритмы оценки тематической близости между научными, аналитическими, нормативными, стратегическими документами и нарративно-концептуальными документами социально-гуманитарной направленности на основе алгоритмов глубокого обучения, семантического анализа и текст-майнинга в целях усиления экспертной аналитики в сфере исследований человеческого потенциала. В том числе разработаны и применены инструменты анализа эволюции терминологии и ее структурной кластеризации на основе моделей машинного обучения Word2Vec и SciBERT. Проведено исследование возможности применения технологии Kubernetes в управлении обработкой больших текстовых данных и метаданных, больших документных коллекций для стратегического картирования повесток как мультидисциплинарных, так и специализированных исследований в сфере развития человеческого потенциала

2021 г.

Оценена информационная ценность и предсказательная сила рассчитанных текст-майнинговых индикаторов и их комбинаций (скоринговых метрик) в сопоставлении с результатами экспертной разметки материалов текст-майнингового картирования трендов, событий, прогнозов и факторов развития человеческого потенциала с точки зрения повышения их качества

2022 г.

Предложен и апробирован подход с использованием языковых маркеров, а также языковых правил замен для извлечения и интеллектуального анализа научных, технологических, экономических, социальных, гуманитарных и иных терминов с целью дальнейшего получения комплексного ландшафта трендов по направлению человеческого потенциала, социальных и гуманитарных наук. Произведено текст-майнинговое картирование трендов на основе модели выявления трендов, усовершенствованной с использованием подхода на основе имплементированных маркеров и правил.

Семантическая карта трендов

Образовательные программы

Образовательные модули в рамках англоязычной магистерской программы «Управление в сфере науки, технологий и инноваций» (Governance of Science, Technology and Innovation)

Публикации

Чулок А.А. Форсайт как инструмент формирования и управления экосистемой компании //Вопросы экономики. – 2022. – №. 3. – С. 52-76. doi

РИД

Гохберг Л.М., Кузьмин Г.Н., Кузьминов И.Ф., Соколов А.В., Тимофеев А. А. Программа ЭВМ «Узел сбора статистики распределенной системы выполнения заданий в системе интеллектуального анализа больших данных iFORA» Свидетельство о регистрации программы для ЭВМ 2022619136, 19.05.2022.

Конференции

XXII Апрельская международная научная конференция по проблемам развития экономики и общества (Москва, Россия, 4-22 апреля 2021 г.):
- Международный научный симпозиум «Использование анализа открытых больших данных для целей выявления глобальных трендов и вызовов, связанных с формированием и использованием человеческого потенциала» (12.04.2021)