4.1.1 Научный проект «Развитие методов и инструментов интеллектуального анализа больших данных применительно к исследованиям человеческого потенциала»
Кузьминов Илья Филиппович
Руководитель (2020-2022)
Вишневский Константин Олегович
Руководитель (2022)
Период реализации проекта
2020-2022
Связь научного проекта с тематикой человеческого потенциала
Выявление перспективных направлений науки и технологий, способных внести заметный вклад в развитие человеческого потенциала, требует постоянного сканирования, мониторинга и анализа больших данных и ежедневно пополняемых коллекций документов. С этой целью предполагаются проведение интеллектуального анализа больших данных с помощью новейших семантических методов, подготовка комплексных описаний и визуальных представлений динамики и структуры указанных направлений.
Реализуемая в рамках научного проекта «Развитие методов и инструментов интеллектуального анализа больших данных применительно к исследованиям человеческого потенциала» интеграция, модификация и дополнение лучших существующих моделей векторных представлений фраз позволяет реализовать модель для частичной автоматизации выявления и сравнительного межстранового анализа трендов в сфере управления человеческим потенциалом и создания разработок для радикального повышения объективности и эффективности проводимых исследований. Алгоритмы сбора, обработки и анализа больших данных на основе искусственного интеллекта будут использоваться для выявления вызовов и анализа глобальной повестки развития человеческого потенциала, картирования научно-технологического ландшафта, поиска и оценки глобальных и российских центров компетенций (организаций, коллективов, персон), определения зарождающихся трендов, слабых сигналов и джокеров.
Цель проекта:
Разработка и совершенствование методов и инструментов интеллектуального анализа больших данных, их апробация и практическое применение с целью анализа данных о перспективах развития человеческого потенциала и усиления экспертной аналитики в сфере исследований человеческого потенциала
Задачи проекта:
- Разработка и совершенствование методов и инструментов интеллектуального анализа больших данных, их апробация и практическое применение с целью анализа данных о перспективах развития человеческого потенциала
- Тестирование информационной ценности и предсказательной силы текст-майнинговых индикаторов и их комбинаций (скоринговых метрик) путем экспертной оценки (разметки) результатов текст-майнингового картирования трендов, событий, прогнозов и факторов развития человеческого потенциала
- Совершенствование алгоритмов извлечения, индексирования, ранжирования и интеллектуального анализа научных, технологических, экономических, социальных, гуманитарных и иных терминов по тематикам человеческого потенциала, социальных и гуманитарных наук на основе исследования прикладных информационно-технологических продуктов для инфраструктуры обработки больших данных
Ключевые результаты
2020 г.
Созданы и апробированы алгоритмы оценки тематической близости между научными, аналитическими, нормативными, стратегическими документами и нарративно-концептуальными документами социально-гуманитарной направленности на основе алгоритмов глубокого обучения, семантического анализа и текст-майнинга в целях усиления экспертной аналитики в сфере исследований человеческого потенциала. В том числе разработаны и применены инструменты анализа эволюции терминологии и ее структурной кластеризации на основе моделей машинного обучения Word2Vec и SciBERT. Проведено исследование возможности применения технологии Kubernetes в управлении обработкой больших текстовых данных и метаданных, больших документных коллекций для стратегического картирования повесток как мультидисциплинарных, так и специализированных исследований в сфере развития человеческого потенциала
2021 г.
Оценена информационная ценность и предсказательная сила рассчитанных текст-майнинговых индикаторов и их комбинаций (скоринговых метрик) в сопоставлении с результатами экспертной разметки материалов текст-майнингового картирования трендов, событий, прогнозов и факторов развития человеческого потенциала с точки зрения повышения их качества
2022 г.
Предложен и апробирован подход с использованием языковых маркеров, а также языковых правил замен для извлечения и интеллектуального анализа научных, технологических, экономических, социальных, гуманитарных и иных терминов с целью дальнейшего получения комплексного ландшафта трендов по направлению человеческого потенциала, социальных и гуманитарных наук. Произведено текст-майнинговое картирование трендов на основе модели выявления трендов, усовершенствованной с использованием подхода на основе имплементированных маркеров и правил.
Семантическая карта трендов
Образовательные программы
Публикации
Чулок А.А. Форсайт как инструмент формирования и управления экосистемой компании //Вопросы экономики. – 2022. – №. 3. – С. 52-76. doi
РИД
Гохберг Л.М., Кузьмин Г.Н., Кузьминов И.Ф., Соколов А.В., Тимофеев А. А. Программа ЭВМ «Узел сбора статистики распределенной системы выполнения заданий в системе интеллектуального анализа больших данных iFORA» Свидетельство о регистрации программы для ЭВМ 2022619136, 19.05.2022.
Конференции
Мастер-класс «Система интеллектуального анализа больших данных iFORA: возможности использования для задач исследования человеческого потенциала» ИСИЭЗ НИУ ВШЭ (Онлайн, 30 марта 2022 г.)
XXII Апрельская международная научная конференция по проблемам развития экономики и общества (Москва, Россия, 4-22 апреля 2021 г.):
- Международный научный симпозиум «Использование анализа открытых больших данных для целей выявления глобальных трендов и вызовов, связанных с формированием и использованием человеческого потенциала» (12.04.2021)
Мастер-класс «Выявление средне- и долгосрочных глобальных и российских трендов развития науки и технологий в областях, связанных с развитием человеческого потенциала» ИСИЭЗ НИУ ВШЭ (Онлайн, 22 июня 2022 г.)