Skip navigation.
Home

Андрей Михайлов представил результаты работы молодежной лаборатории ИИ на заседании Объединенного ученого совета СО РАН нанотехнологиям и информационным технологиям

Заведующий молодежной лаборатории искусственного интеллекта, обработки и анализа данных Института динамики систем и теории управления имени В. М. Матросова СО РАН кандидат технических наук Андрей Анатольевич Михайлов принял участие в заседании Объединенного ученого совета СО РАН по нанотехнологиям и информационным технологиям. Мероприятие проходило в Новосибирске накануне Общего собрания Сибирского отделения РАН.

В ходе выступления ученый представил основные результаты работы лаборатории за 2025 год. Он рассказал о текущих проектах в сфере искусственного интеллекта, обработки и анализа данных, а также обозначил ключевые направления и планы развития на ближайшую перспективу. В частности, были представлены методы анализа и понимания структуры электронных документов на основе самообучения, графовых нейронных сетей и мультимодальных моделей. Андрей Михайлов отметил, что сегодня до 80% корпоративных данных остаются неструктурированными (PDF, отсканированные документы), а универсальные большие языковые модели демонстрируют «слепоту» к двумерной структуре документов, уступая специализированным архитектурам более чем на 50%. Для решения этой проблемы коллектив лаборатории разрабатывает сквозной конвейер, способный превращать PDF-файлы в структурированные знания.

Автор доклада сделал акцент на применении графовых нейросетей (GNN) для анализа физической структуры страниц. Это позволяет эффективно восстанавливать макет документа. Были продемонстрированы преимущества разработанного инструмента для семантической интерпретации таблиц RuTaBERT и CoLeM, который, в отличие от классических моделей, показал высокую эффективность в условиях нехватки данных на русском языке и уверенно работает с редкими типами колонок. В выступлении также освещалась концепция графового мультимодального RAG (Retrieval-Augmented Generation), учитывающая не только текст, но и логическую структуру, таблицы и изображения. Особое внимание было уделено методам защиты от галлюцинаций при ответах на числовые вопросы за счет использования генерации планов выполнения запросов.

 

Андрей Анатольевич подчеркнул, что в состав лаборатории входят 19 молодых исследователей (100% сотрудников — в возрасте до 39 лет), а работы ведутся с использованием оборудования ЦКП «Иркутский суперкомпьютерный центр СО РАН» на базе ИДСТУ СО РАН.

Министерство науки и высшего образования Российской Федерации Российская академия наук (РАН) Сибирское отделение Российской академии наук (СО РАН) Отделение нанотехнологий и информационных технологий РАН (ОНИТ РАН) Иркутский филиал СО РАН (ИрФ СО РАН) Иркутский государственный университет (ИГУ) Иркутский национальный исследовательский технический университет (ИрНИТУ) Российский научный фонд Институт систем энергетики им. Л.А. Мелентьева (ИСЭМ СО РАН)
Наука в Сибири Агентство научный новостей