Центр исследования больших данных НИТУ «МИСиС» запускает платформу анализа больших данных IRELA. По словам создателей, платформа обладает уникальным для российского рынка мультиязычным поиском. Платформа Data Science может встраиваться в ИТ-ландшафт организаций из любых сфер за счет разделения платформы на модули.
Руководитель проекта IRELA Григорий Губарев рассказал корреспонденту ComNews, что IRELA развивается в рамках Центра исследований больших данных НИТУ «МИСиС», нацеленного на создание наукоемких конкурентоспособных продуктов в сфере анализа данных. «Среди задач этого подразделения вуза — трансфер результатов научных исследований в программные решения, за реализацию которых отвечает команда инженеров компании Naumen», — добавил он.
Проект основан на аналитических решениях, созданных экспертами Центра по заказу компаний из нефтегазовой, аэрокосмической, строительной и научно-образовательной отраслей. Григорий Губарев рассказал, что созданию коммерческого продукта предшествовало постепенное накопление экспертного опыта в сфере анализа данных. «Компания Naumen уже более пяти лет разрабатывает решения Data Science, внедряя созданные технологии в рамках проектов с крупными коммерческими и государственными заказчиками. Эти наработки легли в основу платформы IRELA и были дополнены новыми функциями, основанными на последних научных разработках в сфере анализа данных, машинного обучения и обработки естественного языка», — говорит Григорий Губарев.
Пресс-служба НИТУ «МИСиС» сообщила, что платформа имеет широкий спектр применения и опирается на передовые научные достижения в области Data Science. «В отличие от других подобных решений на рынке, ориентированных на конкретную область, IRELA предоставляет набор инструментов, которые встраиваются в существующий ИТ-ландшафт организации. Конкурентные преимущества платформа получает благодаря ее разделению на независимые функциональные части — модули. Каждый из них — готовое решение, которое можно устанавливать отдельно или в комплекте с другими», — рассказал представитель пресс-службы НИТУ «МИСиС».
Григорий Губарев уверен, что платформа будет полезна в разных отраслях — нефтегазовой, аэрокосмической, строительной, образовательной, а также в сфере госуправления. «Но мы хотим, чтобы решения Data Science стали доступнее и для средних компаний, поэтому наша платформа состоит из девяти почти независимых функциональных модулей, каждый из которых можно устанавливать отдельно или в комплекте с другими. Мы собрали сильную команду экспертов по Data Science, умеющих разрабатывать решения в сфере анализа данных и обладающих опытом внедрения созданных технологий в рамках проектов с коммерческими и государственными заказчиками, среди которых министерства и корпорации, — комментирует Григорий Губарев. — IRELA обладает функцией мультиязычного поиска, аналогов которому пока нет на российском рынке».
Пресс-служба НИТУ «МИСиС» сообщает, что технология мультиязычного поиска — собственная разработка команды, и объясняет, каким образом работает платформа: «Модуль мультиязычности находит в коллекции документы на любых языках, исключая необходимость перевода и связанные с ним ошибки. Он сокращает время поиска для пользователей, не владеющих нужными иностранными языками, и увеличивает шанс найти наиболее подходящий по смыслу документ. Модуль актуален для глобальных компаний и многонациональных коллективов, работающих с зарубежными контрагентами. За счет технологий обработки больших данных и машинного обучения платформа IRELA автоматизирует работу с большим потоком информации — упрощает поиск по многоязычной базе данных, классифицирует входящие документы, ускоряет принятие стандартных решений, подсказывает приоритеты в работе с обращениями, облегчает анализ отчетов».
Отметим, что Центр исследования больших данных НИТУ «МИСиС» и Naumen создали в октябре текущего года. Цель создания центра — проведение опережающих научных исследований в области Data Science.
Директор Центра исследования больших данных НИТУ «МИСиС» Лев Голицын отметил, что центр занимается актуальными направлениями анализа информации, машинного обучения и обработки естественного языка, и платформа IRELA — первый важный проект подразделения. «Созданная платформа включает наши передовые достижения, полученные за счет симбиоза решенных бизнес-кейсов и научных задач», — сказал он.
Григорий Губарев говорит, что в перспективе — научные исследования и разработка программных решений по многим актуальным направлениям Data Science, таким как автоматическая обработка естественного языка, разведочный информационный поиск, кросс-язычный поиск данных, мультимодальное тематическое моделирование, языковое моделирование, векторное представление сущностей, вопросно-ответные системы, системы поддержки принятия решений. «Кроме того, мы разрабатываем образовательные курсы и лекции по теме науки о данных, планируются семинары и конференции», — поделился он планами.