
Российская нейросеть разгадала тайны египетских иероглифов
Российские ученые представили систему, которая может прочесть древние надписи на стене пирамиды или артефакте в музее мгновенно, предоставив перевод текста. За разработкой стоит объединенная команда Института искусственного интеллекта AIRI, Института системного программирования РАН и Университета ИТМО под руководством Ильи Макарова. Их модель обучена на Thesaurus Linguae Aegyptiae — собрании подлинных текстов с подробными комментариями и переводами, благодаря чему она «понимает» сотни сложных символов и может различать визуально схожие знаки.
Труднейшей задачей было не просто распознать форму иероглифа, а найти правильное значение с учётом соседних символов. Для этого ученые использовали контекстуальные OCR-модели, которые анализируют сразу несколько строк текста, и диффузионные алгоритмы, синтезирующие искусственные образцы надписей для расширения обучающей выборки. В результате программа распознаёт до 96% знаков без ошибок, что подтвердили профессиональные египтологи из ВШЭ.
В ближайшем будущем разработку планируют интегрировать в мобильное приложение дополненной реальности: посетители музеев смогут увидеть перевод на экране своего смартфона прямо поверх экспонатов. Кроме египетских иероглифов такую платформу можно обучить для чтения шумерской клинописи, латыни эпохи Римской империи, древнегреческих надписей и других языков. Так ИИ расширит горизонты исторических исследований и позволит ученым быстрее анализировать тысячи артефактов разных культур. Появление этой технологии позволит ускорить публикацию научных работ, упростит изучение древних языков для студентов и энтузиастов и сделает культурное наследие предков доступным для всех.