В Яндексе разрабатывается собственная технологии распознавания текста (OCR). С помощью этой технологии прямо в камере телефона пользователи Яндекс.Переводчика могут перевести надпись на памятнике или меню с 47 языков (включая не только языки на основе кириллицы и латиницы, например китайский, арабский, греческий и другие), пользователи Алисы и Яндекс.Картинок могут по сделанной фотографии поискать сообщение об ошибке, скопировать текст документа, перейти по ссылке с плаката и даже озвучить надпись на упаковке из магазина, сделанную мелким шрифтом. Помимо этого, технология используется во многих других сервисах и процессах в компании, а также доступна внешним пользователям в Яндекс.Облаке.
Мы хотим, чтобы наша технология показывала отличные результаты на самых сложных доменах (будь то надпись, выбитая в камне, текст на сильно помятом товаре или написанный по кругу) и при этом работала на мобильных устройствах.
Наши задачи лежат на стыке технологий CV (ведь на входе мы работаем с картинками) и NLP (для качественного распознавания найденных регионов нам необходимы хорошие знания о языковой модели).