«Когда начали входить в жизнь новые технологии, такие крупные компании, как «Яндекс», не выражали интереса к региональным языкам чисто с коммерческой точки зрения. А нам ждать тоже не очень хотелось. Поэтому решили сделать свой переводчик», — объясняют в Институте прикладной семиотики Академии наук РТ, которая создала TatSoft — первое мобильное приложение с поддержкой голосового перевода для татарского языка. О том, в чем его функционал, какие баги удалось обнаружить и почему «Яндексу» невыгодно запускать голосовой переводчик для татарского, — в материале «БИЗНЕС Online».
Ринат Гильмуллин: «Когда начали входить в жизнь новые технологии, такие крупные компании, как «Яндекс», не выражали интереса к региональным языкам чисто с коммерческой точки зрения. А нам ждать тоже не очень хотелось. Поэтому решили сделать свой переводчик»
Первый татарский голосовой переводчик — как он работает?
«Ни в Google, ни в „Яндексе“ пока такого нет», — так сегодня Академия наук Татарстана презентовала первое мобильное приложение с поддержкой голосового перевода для татарского языка TatSoft. Его разработали специалисты Института прикладной семиотики АН РТ при поддержке комиссии при президенте РТ по вопросам сохранения, развития татарского языка и родных языков народов РТ, которую возглавляет Марат Ахметов.
«Основной целью проекта является предоставление в одном месте информации о локализации компьютеров и программного обеспечения, мобильных устройств и приложений, а также веб-ресурсов на татарский язык. Это дает миллионам татар во всему миру возможность использовать современные информационно-коммуникационные технологии на родном языке в едином информационном поле и по единым стандартам», — говорится о TatSoft на сайте ведомства Рифката Минниханова.
TatSoft обошелся бюджету в 6,8 млн рублей. При этом стоит отметить, что сам переводчик существует уже с 2019 года и, как отметил директор института Ринат Гильмуллин, за последние 10 месяцев уникальных посетителей на сервисе было более 700 тыс., а посещений — около 2 млн, причем из более чем 100 стран. По сути, сейчас специалисты учреждения доработали свой IT-продукт, создав дополнительное мобильное приложение с возможностью голосового набора и преобразования текста в речь.
«С „Яндексом“ сотрудничаем с 2016 года, — начал директор института. — В то время только-только начали использоваться нейросетевые технологии. Но уже тогда перед нами стояла задача разработки машинного переводчика. Мы параллельно передавали датасеты „Яндексу“ и буквально через год в их сервисе как раз появилась возможность перевода на татарский. Когда начали входить в жизнь новые технологии, такие крупные компании, как „Яндекс“, не выражали интереса к региональным языкам чисто с коммерческой точки зрения. А нам ждать тоже не очень хотелось. Поэтому решили сделать свой переводчик».
TatSoft обошелся бюджету в 6,8 млн рублей
Согласно техзаданию в госзакупке, разговорные аудиоданные на татарском должны содержать не менее 10%, публицистические — не менее 60%, официально-деловые, художественные и научные — не менее 30%. На протяжении нескольких месяцев институт собирал базу записанных речевых оборотов. Для синтеза речи из текста в голосовую речь разработчикам нужны были носители образцового татарского языка, тут на помощь пришли актеры театра им. Камала. А чтобы сделать распознавание речи и превратить ее в текст, привлекли всех желающих — записи примеров предложений собирали через телеграм-бот. По словам ведущего научного сотрудника института прикладной семиотики АН РТ Булата Хакимова, это нужно было в целях расширить функционал сервиса, т. е. чтобы программа понимала разные дикции, диалекты и была адаптирована к разному уровню шума и пр. Всего откликнулись более тысячи людей, удалось собрать порядка 600 часов записи.
24 марта TatSoft загрузили в Google Play, для платформы iOS приложение должно появиться в течение месяца. За первую неделю его скачали около 500 пользователей, отметил Гильмуллин. Более свежих данных он назвать не смог. За месяц приложение заработали оценку в 4,8 звезды, всего 14 отзывов. «Это просто восхитительно! И весит очень мало. Я в восторге!» — написал Тимур. «Интересная программа. Сначала переводил очень длинные предложения, а сейчас обленился», — указал Альберт.
Журналист «БИЗНЕС Online» обнаружил, что в переводе односложных предложений у сервиса проблем не возникает, однако в переводе узкопрофильных текстов, например экономических, уже есть шероховатости — не все слова могут быть переведены, некоторые пропущены, местами буквальный перевод. Кроме того, через раз работали голосовые помощники «Алсу и Алмаз» и «Наташа и Руслан», которые озвучивали тексты.
Директор института подтвердил, что приложение будет совершенствоваться, увеличивать свой функционал. К примеру, до конца года планируют включить башкирский, удмуртский, чувашский и марийский языки, в перспективе создать автоматизированные кол-центры и телефонные роботы на татарском языке, сервис по автоматическому распознаванию и переводу речи выступлений, искусственный интеллект, современный литературный портал, тренажер произношений, образовательные сервисы, использующие голосовой ввод на татарском языке. Они даже не против передать свою базу датасетов «Яндексу», чтобы их переводчик тоже со временем мог распознавать татарскую речь.
«Я считаю, что это высший пилотаж! Это здорово! Я вообще за все программы, новые продукты, которые изобретают, запускают. Потому что любого рода новые предложения на рынке с татароязычным сегментом — это, конечно, прогресс!»
Быть ли умной «Әлисә», «Алhыу» или «Әминә»?
А что, если создать умную татарскую колонку по типу «Яндекс»-станции «Алиса»? На этот счет Гильмуллин с осторожностью ответил, что выпустить колонку «Әлисә», «Алhыу» или «Әминә» можно и, наверное, будет вау-эффект. Но он может продлиться лишь пару дней, если не будет привязан к другим сервисам, будь это такси, музыка или «Умный дом». Поэтому татарская версия станции должна быть интегрирована в уже существующие решения.
«Сформировались стереотипные ожидания. Статистика поисковых запросов на татарском показывает, что превалируют темы, связанные с искусством, а интеллектуальные, жизненные, прагматичные вопросы у людей идут на русском языке. У людей формируется образы языка — что можно на этом языке сделать в цифровой системе, а что нельзя. Чтобы поменять отношение людей, нужно добавлять работающие сервисы. Если человек не будет видеть, что есть колонка на татарском, то будет продолжать думать, что ее не будет никогда, и он будет переходить на использование других языков. В этом случае предложение может увеличивать спрос», — считает Хакимов.
Вообще, в последнее время активизировалась работа по созданию разнообразных интернет-сервисов с использованием татарского языка. Напомним, что на недавней коллегии минцифры РТ презентовали сервис по переводу любых видео на YouTube на татарский язык Tatar Speech. «Алгоритм состоит из множества этапов — начиная от распознавания языка оригинала и заканчивая переводом и синтезом татарской речи. Вместе с Академией наук РТ мы обучали модель на десятках часов студийной записи речи профессиональных актеров», — рассказал тогда «БИЗНЕС Online» уполномоченный по технологиям искусственного интеллекта Булат Замалиев, демонстрируя, как именно работает браузерное расширение.
Как же оценила общественность TatSoft? По словам руководителя команды разработчиков Coderlar и IT-куратора образовательной платформы «Ачык университет» («Открытый университет») Райнура Хасанова, он давно пользуется веб-версией приложения, куда недавно был добавлен голосовой набор текста. Его команда как раз опробовала нововведение и осталась довольна — отлично воспроизводит голос и принимает звук, но не расставляет знаки препинания.
«В целом отличное приложение, разработчики молодцы. Хорошо переводит как с русского на татарский, так с татарского на русский. То, что мы тестировали и запрашивали, процентов на 90 было корректно. Но распознавание речи почему-то не работает. Видимо, после сегодняшней пресс-конференции большой поток пользователей пошел проверять сервис и, возможно, из-за этого он немного встал. Но, в принципе, как IT-эксперт понимаю, что такое тоже может быть», — поделился Хасанов, с недавнего времени руководитель всемирного форума татарской молодежи.
По его словам, татарские активисты пользуются и TatSoft, и переводчиком «Яндекса». В некоторых случаях наш переводчик лучше, в некоторых — «Яндекс». «Думаю, приложение будет очень полезным для журналистов, которые много времени тратят на транскрипцию аудиозаписи. А изучающие татарский язык с его помощью будут учиться правильно произносить слова», — считает собеседник газеты. Спикер пожелал, чтобы приложение появилось в App Store.
Проект по распознаванию татарской речи очень необходим и актуален, его нужно дальше развивать и интегрировать в деятельность госструктур и СМИ, заявил в беседе с «БИЗНЕС Online» председатель исполкома всемирного конгресса татар Данис Шакиров. Но на этом не стоит останавливаться, считает он, сервис должен получить широкое распространение и в повседневной жизни, охватывать разные сферы, в том числе быть полезным для иноязычной аудитории.
Кандидат филологических наук, руководитель центра татарского языка «Умарта» Лилиана Сафина рассматривает проект Tatsoft с нескольких точек зрения. С одной стороны, приложение — отличный инструмент для экономии времени современного человека, поскольку позволяет ускорить перевод. Однако полностью доверить процесс программе эксперт не может. «Проработка окончаний достаточно неплохая у программы. Но я полностью доверять машине, к сожалению, пока бы не стала. На сегодняшний момент нет такого универсального устройства, программы, которая смогла бы хорошо, доступно, правильно перевести. <…> Перевод приближается к уровню нейросети — какая-то пропадает изюминка, какой-то анализ».
С другой стороны, собеседник нашего издания на своем преподавательском опыте убедилась, что когда у человека под рукой постоянный легкий перевод, то слова при изучении языка запоминаются меньше. В то же время эксперт положительно оценила наличие голосового ввода текста в программе. Такой функционал позволяет человеку, самостоятельно изучающему язык, отработать и проверить свое правильное произношение. «Я считаю, что это высший пилотаж! Это здорово! Я вообще за все программы, новые продукты, которые изобретают, запускают. Потому что любого рода новые предложения на рынке с татароязычным сегментом — это, конечно, прогресс!» — резюмировала Сафина.
Внимание!
Комментирование временно доступно только для зарегистрированных пользователей.
Подробнее
Комментарии 30
Редакция оставляет за собой право отказать в публикации вашего комментария.
Правила модерирования.