Ученые Назарбаев университета создали первые цифровые казахские голоса – мужской и женский. Их назвали Исеке и Рая - это производные от настоящих имен двух дикторов, чьи голоса и легли в основу программы. Разработка преобразовывает текст в аудио и способствует продвижению использования казахского языка в цифровой сфере.
Саида Мусаходжаева, аналитик данных института умных систем и искусственного интеллекта Назарбаев Университета:
- Мы собрали более 90 часов голоса от двух дикторов, а также разработали 2 системы, которые могут перевести текст в речь. Во-первых, мы первые, кто собрал такое количество данных в Казахстане. Во-вторых, это все в общем доступе. Любой человек может скачать эти данные и использовать в некоммерческих и коммерческих целях. В связке с другими компонентами в будущем их можно использовать в виртуальных ассистентах, таких как Сири, либо в том же самом 2гис.
Работа над проектом длилась почти год. За это время дикторы наговорили много слов, звуков, букв и чисел, чтобы цифровые Исеке и Рая без труда произносили как распространенные, так и неизвестные или даже несуществующие слова. Программой уже заинтересовались несколько казахстанских компаний.
Делятся ученые не только всей базой данных, но и кодом программы и предварительно обученными моделями, для того чтобы другие разработчики смогли использовать их для еще большего развития казахстанских технологий искусственного интеллекта.
Автор: Марал Аманжолова