Институт умных систем и искусственного интеллекта Назарбаев университета разработал технологию, которая позволяет автоматизировано распознавать казахскую речь. Это позволит активно внедрять казахский язык в глобальное цифровое пространство, отметили в пресс-службе университета.

Для реализации проекта, учёные собрали самую большую базу голосовых данных на казахском языке – 300 часов записанной речи двух тысяч человек.

«Применение новой разработки открывает большие возможности: распознавание казахской речи виртуальными помощниками, использование во всевозможных программах и технологии «умного дома». Этот проект даст большой толчок развитию инклюзии в Казахстане. Новую технологию могут применять в голосовых и текстовых программах, широко использующихся людьми с особыми потребностями», – говорится в сообщении.

По этой ссылке можно получить доступ к собранной базе данных, а также протестировать технологию распознавания казахской речи.

«Раньше создать эту технологию мешало отсутствие достаточно большой базы данных. Сейчас мы готовы поделиться собранной базой данных казахской речи с открытым исходным кодом со всеми исследователям и цифровыми предпринимателям, чтобы максимизировать его положительное влияние на экономику и общество страны,» – сказал директор ISSAI NU, профессор Атакан Варол.