От диалектов до банковских терминов: как ИИ освоил узбекский язык
Что, если научить искусственный интеллект понимать и говорить на узбекском так же, как это делает человек

Для полноценной работы технологиям нужна большая библиотека живых примеров языка в цифровом виде. У многих языков, включая узбекский, не хватает таких данных для обучения ИИ-моделей, поэтому они остаются вне фокуса международных разработок. В результате ИИ-решения, прекрасно работающие на английском или русском, на других языках не понимают пользователей, ошибаются или звучат неестественно. Что, если научить искусственный интеллект понимать и говорить на узбекском так же, как это делает человек?
Кейс TBC Uzbekistan и Aiphoria как раз об этом: он показывает, что Узбекистан может создавать технологии мирового уровня, несмотря на сложности разработки и дефицит данных.
В 2024 году TBC Uzbekistan, крупнейшая экосистема цифрового банкинга в Центральной Азии, поставила себе амбициозную цель — разработать собственные речевые технологии. В TBC собрали команду инженеров, проектных менеджеров и лингвистов, а также привлекли Aiphoria — компанию-разработчика платформы для создания цифровых сотрудников на базе ИИ. Реализация совместного проекта заняла почти год — в результате разработана система, способная понимать узбекскую речь со всеми её особенностями — диалектами, акцентами и смешанным языком. Решение создавалось специально для задач банка и было развёрнуто на инфраструктуре TBC Uzbekistan (on-premise).
Не просто бот, а полноценный сотрудник
Технология ИИ-агентов — одна из самых обсуждаемых тем 2025 года. Это не автоматизация диалогов, а создание цифровых сотрудников, которые могут заменить человека в рутинных задачах. Такие агенты умеют понимать устную речь, говорить в ответ реалистичным голосом и вести диалог до конкретной цели — будь то напоминание об оплате, регистрация заявки или помощь в навигации по услугам.
Научиться слышать: как создавали систему распознавания речи
Работа началась с самой сложной части — понимания устной речи. Ведь готовые международные решения давали слишком много ошибок. Например, при тестировании на реальных звонках выяснилось, что в среднем они правильно распознают лишь 6 из 10 слов.
Решив разрабатывать собственную систему, партнёры объединили многолетнюю экспертизу Aiphoria в корпоративных AI-продуктах с реальными данными TBC Uzbekistan и глубоким знанием финтех-рынка и узбекского языка.
Сначала были собраны аудиоданные из открытых источников и звонков в контакт-центр, которые были полностью анонимизированы. Ключевым стало именно использование реальных данных банка: с его акустикой, лексикой и сценариями. Затем началась кропотливая работа по разметке. Над ней трудились лингвисты, операторы, редакторы. Нужно было учесть всё: переход с кириллицы на латиницу, множество диалектов (ташкентский, хорезмский, наманганский и другие), а также многочисленные варианты написания одних и тех же слов.
При этом особое внимание уделялось банковской лексике — терминам, которые базовая модель может и не знать. Некоторые слова и выражения, вроде «аннуитетных платежей» (oylik teng miqdordagi to’lovlar), изначально не были знакомы даже опытным разметчикам. За точность значений и корректную интерпретацию терминов отвечали специалисты банка — они помогали уточнять контекст и адаптировать лексику под реальные сценарии.
Научиться говорить: реалистичный голос с эмоциями
Следующий этап — голосовой синтез. Целью было не просто «озвучить» ответ, а сделать его настолько реалистичным, чтобы пользователь не заметил, что говорит с искусственным интеллектом. Собрав необходимое количество текста для сбалансированного набора данных, команда нашла актрису, прекрасно говорящую как по-узбекски, так и по-русски. Она провела более ста часов в студии, записывая тексты в разных эмоциональных тонах. За записями следили сотрудники поддержки — они точно знали, как звучит «живой» диалог с клиентом.
Результаты: ИИ обрабатывает звонки в 10 раз эффективнее
В итоге получился ИИ-агент — цифровой сотрудник банка. Так, например, Collection Agent обрабатывает до 40% звонков и делает это в 10 раз эффективнее человека. Стоимость его работы в разы ниже: такой сотрудник не получает зарплату, не уходит в отпуск и не болеет. При этом его эффективность сопоставима с эффективностью живого сотрудника. Это позволило снизить нагрузку на операторов и высвободить ресурсы для более сложных клиентских вопросов. Решение масштабируется под различные запросы, открывая новые точки роста.
ИИ заговорил по-узбекски — и это не эксперимент, это новый стандарт.
Сайт: aiphoria.ai
Больше новостей про финансы и бизнес в Телеграм-канале @KPTLUZ