От диалектов до банковских терминов: как ИИ освоил узбекский язык

Что, если научить искусственный интеллект понимать и говорить на узбекском так же, как это делает человек

От диалектов до банковских терминов: как ИИ освоил узбекский язык

Для полноценной работы технологиям нужна большая библиотека живых примеров языка в цифровом виде. У многих языков, включая узбекский, не хватает таких данных для обучения ИИ-моделей, поэтому они остаются вне фокуса международных разработок. В результате ИИ-решения, прекрасно работающие на английском или русском, на других языках не понимают пользователей, ошибаются или звучат неестественно. Что, если научить искусственный интеллект понимать и говорить на узбекском так же, как это делает человек?

Кейс TBC Uzbekistan и Aiphoria как раз об этом: он показывает, что Узбекистан может создавать технологии мирового уровня, несмотря на сложности разработки и дефицит данных.

В 2024 году TBC Uzbekistan, крупнейшая экосистема цифрового банкинга в Центральной Азии, поставила себе амбициозную цель — разработать собственные речевые технологии. В TBC собрали команду инженеров, проектных менеджеров и лингвистов, а также привлекли Aiphoria — компанию-разработчика платформы для создания цифровых сотрудников на базе ИИ. Реализация совместного проекта заняла почти год — в результате разработана система, способная понимать узбекскую речь со всеми её особенностями — диалектами, акцентами и смешанным языком. Решение создавалось специально для задач банка и было развёрнуто на инфраструктуре TBC Uzbekistan (on-premise).

Не просто бот, а полноценный сотрудник

Технология ИИ-агентов — одна из самых обсуждаемых тем 2025 года. Это не автоматизация диалогов, а создание цифровых сотрудников, которые могут заменить человека в рутинных задачах. Такие агенты умеют понимать устную речь, говорить в ответ реалистичным голосом и вести диалог до конкретной цели — будь то напоминание об оплате, регистрация заявки или помощь в навигации по услугам.

Научиться слышать: как создавали систему распознавания речи

Работа началась с самой сложной части — понимания устной речи. Ведь готовые международные решения давали слишком много ошибок. Например, при тестировании на реальных звонках выяснилось, что в среднем они правильно распознают лишь 6 из 10 слов.

Решив разрабатывать собственную систему, партнёры объединили многолетнюю экспертизу Aiphoria в корпоративных AI-продуктах с реальными данными TBC Uzbekistan и глубоким знанием финтех-рынка и узбекского языка.

Сначала были собраны аудиоданные из открытых источников и звонков в контакт-центр, которые были полностью анонимизированы. Ключевым стало именно использование реальных данных банка: с его акустикой, лексикой и сценариями. Затем началась кропотливая работа по разметке. Над ней трудились лингвисты, операторы, редакторы. Нужно было учесть всё: переход с кириллицы на латиницу, множество диалектов (ташкентский, хорезмский, наманганский и другие), а также многочисленные варианты написания одних и тех же слов.

При этом особое внимание уделялось банковской лексике — терминам, которые базовая модель может и не знать. Некоторые слова и выражения, вроде «аннуитетных платежей» (oylik teng miqdordagi to’lovlar), изначально не были знакомы даже опытным разметчикам. За точность значений и корректную интерпретацию терминов отвечали специалисты банка — они помогали уточнять контекст и адаптировать лексику под реальные сценарии.

Научиться говорить: реалистичный голос с эмоциями

Следующий этап — голосовой синтез. Целью было не просто «озвучить» ответ, а сделать его настолько реалистичным, чтобы пользователь не заметил, что говорит с искусственным интеллектом. Собрав необходимое количество текста для сбалансированного набора данных, команда нашла актрису, прекрасно говорящую как по-узбекски, так и по-русски. Она провела более ста часов в студии, записывая тексты в разных эмоциональных тонах. За записями следили сотрудники поддержки — они точно знали, как звучит «живой» диалог с клиентом.

Результаты: ИИ обрабатывает звонки в 10 раз эффективнее

В итоге получился ИИ-агент — цифровой сотрудник банка. Так, например, Collection Agent обрабатывает до 40% звонков и делает это в 10 раз эффективнее человека. Стоимость его работы в разы ниже: такой сотрудник не получает зарплату, не уходит в отпуск и не болеет. При этом его эффективность сопоставима с эффективностью живого сотрудника. Это позволило снизить нагрузку на операторов и высвободить ресурсы для более сложных клиентских вопросов. Решение масштабируется под различные запросы, открывая новые точки роста.

ИИ заговорил по-узбекски — и это не эксперимент, это новый стандарт.

Сайт: aiphoria.ai

Больше новостей про финансы и бизнес в Телеграм-канале @KPTLUZ

tg

Материалы по теме

Киберпреступность в Узбекистане выросла в 68 раз за пять лет
/
Киберпреступность в Узбекистане выросла в 68 раз за пять лет
Казахстан объявил о запуске пилотной зоны CryptoCity
/
Казахстан объявил о запуске пилотной зоны CryptoCity
Авиакомпания Centrum Air получила новый Airbus A320neo
/
Авиакомпания Centrum Air получила новый Airbus A320neo