В Казахстане разработали казахскую языковую модель ИИ Kaz LLM
Форсировать развитие искусственного интеллекта в нашей стране поручил Президент на расширенном заседании Кабмина. До конца года предстоит интегрировать его элементы в систему электронного правительства.
В Казахстане тем временем разработали казахскую языковую модель Kaz LLM. Это искусственный интеллект, который понимает и говорит на казахском. Чем она отличается от зарубежных аналогов, выясняла корреспондент «24KZ».
Гульдана Кален, корреспондент:
- На первый взгляд, языковая модель — это просто инструмент для работы с текстом, аналог известного чата GPT, который может обрабатывать запросы, генерировать ответы и решать множество других задач. Но главное отличие Kaz LLM в том, что платформа понимает все тонкости нашего менталитета.
То есть её обучили понимать историю и культуру Казахстана. В платформу загрузили всю отечественную литературу, научные работы и современный контент из открытых источников. И всё это, по словам разработчиков, позволило адаптировать модель под национальные особенности.
Мадина Абдурахманова, старший аналитик данных Института умных систем и искусственного интеллекта:
- К сожалению, казахский язык относится к малоресурсным типам языков на всеобщем интернете. То есть информации в письменных источниках на казахском языке гораздо меньше по сравнению, допустим, с английским, французским, немецким или русским языками. Для того чтобы Kaz LLM отождествляла наше мировоззрение в Казахстане — то, как мы видим историю, культуру, семейные ценности, а также права наших сограждан — мы должны были её обучить другому видению мира и другой работе с казахским языком.
Языковая модель пока поддерживает четыре языка: казахский, русский, турецкий и английский. Она без труда переводит тексты между ними. Главное преимущество Kaz LLM, по словам разработчиков, — это безопасность и защита данных. Информация не покинет границы страны. Это особенно важно для использования в госучреждениях и крупных корпорациях, где утечка данных может привести к серьёзным рискам.
Мадина Абдурахманова, старший аналитик данных Института умных систем и искусственного интеллекта:
- Плюс, мы живем в такое время, когда, к сожалению, существуют различные санкции. У нас многовекторная политика, но тем не менее никто из нас не застрахован от того, что определённые сервисы просто из-за проблем с интернетом или из-за определённых решений будут приостановлены. Поэтому создание модели искусственного интеллекта внутри страны — это действительно вопрос национального суверенитета. Мы должны быть самодостаточны, у нас должны быть свои продукты, которые сделаны на полностью казахстанском ядре.
Сейчас модель уже тестируют на практике. На её основе создаются голосовые помощники для государственных порталов, инструменты для перевода и анализа текстов, а также системы автоматизации документов. По прогнозам профильного министерства, в перспективе Kaz LLM станет основой для создания продуктов в самых разных сферах: от медицины до образования.
Дархан Мырзабаев, заместитель председателя Комитета искусственного интеллекта и развития инноваций МЦРИАП РК:
- То есть человек, допустим, который хочет создать какой-то продукт в сфере медицины, например, рецепты, ему нужен чат-бот или ассистент по выписке рецептов, помощь в том, как принимать лекарства. Вот в таком направлении человек может дообучить свою модель, используя эти данные, нарастить туда определённые данные по фармацевтике и создать свой продукт в данном направлении.
Для создания модели понадобились не только современные технологии, но и команда профессионалов. В проекте участвовали исключительно казахстанские программисты, аналитики и исследователи. Основная работа заняла 8 месяцев, но базу начали готовить ещё пять лет назад.
Авторы: Гульдана Кален, Орден Жаркын.