Алматыда қазақ мәтіндерінің смарт базасы таныстырылды
Алматыда «Қазақ тілінің ұлттық корпусы» деп аталатын қазақ мәтіндерінің смарт базасы таныстырылды.
Оның көмегімен кез- келген қолданушы өзі іздеген сөз туралы толыққанды әрі жан- жақты тілтанымдық ақпарат ала алады. Жобаны Ахмет Байтұрсынұлы атындағы тіл білімі институтының мамандары жасап шыққан. Бүгін әл-Фараби атындағы Қазақ ұлттық университетінде өткен конференцияда тіл мамандары үш жылда жүргізген ғылыми зерттеулерінің нәтижелерін жұртшылық назарына ұсынды. Атап айтқанда, екі ғылыми монография, латын әліпбиі негізіндегі қазақ жазуының лингвистикалық базасы ғылыми ортаға жол тартты. Сондай-ақ институттың қорындағы 5 миллионға жуық қазақ сөзінің картотекалық қоры толықтай цифрлы форматқа көшірілді. «Қазақ тілінің ұлттық корпусы» смарт базасын жетілдірсек, ұлттық жасанды интеллект жасауға мүмкіндік мол, - дейді тілтанушылар.
Анар Фазылжан, А.Байтұрсынұлы атындағы тіл білімі институтының директоры:
- Параллель мәтіндер корпусы бар. Яғни мысалы, Абай жолының бір сөйлемінің орысша аудармасы қасында қоса тұрады. Тағы басқа да осы параллель корпустың базасына түскен мәтіннің орыс тіліндегі аудармасы қасында тұратын болады. Және ол мәтіндердегі кез келген сөзді бассаңыз ол сөз туралы толық лингвистикалық ақпарат алатын боласыз.