Қазақ тілін жасанды интеллект арқылы дамытудың моделі әзірленіп жатыр

Талдықорған қаласы несімен танымал? Талдықорған өзінің табиғи ландшафтарымен және көлдерімен танымал. Ол сонымен қатар, ауыл шаруашылығының орталығы және бай мәдени мұраға ие. 

Қазақстанда осылайша адаммен кері байланыс құрып, түрлі тақырыпта еркін тілдесе алатын виртуалды көмекші пайда болады. Елімізде бұған мүмкіндік беретін қазақ тілінің ауқымды тілдік моделі әзірленуде. Жасанды интеллектіге негізделген ақылды жүйе тілді терең өңдеуге қауқарлы. Қойған сұраққа жауап беріп, қорытынды жасайды. Мәтінді әп-сәтте бір тілден екіншісіне аударады. Сандық инфрақұрылымның қорында уикипедия,  ақпараттық агенттіктер және мемлекеттік сайттардан алынған қазақ тіліндегі түрлі дерекөздер жинақталған.

Жобаның модельдік оқу корпусында қазақ тілімен қатар орыс, ағылшын және түрік тілдері де бар.     

Ербол Әбсәлямов, Ақылды жүйелер және жасанды интеллект институты директорының орынбасары:

– Біз оны сәуір айында бастадық. Қазіргі кезде қазақ тілінде 30 млрд токин жинадық. Қыркүйекке қарай деректерді жинау жұмысын  аяқтаймыз. Тренинг бастаймыз. Кейін қыркүйектің ортасына қарай алдын ала модел болады деп ойлаймыз. 16 желтоқсан деп отырмыз, жоба бітеді және біз оны елге жариялаймыз. GPT чат қазір текст ретінде ұсынылған, біздің жоспарымызда бар келесі жылы language vision model деп аталынады, бір сурет көрсетсеңіз сол бойынша сізбен сөйлеседі.  Және сол жерде тіл байланысады, яғни сізбен ағылшын, орыс, қазақ тілінде сөйлесе алады. 

1. Жасанды интеллектті қолданасыз ба?