КІРУ



Аккаунтыңыз жоқ па? Тіркелу

Құпия сөзді ұмытып калдыңыз ба?

THE STATE LANGUAGE DEVELOPMENT INSTITUTE

МЕМЛЕКЕТТІК ТІЛДІ ДАМЫТУ ИНСТИТУТЫ

  ИНСТИТУТ РАЗВИТИЯ ГОСУДАРСТВЕННОГО ЯЗЫКА


БАТЫРЛАР ЖЫРЫ КЕЙІПКЕРЛЕРІН БІРІЗДЕНДІРУ

ТОЛЫҒЫРАҚ

Error 404

404 - Ештеңе табылмады.

Кешіріңіз, сіз іздеген ақпарат бұл жерде жоқ.

«Bilim Innovations Group» ұжымы 2024-2026 жылдарға арналған ғылыми және (немесе) ғылыми-техникалық жобалар бойынша гранттық қаржыландыру аясында «Мемлекеттік тілді дамыту институтының» лингвистикалық қолдауымен автоматтандырылған Qazemle бағдарламасын құрастырды.

Qazemle бағдарламасы – қазақ дыбыстарының (дауысты, дауыссыз) қалыптасқан бұлжымас тіркесу заңдылықтарын анықтайтын, орыс графикасымен хатқа түсе бастағаннан бергі үндестік заңының бұзылуын көрсететін, мәтіндегі қате дыбыс тіркесімдерін автоматты түрде түзеп отыратын IT бағдарлама.

Қазақ тілінің емлесі ХХ ғасырда бірнеше рет өзгеріске ұшырады. Қазақ жазуы 1912 жылдан 1929 жылға дейін араб әліпбиімен жазылып келді, 1929 жылы Кеңес үкіметінің шешімімен латын қарпіне ауысты. Ал 1940 жылдан бастап толықтай кирилл әліпбиіне көшті. Осы кезде тілдегі жазу заңдылығының біразына өзгеріс енді және қазақ тіліне орыс тілінің ықпалымен жат в, ф, х, ч, ц, щ, ь, ъ, э, ё, у, и, ю, я дыбыстары енді. Бұл әріптердің енуі қазақ тілінің жүйесін бұзып, жасанды тіркестерін пайда болуына әкелді. Қос дыбыстың тіркесі ұу, үу, ый, ій, йа дыбыс формасы бір дауысты әріп и, у, я түрінде, үш дыбыс тіркесі йұу, йүу бір әріп ю түрінде жазыла бастады. Бұлай жазу қазақ тілінің буын жігін, дыбыс тіркесімін өрескел бұзып, қазақ жазуына айтарлықтай нұқсан келтірді. Қазіргі кезге дейін орыс тілінің ықпалымен енген бұл әріптер тілімізде белсенді қолданылып келеді, бұл әріптердің  қазақ тіліне енуі тіліміздің заңдарын бұзып, жалған ережелер жазылуына әкеледі.

Жасанды интеллекте сүйенген Qazemle бағдарламасы – жазу тарихында кеткен кемшіліктерді жоюға бағытталған, қазақ тіліндегі табиғи дыбыс тіркесімін қалпына келтіретін жоба. Негізгі құрылым Laravel 12 және Vue 3 (TypeScript) негізінде құрастырылғанымен, алдын ала ержелерді жүйелеу кезеңінде ЖИ дыбыстық талдау жасауға, фонетикалық ережелерді жүйелеуде, сөздердің морфологиялық құрылымын айқындауда, контекстуалды дыбыс өзгерістерін түсіну үшін, сайтқа керекті ережелер құрастыру үшін пайдаланылған. ЖИ арқылы 50 000+ сөз талданып, статистикалық заңдылықтар анықталған. ЖИ арқылы құрылып жатқан ережелер жүйесі дәстүрлі алгоритмдердің негізі болып, сенімді және тұрақты жұмыс істейтін құрал жасауға негіз болған. Құрастырушылар әрі қарай бағдарламаны жетілдіруде жасанды интеллект көмегіне жүгініп отырады.

Жоба негізінде жеке сайт әзірленген. Сайттың бастапқы бетінде мәтін түрлендіргіш орналасқан.

Qazemle жобасын жүзеге асыру үш кезеңнен тұрады:

І. Қазақ сөздеріндегі кездесетін и, у, ю, я таңбаларын қазақ тіліндегі дыбыс тіркесімдеріндегі заңдылықтарына сай жазу.

ІІ. Барлық қазақ сөздерін тек қазақ тілі дыбыстардың тіркесім, үндесім заңдылықтарына бағындырып жазу.

ІІІ. Шеттен сол елдің орфографиясымен кірген сөздерді (термин сөздерді) қазақ тілінің емле ережелеріне бағындыру.

Бірінші кезең бойынша қазақ тілінің табиғатына қайшы келетін и, у, я, ю әріптері бар сөздердің жазылуына қатысты ережелер жаңадан жазылды, ол ережелерді құрастыруға тілші-ғалымдар тартылып, қазақ тілі фонетикасының негізін қалаған А.Байтұрсынұлының еңбектерінен бастап, бұл саланы әрі дамытуға елеулі үлес қосқан С. Мырзабековтің, Ә. Жүнісбековтің еңбектері басшылыққа алынды. Сонымен қатар осы салада жарық көрген соңғы ғылыми еңбектер мен мақалалар сараланды. Кез келген қолданушы өзіне керекті сөзді жазып, и, у, я, ю әріптерінің қалай түрленетіндігін көре алады. Мысалы, қазіргі емлеміз бойынша ми, су, киім, қиын, оқу, беку, жию, тию, кейиді, байиды, термин, институт, университет, туберкулез болып жазылып жүрген сөздердің қазақ тілінің дыбыстық жүйесіне бейімделген нұсқалары мый, сұу, киім, қыйын, оқыу, бекіу, жыйыу, тійіу, кейійді, байыйды, термійн, іністөт, үнеберсет, түберкүлез түрінде жазылуы керек. Мұндағы и мен у әріптері сөздің жуан-жіңішкелігіне қарай: ый, ій, ұу, үу, ыу, іу тіркестеріне өзгерген. У мұнда алдыңғы буындарда кездессе, еріндік дауыстылар арқылы жазылады, ал бірінші буыннан кейін еріндік дауыстылар айтылымда сақталғанымен ыу, іу түрінде жазылады. Қазіргі қолданыстағы емле бойынша жазылған сөздің неге қате екенін түсіндіретін ереже аудио нұсқасымен бірге берілген.

Екінші кезеңінде де қазақ тілінің тіркесім заңдылығына қатысты фонетикадағы іргелі еңбектер басшылыққа алынып, солардағы тұжырымдар қарастырылып, жаңадан IT редакторға ережелер жасақталды.  Екінші кезең қазақ тілінің төл сөзінде қате жазылып кеткен сөздерді, тілдің табиғи заңдарына негіздеп, дұрыс жазуға бағытталған. Мысалы, Қараой, Сарыағаш, Сарыарқа сөздері морфологиялық принципті басшылыққа алып жазылған сөздер, алайда қазақ тілінде екі дауысты дыбыс қатар келмейді, сондықтан бұл  сөздерді IT редактор Қарой, Сарағаш, Сарарқа түрінде түрлендіріп береді. Қазақ тіліндегі дыбыстардың да өзара тіркесу заңдылықтары, валенттілігі бар, мысалы:

– сөз соңында з, ж дыбыстарынан басқа ұяң дыбыстар келмейді: Фархад – Парқат, араб – арап, жад – жады;

– екі бірдей үнді дыбыстар қатар келмейді: молла – молда, діллә – ділдә, Мұқаммед – Мұқамбет;

– түбір мен қосымша, не түбір мен түбір арасында болмаса, қатаң мен үнді, қатаң мен ұяң дыбыстар, ұяң мен үнді тіркеспейді;

– сөз жігінде дауысты дыбыстармен, ұяң, үнді дыбыстарымен қатар қ, к дыбыстары кейінді не ілгерінді ықпалға сай жазылуы керек: сиырқарақат – сыйырғарақат, Талдықорған – Талдығорған, Бекзат – Бегзат, Бекмахамбет – Бекмағамбет.

– Буын үндестігіне бағынбайтын кірме қосымшалар дыбыстық өзгеріске ұшырамай жазылады: дәріхана – дәріқана, Манкент – Манкент, ғұмырнама – ғұмырнама.

Сонымен қатар екінші кезеңде өзге тілдің ықпалымен енген х, щ, ф, ц, һ, ъ, ь, в, э, ч дыбыстарының да жазылуын түрлендіріп береді, өзгеріссіз енген кірме сөздер қазақ тілінің шапанын жауып, бөркін киіп кіруі керек, яғни: ч дыбысы арқылы жазылып жүрген сөздер ш дыбысы арқылы жазылады, мысалы: чемодан – шабадан, счет – шот және т.б. өзге дыбыстардың түрленімі де ащы – ашшы, тұщы – тұшшы, Фарида – Парыйда, хат – қат, хабар – қабар, циркуль – серкүл, айдаһар – айдақар, велосипед – белесепет, электр – електір және т.б. Байқағанымыздай, бұл әріптер қазақ тілінде кездесетін төл дыбыстарына, дыбыс тіркестеріне сай жазылған, яғни ч – ш, щ – шш, э – е, х – қ, һ – қ, в – б, ф – п, ц – тс-с, ъ – Ø, ь – Ø.

Qazemle бағдарламасындағы атқарылған жұмыстар қазіргі «Орфографиялық кеңес» мүшелеріне таныстырылып, оң көзқарас алды. Сонымен қатар ғылым кандидаттары, докторлары мен профессорлардан жинақталған жаңадан «Qazemle Жоғары кеңесі» құрылып, азаматтық қоғам ретінде жұмысын бастамақ. Бұл жоғары кеңестің қызметі – қазақ тілінің сөздерін, сөз тіркестерін және сөйлемдерін дұрыс қолдану үшін тілдің орфографиялық, орфоэпиялық, стилистикалық, лексико-грамматикалық нормаларына сай бекітіп, электронды ресурстар арқылы көпшілікке жариялап отыру. Үшінші кезеңге қатысты шеттен енген сөздердің жазылуына қатысты емле ережелері құрастырылып, Жоғары кеңеске ұсынылады. Жоғары Кеңес ережелерді талқылап, бекіткеннен кейін сайтқа енгізіледі.

Qazemle бағдарламасында, сонымен қатар ұйым ұсынған латын әліпбиі арқылы жазылған емле нұсқасы да қолжетімді. Құрастырушылар қазақ тілін латын әліпбиіне бейімдеудің ұтымды нұсқасын ұсынуға тырысқан, ұ, ш, ғ, ы дыбыстарына жаңадан  Ұсынылған жаңа таңбаларды Unicode символдар жүйесіне енгізуді көздеп отыр.

Qazemle бағдарламасына алдағы уақытта қағазға жазылған мәтіндерді, құжаттарды сканер арқылы өткізіп, редактор бағдарламасына салу арқылы қате жазылған дыбыс тіркесін таба алуы, әртүрлі қаріптерді, түрлі тілдердің әліпбиін, сондай-ақ графикалық символдарды пайдалану, пунктуациялық қателерді анықтау, стильдік қателерді қарастыру секілді қосымша функциялар қосылады деп жоспарлануда. Бағдарламаның жұмысымен https://qazemle.com/transformer сілтемесіне кіріп, таныса аласыздар.


ПІКІР АЛМАСУ

Пікір қалдырыңыз











21/04/2026 10:30

Жыңғылды оқиғасы
0 203 0







26/06/2017 12:02

Жалындаған жастық шақ
0 286805 0


02/05/2017 12:29

Қостілділік мәселесі
0 273104 0


28/04/2017 12:30

Біз іздеген ертегі
0 256497 0









19/05/2017 14:36

Қазақта қанша сөз бар?
0 157865 7

05/06/2017 11:24

Абылайханның күйлері
0 154430 3


ТЕКСТ

Яндекс.Метрика