AI Сөздігі

Кешенді глоссарийімізбен жасанды интеллект терминологиясын түсінікті етіңіз. Машиналық оқытудан нейрондық желілерге дейін, біз күрделі AI концепцияларын қарапайым терминдерге бөлеміз.

Сәйкестік (Alignment)

Alignment
AI жүйесінің мақсаттарын, нәтижелерін және мінез-құлқын адам мақсаттары мен құндылықтарына сәйкес келтіру процесі. Бұл әсіресе, explicitly бағдарламаланбаған мінез-құлықтарды дамытуы мүмкін озық жүйелер үшін маңызды.
Мысал: Психикалық денсаулыққа арналған чат-боттың сұраныстарға қарамастан, зиянды әрекеттерді ұсынбауын қамтамасыз ету.

Қолданбалы бағдарламалау интерфейсі (API) (Application Programming Interface (API))

Application Programming Interface (API)
Әртүрлі бағдарламалық жүйелерге байланысуға және деректер алмасуға мүмкіндік беретін анықталған ережелер мен протоколдар жиынтығы.
Мысал: Веб-қосымшаңызда тілдік модель жасаған жауапты алу және сұраныс жіберу үшін OpenAI API-ін пайдалану.

Жасанды жалпы интеллект (AGI) (Artificial General Intelligence (AGI))

Artificial General Intelligence (AGI)
Адам жасай алатын кез келген интеллектуалды тапсырманы орындай алатын AI-дің теориялық түрі. Ол әртүрлі салалар бойынша оқытуды жалпылайды.
Мысал: AGI жүйесі тапсырмаға арналған бағдарламалаусыз музыка композициясын үйрене алады, хирургия жасай алады және философия емтиханынан өте алады.

Жасанды интеллект (AI) (Artificial Intelligence (AI))

Artificial Intelligence (AI)
Ойлауға, пайымдауға және автономды әрекет етуге бағдарланған машиналардағы адам интеллектуалдығын симуляциялау.
Мысал: AI Siri сияқты жеке көмекшілер мен Tesla Autopilot сияқты автономды жүргізу жүйелерін қуаттайды.

AI этикасы (AI Ethics)

AI Ethics
AI әзірлеу мен пайдаланудың, соның ішінде әділдік, құпиялылық, жауапкершілік және кемсітпеушілік сияқты моральдық салдарларымен айналысатын пән.
Мысал: Жұмысқа қабылдау алгоритмдерінің жыныс немесе этникалық тегі бойынша кемсітушілікті болдырмау үшін нұсқаулықтар жасау.

Қосымша интеллект (Augmented Intelligence)

Augmented Intelligence
AI-дің адам интеллектуалдығын алмастырудан гөрі, оны толықтыратын және күшейтетін бірлескен модель.
Мысал: Дәрігерлерге аномалияларды көрсететін, соңғы диагнозды қоятын AI-жетекшілік ететін рентгенологиялық құралдар.

Автономды агент (Autonomous Agent)

Autonomous Agent
Адам араласуынсыз өз мақсаттарына жету үшін өз шешімдерін қабылдай және әрекеттер жасай алатын AI жүйесі.
Мысал: Қала көшелерін шарлап, кедергілерді тәуелсіз түрде айналып өтетін автономды жеткізу роботы.

Артқа тарату (Backpropagation)

Backpropagation
Нейрондық желілерді жаттықтыру үшін салмақтарды шығыстан кіріс қабаттарына қарай кері бағытта жаңарту, болжау қателерін азайту арқылы қолданылатын әдіс.
Мысал: Қолмен жазылған цифрларды танудағы қателік деңгейін азайту үшін сурет классификаторларын жаттықтыруда қолданылады.

Теңсіздік (Алгоритмдік теңсіздік) (Bias (Algorithmic Bias))

Bias (Algorithmic Bias)
Теңгерімсіз немесе өкілді емес оқыту деректеріне байланысты AI нәтижелеріндегі байқаусыз және жүйелі артықшылық.
Мысал: Оқыту деректерінде аз көрсетілгендіктен, нәсілдік азшылықтарды жиірек қате анықтайтын бетті тану жүйесі.

Үлкен деректер (Big Data)

Big Data
AI модельдерін жаттықтыру үшін қолданылатын, сақтау, талдау және құндылықты шығару үшін арнайы құралдарды қажет ететін өте үлкен деректер жиындары.
Мысал: Электрондық коммерция платформалары үшін ұсыныс жүйелерін жаттықтыру үшін миллиондаған пайдаланушы әрекеттерін пайдалану.

Қара жәшік моделі (Black Box Model)

Black Box Model
Адамдарға оңай түсіндіруге болмайтын ішкі логикасы бар AI немесе машиналық оқыту моделінің түрі, бұл шешімдердің қалай қабылданатынын түсінуді қиындатады.
Мысал: Несиелерді мақұлдау үшін қолданылатын, бірақ бір өтініш берушінің неге қабылданғанын және екіншісінің қабылданбағанын нақты түсіндірмейтін терең нейрондық желі.

Когнитивті есептеу (Cognitive Computing)

Cognitive Computing
NLP және үлгіні тану сияқты әдістерді қолданып, адам ойлау процестерін, мысалы, пайымдау мен оқытуды симуляциялауға арналған AI жүйелері.
Мысал: Заңгерлерге іс бойынша заңдарды талдауға және нәтижелерді болжауға көмектесетін когнитивті есептеу жүйесі.

Компьютерлік көру (Computer Vision)

Computer Vision
Компьютерлерге суреттер мен бейнелер сияқты визуалды деректерді түсіндіруге және өңдеуге мүмкіндік беретін жасанды интеллект саласы.
Мысал: Компьютерлік көруді қолданып, қауіпсіздік бейнежазбаларындағы адамдарды анықтайтын бетті тану жүйелері.

Корпус (Corpus)

Corpus
Тілдік модельдерді жаттықтыру үшін қолданылатын жазбаша немесе ауызша мәтіндердің үлкен жинағы.
Мысал: Common Crawl деректер жиыны GPT сияқты үлкен тілдік модельдерді жаттықтыру үшін қолданылатын қоғамдық веб-корпус болып табылады.

Деректердің ағып кетуі (Data Drift)

Data Drift
Уақыт өте келе кіріс деректері өзгеретін, модельдің жұмысының нашарлауына әкелетін құбылыс.
Мысал: Өнеркәсіптік жабдықтарға арналған болжамды техникалық қызмет көрсету моделі жаңа сенсор технологиясы енгізілген сайын азырақ дәл болады.

Деректерді таңбалау (Data Labelling)

Data Labelling
Бақыланатын оқытуға жарамды ету үшін деректерді тегтермен немесе таңбалармен аннотациялау процесі.
Мысал: Қатерлі ісікті анықтау моделін жаттықтыру үшін мыңдаған ісік суреттерін қатерсіз немесе қатерлі деп таңбалау.

Деректерді кендеу (Data Mining)

Data Mining
Үлкен деректер жиындарындағы мағыналы үлгілерді, корреляцияларды және аномалияларды ашу процесі.
Мысал: Дүкендер жаялықтарды сатып алған адамдар сыраны да жиі сатып алатынын анықтау үшін деректерді кендеуді пайдаланады.

Терең оқыту (Deep Learning)

Deep Learning
Күрделі деректер үлгілерін модельдеу үшін көп қабатты нейрондық желілерді қолданатын машиналық оқытудың кіші саласы.
Мысал: Терең оқыту GPT-4 сияқты тілдік модельдерде және Stable Diffusion сияқты сурет жасау модельдерінде қолданылады.

Диффузиялық модельдер (Diffusion Models)

Diffusion Models
Кездейсоқ шуды құрылымдалған нәтижелерге біртіндеп түрлендіру арқылы деректерді шығаруды үйренетін генеративті модельдер класы.
Мысал: Stable Diffusion диффузиялық әдістерін қолданып, мәтіндік сұраныстардан фотореалистік суреттер жасайды.

Эмбеддинг (Embedding)

Embedding
Сөздердің, суреттердің немесе сөйлемдердің семантикалық мағынасын қамтитын, жиі қолданылатын деректердің сандық векторлық өкілдігі.
Мысал: NLP-де 'банк' сөзі контекстке байланысты 'өзен жағасы' сөзінен айырмашылығымен 'ақша' сөзіне ұқсас эмбеддингтерге ие болуы мүмкін.

Эпоха (Epoch)

Epoch
Машиналық оқыту моделін жаттықтыру процесінде бүкіл оқыту деректер жиынтығы бойынша толық итерация.
Мысал: Егер деректер жиынында 1000 мысал болса және модель олардың барлығын жаттықтыру кезінде бір рет көрсе, бұл бір эпоха болып табылады.

Этикалық AI (Ethical AI)

Ethical AI
AI технологияларының ашық, әділ және қоғамдық құндылықтарға сәйкес жұмыс істеуін қамтамасыз ететін дизайн және енгізу философиясы.
Мысал: Азшылық кандидаттарды кемсітушілікті болдырмау үшін теңсіздік тексерулерін қамтитын AI жұмысқа қабылдау құралы.

Сарапшы жүйе (Expert System)

Expert System
Ережелер мен логиканы қолданып, белгілі бір саладағы адам сарапшысының шешім қабылдау қабілеттерін имитациялайтын AI жүйесі.
Мысал: Топырақ деректері мен зиянкестер тарихына негізделген дақылдарды өңдеуді ұсынатын ауыл шаруашылығында қолданылатын сарапшы жүйе.

Түсіндірілетін AI (XAI) (Explainable AI (XAI))

Explainable AI (XAI)
Адамдарға өздерінің ішкі процестері мен шешім қабылдау процестерін түсінікті ететін AI жүйелері, сенім мен жауапкершілікті арттырады.
Мысал: Медициналық диагностикалық AI, ол ұсыныс бере отырып, қандай белгілер осы қорытындыға әкелгенін түсіндіреді.

Аз үлгімен оқыту (Few-shot Learning)

Few-shot Learning
Модель тек аз мөлшердегі таңбаланған мысалдарды қолданып жаттықтырылатын немесе қайта бапталатын машиналық оқыту әдісі.
Мысал: Заңгерлік электрондық хаттарды жазу үшін LLM-ді 10 мысал көрсеткеннен кейін оны реттеу.

Қайта баптау (Fine-tuning)

Fine-tuning
Алдын ала дайындалған модельді алып, оны жаңа, кішірек деректер жиынтығында арнайы тапсырмаға мамандандыру үшін одан әрі жаттықтыру процесі.
Мысал: Заңгерлік жазу көмекшісін жасау үшін жалпы LLM-ді, мысалы, GPT-ні ішкі заңгерлік құжаттарда қайта баптау.

Негізгі модель (Foundation Model)

Foundation Model
Әртүрлі және кең деректерде жаттықтырылған, көптеген төменгі тапсырмаларға бейімделе алатын ауқымды модель.
Мысал: GPT-4 және PaLM 2 - бұл қысқарту, сұрақ-жауап, аудару және т.б. жасай алатын негізгі модельдер.

Fuzzy логика (Fuzzy Logic)

Fuzzy Logic
Белгісіздік жағдайында пайымдау үшін пайдалы, белгілі бір шын/жалған (бинарлы) логикадан гөрі, жуық мәндермен жұмыс істейтін логика түрі.
Мысал: Климатты бақылау жүйелерінде 'сәл ыстық' немесе 'өте суық' сияқты fuzzy кірістеріне негізделген температураны реттеу үшін қолданылады.

Генеративті қарсылас желісі (GAN) (Generative Adversarial Network (GAN))

Generative Adversarial Network (GAN)
Екі желі - генератор мен дискриминатор - шығыс сапасын жақсарту үшін бәсекелесетін генеративті модель архитектурасы.
Мысал: GAN-дар deepfake бейнелерін жасау немесе эскиздерден шынайы өнім суреттерін жасау үшін қолданылады.

Генеративті AI (Generative AI)

Generative AI
Жаттықтыру деректерінен жаңа мазмұнды - мәтін, суреттер, музыка немесе бейне сияқты - жасай алатын жасанды интеллекттің санаты.
Мысал: ChatGPT блог жазбаларын жасау немесе Midjourney мәтіндік сұраныстардан цифрлық өнер туындыларын жасау.

Генеративті алдын ала дайындалған трансформатор (GPT) (Generative Pre-trained Transformer (GPT))

Generative Pre-trained Transformer (GPT)
Трансформатор архитектурасын қолданатын және әртүрлі тілдік тапсырмаларды орындау үшін үлкен көлемдегі мәтіндік деректерде алдын ала дайындалған OpenAI әзірлеген үлкен тілдік модельдер класы.
Мысал: GPT-4 эсселер жазу, тілдерді аудару және аз сұраныспен құжаттарды қысқарту қабілетіне ие.

Генетикалық алгоритм (Genetic Algorithm)

Genetic Algorithm
Табиғи сұрыптаудан шабыттанған, шешімдер мутация, кроссовер және сұрыптау арқылы уақыт өте келе дамитын оңтайландыру әдісі.
Мысал: Ең жақсылардың тіршілігін симуляциялау арқылы тиімді нейрондық желі архитектураларын жобалау үшін қолданылады.

Галлюцинация (Hallucination)

Hallucination
AI моделімен сенімді естілетін, бірақ фактілік тұрғыдан қате немесе мағынасыз мазмұнды жасау.
Мысал: Тілдік модель жоқ сілтемені ойлап табады немесе жалған тарихи фактілерді береді.

Эвристика (Heuristic)

Heuristic
Міндетті түрде мінсіз шешімді кепілдендірмейтін, бірақ дереу мақсаттар үшін жеткілікті болатын проблеманы шешудің практикалық тәсілі.
Мысал: Логистикалық AI жүйесінде жеткізу уақытын бағалау үшін ережелерді қолдану.

Гиперпараметр (Hyperparameter)

Hyperparameter
Оқыту алдында орнатылатын конфигурациялық мән, мысалы, оқыту жылдамдығы немесе қабаттар саны.
Мысал: Оқыту жылдамдығын және модель жұмысын жақсарту үшін пакет өлшемін 32-ден 128-ге дейін реттеу.

Инференс (Inference)

Inference
Жаттықтырылған машиналық оқыту моделін жаңа кіріс деректерінен болжам жасау немесе нәтижелер шығару үшін қолдану процесі.
Мысал: Клиенттерге қызмет көрсету командалары үшін электрондық хаттарды жасау үшін қайта бапталған GPT моделін пайдалану.

Ниетті анықтау (Intent Detection)

Intent Detection
Жүйенің пайдаланушының хабарламадағы мақсатын немесе ниетін анықтайтын табиғи тілді түсінудегі тапсырмасы.
Мысал: Чат-ботта 'Мен ұшаққа билет алғым келеді' дегенді саяхатты брондау ниеті ретінде тану.

Интернет заттары (IoT) (Internet of Things (IoT))

Internet of Things (IoT)
Деректерді жинау және алмасу үшін сенсорлармен, бағдарламалық жасақтамамен және басқа да технологиялармен жабдықталған байланысқан физикалық құрылғылар желісі.
Мысал: Пайдалану деректерін хабарлайтын және AI аналитикасын қолданып параметрлерді реттейтін смарт термостаттар мен тоңазытқыштар.

Түсіндіру (Interpretability)

Interpretability
Адамның машиналық оқыту моделінің ішкі механизмдерін және оның шешім қабылдау процесін түсіне алатын дәрежесі.
Мысал: Шешім ағашы терең нейрондық желіге қарағанда түсініктірек, өйткені оның шешімдері бақыланады.

Jupyter Notebook (Jupyter Notebook)

Jupyter Notebook
Пайдаланушыларға код жазуға, нәтижелерді визуализациялауға және талдауды бір интерфейсте құжаттауға мүмкіндік беретін ашық бастапқы интерактивті есептеу ортасы.
Мысал: Деректер ғалымдары машиналық оқыту модельдерін прототиптеу және нәтижелерді бөлісу үшін Jupyter Notebook-тарды пайдаланады.

K-ең жақын көршілер (KNN) (K-Nearest Neighbours (KNN))

K-Nearest Neighbours (KNN)
Классификация және регрессия үшін қолданылатын қарапайым, параметрі жоқ машиналық оқыту алгоритмі. Ол ең жақын оқыту мысалдарына негізделген шешімдер қабылдайды.
Мысал: Жаңа жемісті алма немесе алмұрт деп жіктеу үшін KNN пішін мен түс бойынша ең жақын таңбаланған жемістерді тексереді.

Білім графы (Knowledge Graph)

Knowledge Graph
Объектілер мен олардың қарым-қатынастарының өзара байланысты сипаттамаларын көрсету және сақтау үшін түйіндер мен жиектерді қолданатын деректер құрылымы.
Мысал: Google-дің білім панелі адамдар, орындар және оқиғалар сияқты объектілерді байланыстыратын білім графымен қуатталады.

Тілдік оқыту моделін оңтайландыру (LLMO) (Language Learning Model Optimisation (LLMO))

Language Learning Model Optimisation (LLMO)
Үлкен тілдік модельдердің жұмысын, тиімділігін немесе бейімделуін арнайы тапсырмалар немесе салалар үшін жақсарту үшін қолданылатын әдістер.
Мысал: Корпоративтік пайдалану үшін LLM-ді оңтайландыру үшін кванттық және нұсқаулықты реттеуді қолдану.

Үлкен тілдік модель (LLM) (Large Language Model (LLM))

Large Language Model (LLM)
Адам тілімен жасауға, түсінуге және пайымдауға қабілетті, үлкен көлемдегі мәтіндік деректерде жаттықтырылған терең оқыту моделінің түрі.
Мысал: ChatGPT және Claude - бұл жазу, кодтау және сұрақтарға жауап беруде көмектесуге арналған LLM-дер.

Латентті кеңістік (Latent Space)

Latent Space
Генеративті модельдер мен эмбеддингтерде қолданылатын, ұқсас кірістер жақын орналасқан жоғары өлшемді абстрактілі өкілдік.
Мысал: Сурет жасауда латентті кеңістікті манипуляциялау жарықтық немесе эмоция сияқты ерекшеліктерді өзгерте алады.

Оқыту жылдамдығы (Learning Rate)

Learning Rate
Модель салмақтарының шығыс градиентіне қатысты қаншалықты өзгертілетінін бақылайтын жаттықтырудағы негізгі гиперпараметр.
Мысал: Жоғары оқыту жылдамдығы минимумдарды асыра басуға әкелуі мүмкін, ал тым төмен жылдамдық жаттықтыру прогресін баяулатады.

Машиналық оқыту (ML) (Machine Learning (ML))

Machine Learning (ML)
Жүйелерге деректерден үйренуге және арнайы бағдарламаланбай жұмысын жақсартуға мүмкіндік беретін AI тармағы.
Мысал: Спам сүзгіштері электрондық хаттарды өткен мысалдарға негізделген спам немесе спам емес деп жіктеу үшін машиналық оқытуды қолданады.

Модельдің ағып кетуі (Model Drift)

Model Drift
Деректер немесе қоршаған орта өзгерістеріне байланысты модельдің дәлдігі уақыт өте келе төмендейтін құбылыс.
Мысал: Алдау тактикалары дамыған сайын, алаяқтықты анықтау моделі азырақ дәл болады.

Модельді оқыту (Model Training)

Model Training
Машиналық оқыту моделіне деректерді беру және қатені азайту үшін оның параметрлерін реттеу процесі.
Мысал: Жаңа өнімдерді ұсыну үшін клиенттердің сатып алу тарихында болжамды ұсыныс жүйесін жаттықтыру.

Мультимодалды AI (Multimodal AI)

Multimodal AI
Мәтін, суреттер, аудио және бейне сияқты бірнеше деректер түрлерін өңдеуге және біріктіруге қабілетті AI жүйелері.
Мысал: Бір уақытта мәтінді оқи және суреттерді түсіндіре алатын GPT-4 Vision сияқты модель.

Табиғи тілді өңдеу (NLP) (Natural Language Processing (NLP))

Natural Language Processing (NLP)
Компьютерлер мен адам (табиғи) тілдері арасындағы өзара әрекеттесуге бағытталған AI кіші саласы. Ол машиналарға адам тілінде оқуға, түсінуге және жауап беруге мүмкіндік береді.
Мысал: NLP дауыстық көмекшілерде, тіл аудару қосымшаларында және чат-боттарда қолданылады.

Нейрондық желі (Neural Network)

Neural Network
Адам миының құрылымынан шабыттанған, байланысқан түйіндер (нейрондар) қабаттарынан тұратын машиналық оқыту моделі.
Мысал: Нейрондық желілер сурет және дыбыс тануда қолданылатын терең оқыту модельдерінің артында тұр.

Шу (Noise)

Noise
Деректердегі мағыналы үлгілерді бұзатын және модель жұмысына теріс әсер ететін кездейсоқ немесе мағынасыз ақпарат.
Мысал: Сенсор қателері немесе қателермен толтырылған деректер жазбалары шу болып саналуы мүмкін.

Онтология (Ontology)

Ontology
Белгілі бір саладағы ұғымдар арасындағы қарым-қатынастарды санаттайтын және анықтайтын құрылымдалған жүйе, семантикалық AI жүйелерінде жиі қолданылады.
Мысал: Денсаулық сақтау саласындағы онтология симптомдардың аурулармен және емдеулермен қалай байланысты екенін анықтауы мүмкін.

Шамадан артық оқыту (Overfitting)

Overfitting
Модельдің оқыту деректеріндегі шуды қамтып, жаңа деректерде нашар жұмыс істейтін модельдеу қатесі.
Мысал: Оқыту жауаптарын жаттайтын, бірақ көрінбейтін тест деректерін өңдей алмайтын модель шамадан артық оқытылған.

Болжамды аналитика (Predictive Analytics)

Predictive Analytics
Тарихи деректерге негізделген болашақ нәтижелердің ықтималдығын анықтау үшін деректерді, алгоритмдерді және AI-ді пайдалану.
Мысал: Дүкендер белгілі бір өнімдерге сұранысты болжау үшін болжамды аналитиканы қолданады.

Алдын ала оқыту (Pre-training)

Pre-training
Модельді арнайы тапсырмаларға мамандандыру үшін оны қайта баптау алдында, кең, жалпы деректерде бастапқы жаттықтыру процесі.
Мысал: GPT модельдері клиенттерге қызмет көрсету чат-боттарына мамандандырылғанша, үлкен корпус бойынша алдын ала дайындалады.

Prompt инженериясы (Prompt Engineering)

Prompt Engineering
Үлкен тілдік модельдердің нәтижесін бағыттау үшін тиімді сұраныстарды құрастыру өнері мен ғылымы.
Мысал: 'Сыпайы оқытушы ретінде жауап бер' сияқты жүйелік нұсқаулықтарды қосу - prompt инженериясының мысалы.

Кванттық есептеу (Quantisation)

Quantisation
Кванттық механикаға негізделген есептеудің жаңа парадигмасы, ол экспоненциалды өңдеу мүмкіндіктері үшін әлеуетті иеленеді.
Мысал: Кванттық есептеу болашақта AI жаттықтыруын классикалық шектеулерден асыра арттыруы мүмкін.

Ақыл-ой қозғаушысы (Quantum Computing)

Quantum Computing
AI-де ережелерді немесе инференс алгоритмдерін қолданып, фактілер немесе деректер жиынтығынан логикалық қорытындылар шығаратын жүйе.
Мысал: AI диагностикалық құралы симптомдарға негізделген ықтимал медициналық жағдайларды анықтау үшін ақыл-ой қозғаушысын қолданады.

Қайта күшейтуді оқыту (RL) (Reasoning Engine)

Reasoning Engine
Агенттер өздерінің ортасымен өзара әрекеттесу арқылы жиынтық сыйақыны барынша арттыру үшін үйренетін машиналық оқыту саласы.
Мысал: RL әдістерін қолданып, роботтың жүруді үйренуі.

Адам пікірімен қайта күшейтуді оқыту (RLHF) (Reinforcement Learning (RL))

Reinforcement Learning (RL)
Адам артықшылықтары AI сыйақы сигналын басқаратын оқыту әдісі, тілдік модельдерді қайта баптауда жиі қолданылады.
Мысал: ChatGPT көбірек пайдалы және қауіпсіз жауаптарды шығару үшін RLHF арқылы дайындалды.

Іздеу-қосымша генерация (RAG) (Reinforcement Learning with Human Feedback (RLHF))

Reinforcement Learning with Human Feedback (RLHF)
Ақпаратты іздеуді генерациямен біріктіретін әдіс, мұнда LLM өз жауабын жақсарту үшін тиісті құжаттарды алады.
Мысал: Техникалық сұраққа жауап берген кезде AI көмекшісі өнім спецификацияларын тауып, сілтейді.

Өздігінен бақыланатын оқыту (Retrieval-Augmented Generation (RAG))

Retrieval-Augmented Generation (RAG)
Модельдер шикі деректерден өз таңбаларын жасау арқылы үлгілерді үйренетін оқыту тәсілі, адаммен таңбаланған деректерге тәуелділікті азайтады.
Мысал: BERT мәтінде жоғалған сөздерді болжау арқылы өзіндік бақыланатын оқытумен дайындалады.

Семантикалық іздеу (Self-Supervised Learning)

Self-Supervised Learning
Тек кілт сөздерді сәйкестендіру емес, пайдаланушының ниетін және контекстік мағынасын түсінетін іздеу әдісі.
Мысал: 'Ағып жатқан кранды қалай жөндеуге болады' деп іздегенде, құжатта 'ағып жатқан кран' сөзі болмаса да, нұсқаулықтарды табады.

Көңіл-күйді талдау (Semantic Search)

Semantic Search
Мәтіндегі эмоцияларды, пікірлерді немесе көзқарастарды анықтау процесі, жиі оң, теріс немесе бейтарап деп жіктеледі.
Мысал: Жаңа өнімге қоғамдық реакцияны бағалау үшін твиттерді талдау.

Стохастикалық (Sentiment Analysis)

Sentiment Analysis
Кездейсоқ немесе ықтималды мінез-құлықты қамтитын, жиі генеративті AI және оңтайландыру алгоритмдерінде қолданылады.
Мысал: GPT-4 нәтижесі оның стохастикалық декодтау процесіне байланысты бірдей кіріс үшін өзгереді.

Мықты AI (Stochastic)

Stochastic
Жасанды жалпы интеллект (AGI) деп те аталады, барлық салаларда адам деңгейіндегі когнитивті қабілеттері бар машиналарды білдіреді.
Мәселен: Автономды түрде роман жаза алатын, қалаларды жоспарлайтын және этикалық дилеммаларды бірдей жақсы шешетін болашақ AI.

Супер жасанды интеллект (SAI) (Strong AI)

Strong AI
Барлық аспектілерде - пайымдау, шығармашылық, эмоционалды интеллект және т.б. - адам интеллектуалдығынан асып түсетін теориялық AI.
Мысал: SAI теориялық түрде жаңа ғылымдар мен философияларды тәуелсіз түрде дамыта алады.

Бақыланатын оқыту (Super Artificial Intelligence (SAI))

Super Artificial Intelligence (SAI)
Модельдер кіріс-шығыс карталарын үйрену үшін таңбаланған деректерде жаттықтырылатын машиналық оқыту әдісі.
Мысал: Электрондық хаттарды спам немесе спам емес деп жіктеуді тарихи мысалдарды қолданып үйрету.

Синтетикалық деректер (Supervised Learning)

Supervised Learning
Нақты деректер жеткіліксіз немесе құпия болған кезде жаттықтыру үшін қолданылатын, нақты әлем деректерін симуляциялайтын жасанды түрде жасалған деректер.
Мысал: Пациент құпиялылығын бұзбай диагностикалық модельдерді жаттықтыру үшін синтетикалық медициналық суреттерді жасау.

Токен (Synthetic Data)

Synthetic Data
LLM-дермен өңделетін мәтін бірлігі - әдетте сөз немесе сөз бөлігі.
Мысал: 'Сәлем әлем!' сөйлемі 3 токенге бөлінеді: 'Сәлем', 'әлем' және '!'.

Токенизация (Token)

Token
Модельмен өңдеу үшін мәтінді токендерге бөлу процесі.
Мысал: NLP-де 'ChatGPT тамаша' ['Chat', 'G', 'PT', 'is', 'great'] болып бөлінеді.

Трансферлік оқыту (Tokenisation)

Tokenisation
Жаттықтыру уақытын және деректер қажеттілігін азайту арқылы, басқа байланысты тапсырмада оқытуды жақсарту үшін бір тапсырмадан алынған білімді пайдалану.
Мысал: Ағылшын тілінде жаттықтырылған модельді басқа тілде көңіл-күйді талдау тапсырмасына мамандандыру.

Трансформатор (Transfer Learning)

Transfer Learning
Тізбекті деректерді модельдеу үшін назар аудару механизмдерін қолданатын, LLM-дерде кеңінен қолданылатын нейрондық желі архитектурасы.
Мысал: BERT, GPT және T5 - бәрі трансформатор негізіндегі модельдер.

Шамадан аз оқыту (Transformer)

Transformer
Модельдің оқыту деректеріндегі үлгілерді қамту үшін тым қарапайым болуы, нәтижесінде нашар жұмыс істейді.
Мысал: Күрделі сурет классификацияларын болжауға тырысатын сызықтық модель шамадан аз оқытылуы мүмкін.

Бақыланбайтын оқыту (Underfitting)

Underfitting
Модельдер таңбаланбаған деректердегі үлгілерді немесе кластерлерді анықтайтын оқыту тәсілі.
Мысал: Алдын ала анықталған таңбаларсыз тұтынушыларды сатып алу мінез-құлқына негізделген топтарға бөлу.

Пайдаланушы ниеті (Unsupervised Learning)

Unsupervised Learning
Пайдаланушының сұранысы немесе әрекеті артындағы мақсат немесе ниет.
Мысал: 'Тортты қалай пісіруге болады' деп теру арқылы пайдаланушы рецепт табуды көздейді.

Валидация жиынтығы (User Intent)

User Intent
Жаттықтыру кезінде модель жұмысын бағалау және гиперпараметрлерді реттеу үшін қолданылатын деректердің кіші жиынтығы.
Мысал: Соңғы тестілеу алдында шамадан артық оқытуды анықтау үшін қолданылады.

Векторлық дерекқор (Validation Set)

Validation Set
Ұқсастық іздеу және RAG сияқты AI тапсырмаларында қолданылатын векторлық эмбеддингтерді сақтау және іздеу үшін арналған дерекқор.
Мысал: Pinecone және Weaviate - мәтіндік немесе суреттік эмбеддингтерді сақтауға арналған векторлық дерекқорлар.

Векторлық эмбеддинг (Vector Database)

Vector Database
Деректердің семантикалық мағынасын және қарым-қатынастарын векторлық кеңістікте сақтайтын сандық өкілдігі.
Мысал: 'Патша' және 'патшайым' сөздері жыныстық айырмашылықтарымен ұқсас эмбеддингтерге ие.

Виртуалды көмекші (Vector Embedding)

Vector Embedding
Сөйлесу немесе дауыс командалары арқылы пайдаланушыларға тапсырмаларды орындауға көмектесетін AI-жетекшілік ететін бағдарламалық агент.
Мысал: Siri, Alexa және Google Assistant танымал виртуалды көмекшілер болып табылады.

Дауыс тану (Virtual Assistant)

Virtual Assistant
Сөйлеу тілін түсіндіріп, мәтінге немесе әрекетке түрлендіретін технология.
Мысал: Дауыспен теру және дауыс командалары дауыс тану жүйелеріне сүйенеді.

Әлсіз AI (Voice Recognition)

Voice Recognition
Жалпы интеллектсіз, нақты, арнайы тапсырманы орындауға арналған AI жүйелері.
Мысал: Тілді түсіне алмайтын немесе көлік жүргізе алмайтын шахмат ойнайтын AI - әлсіз AI мысалы.

Веб-скрейпинг (Weak AI)

Weak AI
Веб-сайттардан ақпаратты автоматты түрде шығару, жиі оқыту деректерін жинау немесе мазмұнды бақылау үшін қолданылады.
Мысал: Жылжымайтын мүлік бағалау моделін жаттықтыру үшін жылжымайтын мүлік тізімдерін скрейпинг.

Салмақ (Web Scraping)

Web Scraping
Нейрондық желілердегі бір түйіннің басқасына әсер ету күшін анықтайтын параметр.
Мысал: Модель қатесін азайту үшін жаттықтыру кезінде салмақтар реттеледі.

Whisper (Weight)

Weight
Көптеген тілдерде аудионы транскрипциялай алатын OpenAI әзірлеген сөйлеуден мәтінге модель.
Мысал: Whisper дәрістер мен подкасттарды жоғары дәлдікпен транскрипциялай алады.

YAML (Whisper)

Whisper
Деректерді сериализациялаудың адам оқи алатын форматы, машиналық оқыту жұмыс процестерінде конфигурациялық файлдар үшін жиі қолданылады.
Мысал: PyTorch-та жаттықтыру үшін YAML файлында модель параметрлерін анықтау.

Нөлдік үлгімен оқыту (YAML)

YAML
Модельдің жалпы білімін пайдалану арқылы арнайы жаттықтырылмаған тапсырмаларды орындау қабілеті.
Мысал: Заңгерлік деректермен арнайы жаттықтырылмаса да, заңгерлік сұрақтарға жауап беретін модель.

Зеттабайт (Zero-shot Learning)

Zero-shot Learning
Бір секстиллион (10^21) байтқа тең сандық деректер бірлігі, жиі интернет деректерінің ауқымын сипаттау үшін қолданылады.
Мысал: 2016 жылға қарай жаһандық интернет трафикі жылына 1 зеттабайттан асты.