AI Jargoni Lahendaja

Selgitame tehisintellekti terminoloogiat meie kõikehõlmava sõnastikuga. Alates masinõppest kuni neurovõrkudeni, murrame keerulised AI kontseptsioonid lihtsateks mõisteteks.

Ühtlustamine (Alignment)

Alignment
Protsess, mille käigus tagatakse, et AI süsteemi eesmärgid, väljundid ja käitumised ühtlustuksid inimeste eesmärkide ja väärtustega. See on eriti oluline täiustatud süsteemide puhul, mis võivad arendada käitumist, mida pole otseselt kavandatud.
Näide: Tagada, et vestlusrobot vaimse tervise toetamiseks ei soovita kunagi kahjulikke toiminguid, olenemata viipetest.

Rakendusliides (API) (Application Programming Interface (API))

Application Programming Interface (API)
Definitsioonide kogum reegleid ja protokolle, mis võimaldavad erinevatel tarkvarasüsteemidel suhelda ja andmeid vahetada.
Näide: Kasutada OpenAI API-t, et saata viip ja saada keelemudeli loodud vastus oma veebirakendusse.

Kunstlik üldine intelligentsus (AGI) (Artificial General Intelligence (AGI))

Artificial General Intelligence (AGI)
Teoreetiline AI vorm, mis suudab täita mis tahes intellektuaalset ülesannet, mida inimene suudab. See üldistab õppimist erinevates valdkondades.
Näide: AGI süsteem võiks õppida muusika komponeerimist, sooritada operatsioone ja sooritada filosoofia eksami ilma ülesandepõhise programmeerimiseta.

Tehisintellekt (AI) (Artificial Intelligence (AI))

Artificial Intelligence (AI)
Inimintellekti simulatsioon masinates, mis on programmeeritud mõtlema, põhjendama ja tegutsema autonoomselt.
Näide: AI toetab isiklikke assistente nagu Siri ja autonoomseid sõidusüsteeme nagu Tesla Autopilot.

AI eetika (AI Ethics)

AI Ethics
Distsipliin, mis tegeleb AI arendamise ja kasutamise moraalsete tagajärgedega, sealhulgas õiglus, privaatsus, vastutus ja mittediskrimineerimine.
Näide: Loomine juhised, et vältida värbamisalgoritme, mis diskrimineerivad soo või etnilise kuuluvuse alusel.

Täiendatud intelligentsus (Augmented Intelligence)

Augmented Intelligence
Koostöömudel, kus AI täiendab ja tugevdab inimintellekti, mitte ei asenda seda.
Näide: AI-põhised radioloogia tööriistad, mis tõstavad esile anomaaliaid arstide jaoks, kes teevad lõpliku diagnoosi.

Autonoomne agent (Autonomous Agent)

Autonomous Agent
AI süsteem, mis suudab teha oma otsuseid ja võtta meetmeid oma eesmärkide saavutamiseks ilma inimeste sekkumiseta.
Näide: Autonoomne tarne-robot, mis navigeerib linnatänavatel ja väldib iseseisvalt takistusi.

Tagasipropageerimine (Backpropagation)

Backpropagation
Tehnika neurovõrkude koolitamiseks, värskendades kaalusid tagurpidi väljundist sisendkihtideni, minimeerides ennustusvigu.
Näide: Kasutatakse käsitsi kirjutatud numbrite äratundmise vigade vähendamiseks pildiklassifikaatorite koolitamisel.

Viltus (Algoritmiline viltus) (Bias (Algorithmic Bias))

Bias (Algorithmic Bias)
Tahtmatu ja süstemaatiline eelsoosimine AI väljundites tasakaalustamata või mitteesinduslike koolitusandmete tõttu.
Näide: Näotuvastussüsteem, mis identifitseerib värvilisi inimesi sagedamini, kuna neid on koolitusandmetes ebapiisavalt esindatud.

Suurandmed (Big Data)

Big Data
Äärmiselt suured andmekogud, mis nõuavad spetsiaalseid tööriistu salvestamiseks, analüüsimiseks ja väärtuse eraldamiseks, mida kasutatakse sageli AI mudelite koolitamiseks.
Näide: Kasutades miljoneid kasutajate interaktsioone e-kaubanduse platvormide soovitusmootorite koolitamiseks.

Musta kasti mudel (Black Box Model)

Black Box Model
AI või masinõppe mudeli tüüp, mille sisemine loogika pole inimeste jaoks kergesti tõlgendatav, muutes otsuste tegemise viisi mõistmise keeruliseks.
Näide: Süva neurovõrk, mida kasutatakse laenude heakskiitmiseks, kuid mis ei paku selget selgitust, miks üks taotleja aktsepteeriti ja teine tagasi lükati.

Kognitiivne arvutus (Cognitive Computing)

Cognitive Computing
AI süsteemid, mis on loodud inimlike mõtteprotsesside, nagu põhjendamine ja õppimine, simuleerimiseks, kasutades selliseid tehnikaid nagu NLP ja mustrite tuvastamine.
Näide: Kognitiivne arvutussüsteem, mis aitab juriidilistel spetsialistidel analüüsida kohtupraktikat ja ennustada tulemusi.

Arvutinägemine (Computer Vision)

Computer Vision
Tehisintellekti valdkond, mis võimaldab arvutitel tõlgendada ja töödelda visuaalseid andmeid, nagu pildid ja videod.
Näide: Näotuvastussüsteemid, mis tuvastavad inimesi turvakaadrites arvutinägemise abil.

Korpus (Corpus)

Corpus
Suur kogum kirjalikke või suulisi tekste, mida kasutatakse keelemudelite koolitamiseks.
Näide: Common Crawl andmestik on avalik veebikorpus, mida kasutatakse suurte keelemudelite nagu GPT koolitamiseks.

Andmete triiv (Data Drift)

Data Drift
Nähtus, kus sisendandmed muutuvad aja jooksul, põhjustades mudeli jõudluse halvenemist.
Näide: Ennustav hooldusmudel tööstusseadmetele muutub vähem täpseks, kuna tutvustatakse uut sensoritehnoloogiat.

Andmete märgistamine (Data Labelling)

Data Labelling
Andmete annotatsiooni protsess siltide või märgistustega, et muuta need juhendatud õppeks sobivaks.
Näide: Tuhandete kasvajapiltide märgistamine healoomuliseks või pahaloomuliseks, et koolitada vähituvastusmudelit.

Andmekaeve (Data Mining)

Data Mining
Tähenduslike mustrite, korrelatsioonide ja anomaaliate avastamise protsess suurtes andmekogudes.
Näide: Jaemüüjad kasutavad andmekaeve, et tuvastada, et mähkmeid ostvad inimesed ostavad sageli ka õlut.

Süvaõpe (Deep Learning)

Deep Learning
Masinõppe alavaldkond, mis kasutab mitmekihilisi neurovõrke keeruliste mustrite modelleerimiseks andmetes.
Näide: Süvaõpet kasutatakse keelemudelites nagu GPT-4 ja pildigeneratsiooni mudelites nagu Stable Diffusion.

Difusioonimudelid (Diffusion Models)

Diffusion Models
Generatiivsete mudelite klass, mis õpivad andmeid tootma, muutes järk-järgult juhuslikku müra struktureeritud väljunditeks.
Näide: Stable Diffusion loob tekstiviipetest fotorealistlikke pilte, kasutades difusioonitehnikaid.

Sisestus (Embedding)

Embedding
Numbriline vektorrepresentatsioon andmetest, mida kasutatakse sageli sõnade, piltide või lausete semantilise tähenduse jäädvustamiseks.
Näide: NLP-s võib sõnal 'pank' olla sarnased sisestused sõnaga 'raha', kuid erinevad sõnast 'pangaäär', sõltuvalt kontekstist.

Epohh (Epoch)

Epoch
Täielik iteratsioon kogu koolitusandmestiku üle masinõppe mudeli koolitusprotsessi ajal.
Näide: Kui andmestikus on 1000 näidet ja mudel näeb neid kõiki koolituse ajal üks kord, on see üks epohh.

Eetiline AI (Ethical AI)

Ethical AI
Disaini ja kasutuselevõtu filosoofia, mis tagab, et AI tehnoloogiad toimiksid läbipaistvalt, õiglaselt ja ühiskondlike väärtustega kooskõlas.
Näide: AI värbamistööriist, mis sisaldab viltuse kontrolle, et vältida diskrimineerimist vähemusrahvuste kandidaatide suhtes.

Ekspertsüsteem (Expert System)

Expert System
AI süsteem, mis jäljendab inimspetsialisti otsustusvõimet kindlas valdkonnas, kasutades reegleid ja loogikat.
Näide: Ekspertsüsteem, mida kasutatakse põllumajanduses, et soovitada põllukultuuride ravi, mis põhineb mullaproovidel ja kahjurite ajaloos.

Selgitatav AI (XAI) (Explainable AI (XAI))

Explainable AI (XAI)
AI süsteemid, mis on loodud selleks, et muuta nende sisemised protsessid ja otsustusprotsessid inimestele arusaadavaks, suurendades usaldust ja vastutust.
Näide: Meditsiiniline diagnostiline AI, mis mitte ainult ei anna soovitust, vaid selgitab ka, millised sümptomid selle järelduseni viisid.

Väheste võtetega õppimine (Few-shot Learning)

Few-shot Learning
Masinõppe meetod, kus mudelit koolitatakse või peenhäälestatakse vaid väikese arvu märgistatud näidetega.
Näide: LLM-i kohandamine juriidiliste e-kirjade kirjutamiseks pärast sellele vaid 10 näite näitamist.

Peenhäälestus (Fine-tuning)

Fine-tuning
Protsess, mille käigus võetakse eelkoolitatud mudel ja koolitatakse seda edasi uuel, väiksemal andmestikul, et spetsialiseerida seda konkreetse ülesande jaoks.
Näide: Üldise LLM-i nagu GPT peenhäälestamine sisejuriidiliste dokumentide abil, et luua juriidiline koostamisassistent.

Vundamendimudel (Foundation Model)

Foundation Model
Suuremahuline mudel, mis on koolitatud mitmekesiste ja laiaulatuslike andmetega ning mida saab kohandada paljudeks allavoolu ülesanneteks.
Näide: GPT-4 ja PaLM 2 on vundamendimudelid, mis suudavad kokkuvõtteid, küsimustele vastamist, tõlkimist ja palju muud.

Ujuvloogika (Fuzzy Logic)

Fuzzy Logic
Loogika vorm, mis tegeleb ligikaudsete väärtustega, mitte fikseeritud tõene/vääraga (binaarne) loogikaga, kasulik ebakindluse korral põhjendamiseks.
Näide: Kasutatakse kliimaseadmetes temperatuuri reguleerimiseks ujuvsisendite nagu 'natuke kuum' või 'väga külm' põhjal.

Generatiivne vastandlik võrk (GAN) (Generative Adversarial Network (GAN))

Generative Adversarial Network (GAN)
Generatiivne mudeli arhitektuur, kus kaks võrku – generaator ja diskriminaator – võistlevad väljundi kvaliteedi parandamiseks.
Näide: GAN-e kasutatakse deepfake videote loomiseks või realistlike tootefotode loomiseks visanditest.

Generatiivne AI (Generative AI)

Generative AI
Tehisintellekti kategooria, mis suudab luua uut sisu – nagu tekst, pildid, muusika või video – koolitusandmetest.
Näide: ChatGPT loob ajaveebipostitusi või Midjourney loob digitaalset kunsti tekstiviipetest.

Generatiivne eelkoolitatud transformer (GPT) (Generative Pre-trained Transformer (GPT))

Generative Pre-trained Transformer (GPT)
OpenAI poolt välja töötatud suurte keelemudelite klass, mis kasutab transformer arhitektuuri ja on eelkoolitatud tohutul hulgal tekstandmetel, et täita mitmesuguseid keeleülesandeid.
Näide: GPT-4 suudab kirjutada esseesid, tõlkida keeli ja teha dokumentide kokkuvõtteid minimaalse viipamisega.

Geneetiline algoritm (Genetic Algorithm)

Genetic Algorithm
Optimeerimistehnika, mis on inspireeritud looduslikust valikust, kus lahendused arenevad aja jooksul mutatsiooni, ristumise ja valiku kaudu.
Näide: Kasutatakse tõhusate neurovõrkude arhitektuuride kujundamiseks, simuleerides ellujäämist kõige tugevamatele.

Hallutsinatsioon (Hallucination)

Hallucination
AI mudeli poolt usutavalt kõlava, kuid faktiliselt vale või mõttetu sisu genereerimine.
Näide: Keelemudel leiutab olematu viite või esitab valesid ajaloolisi fakte.

Heuristik (Heuristic)

Heuristic
Praktiline lähenemine probleemilahendusele, mis ei taga täiuslikku lahendust, kuid on piisav vahetute eesmärkide saavutamiseks.
Näide: Kasutades reeglit, et hinnata tarneaega logistika AI süsteemis.

Hüperparameeter (Hyperparameter)

Hyperparameter
Konfiguratsiooniväärtus, mis on seatud enne masinõppe mudeli koolitamist, nagu õppimiskiirus või kihtide arv.
Näide: Partii suuruse muutmine 32-lt 128-le, et parandada koolituse kiirust ja mudeli jõudlust.

Järeldus (Inference)

Inference
Koolitatud masinõppe mudeli kasutamise protsess uutest sisendandmetest ennustuste tegemiseks või väljundite genereerimiseks.
Näide: Peenhäälestatud GPT mudeli kasutamine e-kirjade koostamiseks klienditoe meeskonnale.

Kavatsuse tuvastamine (Intent Detection)

Intent Detection
Ülesanne looduskeele mõistmises, kus süsteem tuvastab kasutaja eesmärgi või kavatsuse sõnumis.
Näide: Vestlusrobotis 'Ma tahan lennupileti broneerida' tuvastamine reisibroneeringu kavatsusena.

Asjade internet (IoT) (Internet of Things (IoT))

Internet of Things (IoT)
Omavahel ühendatud füüsiliste seadmete võrk, mis on varustatud sensorite, tarkvara ja muude tehnoloogiatega andmete kogumiseks ja vahetamiseks.
Näide: Nutikad termostaadid ja külmikud, mis teatavad kasutusandmetest ja reguleerivad seadeid AI analüütika abil.

Tõlgendatavus (Interpretability)

Interpretability
Ulatus, milles inimene saab mõista masinõppe mudeli sisemisi mehhanisme ja selle otsustusprotsessi.
Näide: Otsustuspuu on tõlgendatavam kui süva neurovõrk, kuna selle otsused on jälgitavad.

Jupyter Notebook (Jupyter Notebook)

Jupyter Notebook
Avatud lähtekoodiga interaktiivne arvutuskeskkond, mis võimaldab kasutajatel kirjutada koodi, visualiseerida väljundeid ja dokumenteerida analüüsi ühes liideses.
Näide: Andmeteadlased kasutavad Jupyter Notebooke masinõppe mudelite prototüüpide loomiseks ja tulemuste jagamiseks.

K-lähim naaber (KNN) (K-Nearest Neighbours (KNN))

K-Nearest Neighbours (KNN)
Lihtne, mittaparameetriline masinõppe algoritm, mida kasutatakse klassifitseerimiseks ja regressiooniks. See teeb otsuseid lähimate koolitusnäidete põhjal funktsiooniruumis.
Näide: Uue puuvilja klassifitseerimiseks õunaks või pirniks kontrollib KNN, millised märgistatud puuviljad on kuju ja värvi poolest kõige lähemal.

Teadmiste graaf (Knowledge Graph)

Knowledge Graph
Andmestruktuur, mis kasutab sõlmi ja servi üksuste kirjelduste ja nende suhete sidumiseks ja salvestamiseks.
Näide: Google'i teadmiste paneeli toetab teadmiste graaf, mis ühendab üksusi nagu inimesed, kohad ja sündmused.

Keeleõppe mudeli optimeerimine (LLMO) (Language Learning Model Optimisation (LLMO))

Language Learning Model Optimisation (LLMO)
Tehnikad, mida kasutatakse suurte keelemudelite jõudluse, tõhususe või kohanemisvõime parandamiseks konkreetsete ülesannete või valdkondade jaoks.
Näide: Kvantiseerimise ja juhiste häälestamise kasutamine LLM-i optimeerimiseks ettevõtte kasutamiseks.

Suur keelemudel (LLM) (Large Language Model (LLM))

Large Language Model (LLM)
Masinõppe mudeli tüüp, mis on koolitatud tohutul hulgal tekstandmetel ja suudab genereerida, mõista ja põhjendada inimkeelt.
Näide: ChatGPT ja Claude on LLM-id, mis on koolitatud aitama kirjutamisel, kodeerimisel ja küsimustele vastamisel.

Peidetud ruum (Latent Space)

Latent Space
Kõrge mõõtmega abstraktne representatsioon, kus sarnased sisendid on grupeeritud lähedale, mida kasutatakse generatiivsetes mudelites ja sisestustes.
Näide: Pildigeneratsioonis võib peidetud ruumi manipuleerimine muuta selliseid funktsioone nagu heledus või emotsioon.

Õppimiskiirus (Learning Rate)

Learning Rate
Peamine hüperparameeter koolituses, mis kontrollib, kui palju mudeli kaalusid muudetakse vastavalt kadu gradientile.
Näide: Kõrge õppimiskiirus võib põhjustada miinimumide ületamist, samas kui liiga madal kiirus aeglustab koolitusprotsessi.

Masinõpe (ML) (Machine Learning (ML))

Machine Learning (ML)
AI haru, mis võimaldab süsteemidel andmetest õppida ja jõudlust parandada ilma otseselt programmeerimata.
Näide: Rämpsposti filtrid kasutavad masinõpet, et klassifitseerida e-kirju rämpspostiks või mitte, tuginedes varasematele näidetele.

Mudeli triiv (Model Drift)

Model Drift
Nähtus, kus mudeli täpsus langeb aja jooksul andmete või keskkonna muutuste tõttu.
Näide: Pettuse tuvastamise mudel muutub vähem täpseks, kuna pettuse taktika areneb.

Mudeli koolitus (Model Training)

Model Training
Andmete sisestamise protsess masinõppe mudelisse ja selle parameetrite reguleerimine vea minimeerimiseks.
Näide: Soovitusmootori koolitamine kliendi ostuajaloo põhjal uute toodete soovitamiseks.

Multimodaalne AI (Multimodal AI)

Multimodal AI
AI süsteemid, mis suudavad töödelda ja integreerida mitut tüüpi andmeid, nagu tekst, pildid, heli ja video.
Näide: Mudel nagu GPT-4 Vision, mis suudab samaaegselt lugeda teksti ja tõlgendada pilte.

Looduskeele töötlemine (NLP) (Natural Language Processing (NLP))

Natural Language Processing (NLP)
AI alavaldkond, mis keskendub arvutite ja inimkeelte (looduslike) keelte vahelisele interaktsioonile. See võimaldab masinatel lugeda, mõista ja vastata inimkeeles.
Näide: NLP-d kasutatakse häälassistendid, keeletõlkerakendustes ja vestlusrobotites.

Neurovõrk (Neural Network)

Neural Network
Masinõppe mudel, mis on inspireeritud inimaju struktuurist, koosnedes omavahel ühendatud sõlmede (neuronite) kihtidest.
Näide: Neurovõrgud on süvaõppe mudelite taga, mida kasutatakse pildi- ja kõnetuvastuses.

Müra (Noise)

Noise
Juhuslik või ebaoluline teave andmetes, mis võib varjata tähenduslikke mustreid ja negatiivselt mõjutada mudeli jõudlust.
Näide: Sensorivead või tüüpimisvigadega andmekanded võivad olla müra.

Ontoloogia (Ontology)

Ontology
Struktureeritud raamistik, mis kategoriseerib ja määratleb kontseptsioonide vahelisi suhteid valdkonnas, mida kasutatakse sageli semantilistes AI süsteemides.
Näide: Ontoloogia tervishoius võib määratleda, kuidas sümptomid on seotud haiguste ja ravimeetoditega.

Üleõppimine (Overfitting)

Overfitting
Modelleerimisviga, kus masinõppe mudel püüab kinni koolitusandmete müra ja töötab uutel andmetel halvasti.
Näide: Mudel, mis jätab meelde koolitusvastused, kuid ei suuda käsitleda nägemata testandmeid, on üleõppinud.

Ennustav analüüs (Predictive Analytics)

Predictive Analytics
Andmete, algoritmide ja AI kasutamine, et tuvastada tulevaste tulemuste tõenäosus ajalooliste andmete põhjal.
Näide: Jaemüüjad kasutavad ennustavat analüüsi, et prognoosida teatud toodete nõudlust.

Eelõpe (Pre-training)

Pre-training
Mudeli esialgne koolitamise protsess suurel, üldisel andmestikul enne selle peenhäälestamist konkreetsete ülesannete jaoks.
Näide: GPT mudelid on eelkoolitatud suurte korpuste peal enne klienditeeninduse vestlusrobotiteks kohandamist.

Viipade inseneritöö (Prompt Engineering)

Prompt Engineering
Kunst ja teadus tõhusate viipade loomiseks, et suunata suurte keelemudelite väljundit.
Näide: Süsteemi juhiste lisamine nagu 'Vasta viisakalt juhendajana' on viipade inseneritöö näide.

Kvantiseerimine (Quantisation)

Quantisation
Mudeli tihendamise tehnika, mis vähendab kaalude ja aktivatsioonide esindamiseks kasutatavate bittide arvu, parandades tõhusust.
Näide: Mudeli kvantiseerimine 32-bitiselt 8-bitisele parandab jõudlust mobiilseadmetes.

Kvantkompuutrid (Quantum Computing)

Quantum Computing
Uus arvutamise paradigma, mis põhineb kvantmehaanikal ja millel on potentsiaal eksponentsiaalseks töötlemisvõimeks.
Näide: Kvantkompuutrid võivad ühel päeval kiirendada AI koolitust üle klassikaliste piiride.

Järeldusmootor (Reasoning Engine)

Reasoning Engine
AI süsteem, mis tuletab loogilisi järeldusi faktide või andmete kogumist, kasutades reegleid või järeldusalgoritme.
Näide: AI diagnostiline tööriist kasutab järeldusmootorit, et tuletada võimalikke meditsiinilisi seisundeid sümptomite põhjal.

Tugevdusõpe (RL) (Reinforcement Learning (RL))

Reinforcement Learning (RL)
Masinõppe valdkond, kus agendid õpivad oma keskkonnaga suheldes, et maksimeerida kumulatiivseid preemiaid.
Näide: Robot õpib kõndima katse-eksituse meetodil, kasutades RL tehnikaid.

Tugevdusõpe inimtagasisidega (RLHF) (Reinforcement Learning with Human Feedback (RLHF))

Reinforcement Learning with Human Feedback (RLHF)
Õppemeetod, kus inimeste eelistused juhivad AI preemiasignaalit, mida kasutatakse sageli keelemudelite peenhäälestamiseks.
Näide: ChatGPT koolitati RLHF-iga, et toota abistavamaid ja ohutumaid vastuseid.

Otsinguga täiendatud generatsioon (RAG) (Retrieval-Augmented Generation (RAG))

Retrieval-Augmented Generation (RAG)
Meetod, mis ühendab teabeotsingu generatsiooniga, kus LLM otsib asjakohaseid dokumente, et parandada oma vastust.
Näide: AI assistent otsib ja tsiteerib toote spetsifikatsioone, samal ajal kui genereerib vastuse tehnilisele küsimusele.

Enesest juhendatav õpe (Self-Supervised Learning)

Self-Supervised Learning
Koolituslähenemine, kus mudel õpib mustreid, genereerides oma sildid toorandmetest, vähendades sõltuvust inimeste poolt annotatud andmetest.
Näide: BERT koolitatakse enesest juhendatava õppega, ennustades puuduvaid sõnu tekstis.

Semantiline otsing (Semantic Search)

Semantic Search
Otsingutehnika, mis mõistab kasutaja kavatsust ja kontekstuaalset tähendust, mitte ainult märksõnade sobitamist.
Näide: Otsing 'kuidas parandada lekkivat kraani' tagastab juhendeid, isegi kui dokumenti pole terminit 'lekkiv kraan'.

Tundmusanalüüs (Sentiment Analysis)

Sentiment Analysis
Emotsioonide, arvamuste või hoiakute tuvastamise protsess tekstis, sageli klassifitseerides positiivseks, negatiivseks või neutraalseks.
Näide: Tweetide analüüsimine, et hinnata avalikkuse reaktsiooni uuele tootele.

Stokastiline (Stochastic)

Stochastic
Sisaldab juhuslikku või tõenäosuslikku käitumist, mida kasutatakse sageli generatiivses AI-s ja optimeerimisalgoritmides.
Näide: GPT-4 väljund varieerub sama sisendi puhul selle stokastilise dekodeerimisprotsessi tõttu.

Tugev AI (Strong AI)

Strong AI
Tuntud ka kui Kunstlik üldine intelligentsus (AGI), viitab masinatele, millel on inimlikud kognitiivsed võimed kõigis valdkondades.
Näide: Tuleviku AI, mis suudab autonoomselt kirjutada romaane, planeerida linnu ja lahendada eetilisi dilemmad võrdselt hästi.

Supertehisintellekt (SAI) (Super Artificial Intelligence (SAI))

Super Artificial Intelligence (SAI)
Teoreetiline AI, mis ületab tunduvalt inimintellekti kõigis aspektides – põhjendamine, loovus, emotsionaalne intelligentsus jne.
Näide: SAI võiks teoreetiliselt arendada uusi teadusi ja filosoofiaid iseseisvalt.

Juhendatud õpe (Supervised Learning)

Supervised Learning
Masinõppe tehnika, kus mudeleid koolitatakse märgistatud andmetega, et õppida sisend-väljund vastendusi.
Näide: Mudeli õpetamine e-kirjade klassifitseerimiseks rämpspostiks või mitte, kasutades ajaloolisi näiteid.

Sünteetilised andmed (Synthetic Data)

Synthetic Data
Kunstlikult genereeritud andmed, mis simuleerivad reaalse maailma andmeid, mida kasutatakse sageli koolitamiseks, kui reaalseid andmeid on vähe või need on tundlikud.
Näide: Sünteetiliste meditsiiniliste piltide loomine diagnostikamudelite koolitamiseks, rikkumata patsiendi privaatsust.

Token (Token)

Token
Tekstiühik, mida LLM-id töötlevad – tavaliselt sõna või sõnaosa.
Näide: Lauses 'Tere maailm!' jagatakse 3 tokeniks: 'Tere', 'maailm' ja '!'.

Tokeniseerimine (Tokenisation)

Tokenisation
Teksti jagamise protsess tokeniteks, et mudel saaks neid töödelda.
Näide: NLP-s muutub 'ChatGPT on suurepärane' ['Chat', 'G', 'PT', 'on', 'suurepärane'].

Ülekandeõpe (Transfer Learning)

Transfer Learning
Ühe ülesande teadmiste kasutamine teise seotud ülesande õppimise parandamiseks, vähendades koolitusaega ja andmevajadusi.
Näide: Ingliskeelse tekstiga koolitatud mudeli peenhäälestamine, et täita tundmusanalüüsi teises keeles.

Transformer (Transformer)

Transformer
Neurovõrgu arhitektuur, mis kasutab tähelepanu mehhanisme järjestikuste andmete modelleerimiseks, mida kasutatakse laialdaselt LLM-ides.
Näide: BERT, GPT ja T5 on kõik transformer-põhised mudelid.

Alahindamine (Underfitting)

Underfitting
Kui mudel on liiga lihtne, et püüda kinni koolitusandmete mustreid, mille tulemuseks on halb jõudlus.
Näide: Lineaarne mudel, mis üritab ennustada keerulisi pildiklassifikatsioone, võib alahinnata.

Juhendamata õpe (Unsupervised Learning)

Unsupervised Learning
Õppemeetod, kus mudelid tuvastavad mustreid või klastreid märgistamata andmetes.
Näide: Klientide grupeerimine ostukäitumise põhjal ilma eelnevalt määratletud siltideta.

Kasutaja kavatsus (User Intent)

User Intent
Kasutaja päringu või interaktsiooni eesmärk või kavatsus.
Näide: Kasutaja, kes kirjutab 'kuidas kooki küpsetada', kavatseb tõenäoliselt leida retsepti.

Valideerimisandmestik (Validation Set)

Validation Set
Andmete alamhulk, mida kasutatakse mudeli jõudluse hindamiseks koolituse ajal ja hüperparameetrite häälestamiseks.
Näide: Kasutatakse üleõppimise tuvastamiseks enne lõplikku testimist.

Vektorandmebaas (Vector Database)

Vector Database
Andmebaas, mis on loodud vektor sisestuste salvestamiseks ja otsimiseks, mida kasutatakse AI ülesannetes nagu sarnasuse otsing ja RAG.
Näide: Pinecone ja Weaviate on vektorandmebaasid teksti- või pildi sisestuste salvestamiseks.

Vektori sisestus (Vector Embedding)

Vector Embedding
Andmete numbriline representatsioon, mis säilitab semantilise tähenduse ja suhted vektoriruumis.
Näide: Sõnadel 'kuningas' ja 'kuninganna' on sarnased sisestused peente sooliste erinevustega.

Virtuaalne assistent (Virtual Assistant)

Virtual Assistant
AI-põhine tarkvaraagent, mis aitab kasutajatel ülesandeid täita vestluse või häälkäskluste kaudu.
Näide: Siri, Alexa ja Google Assistant on populaarsed virtuaalsed assistendid.

Hääljuhtimine (Voice Recognition)

Voice Recognition
Tehnoloogia, mis tõlgendab ja teisendab räägitud keelt tekstiks või toiminguks.
Näide: Häälkirjutamine ja häälkäsklused tuginevad hääljuhtimissüsteemidele.

Nõrk AI (Weak AI)

Weak AI
AI süsteemid, mis on loodud kitsa, spetsiifilise ülesande täitmiseks ilma üldise intelligentsuseta.
Näide: Malet mängiv AI, mis ei suuda keelt mõista ega autot juhtida, on nõrga AI näide.

Veebi kraapimine (Web Scraping)

Web Scraping
Veebisaitidelt teabe automaatne eraldamine, mida kasutatakse sageli koolitusandmete kogumiseks või sisu jälgimiseks.
Näide: Kinnisvarakuulutuste kraapimine, et koolitada kinnisvara hindamise mudelit.

Kaal (Weight)

Weight
Neurovõrkude parameeter, mis määrab ühe sõlme mõju teisele.
Näide: Kaalud reguleeritakse koolituse ajal, et minimeerida mudeli viga.

Whisper (Whisper)

Whisper
OpenAI poolt välja töötatud kõne-tekstiks mudel, mis suudab transkribeerida heli mitmes keeles.
Näide: Whisper suudab suure täpsusega transkribeerida loenguid ja podcaste.

YAML (YAML)

YAML
Inimesele loetav formaat andmete serialiseerimiseks, mida kasutatakse tavaliselt konfiguratsioonifailides masinõppe töövoogudes.
Näide: Mudeli parameetrite määramine YAML-failis koolitamiseks PyTorchis.

Nullvõtetega õppimine (Zero-shot Learning)

Zero-shot Learning
Mudeli võime täita ülesandeid, mida see pole kunagi otseselt koolitatud, kasutades üldist teadmist.
Näide: Mudel, mis vastab juriidilistele küsimustele, kuigi seda pole spetsiifiliselt juriidiliste andmetega koolitatud.

Zettabait (Zettabyte)

Zettabyte
Digitaalse andmeühik, mis on võrdne ühe sekstillioni (10^21) baitiga, mida kasutatakse sageli interneti andmete ulatuse kirjeldamiseks.
Näide: Globaalne internetiliiklus ületas 2016. aastaks 1 zettabaidi aastas.