Derinimas (Alignment)
Alignment
Procesas, užtikrinantis, kad DI sistemos tikslai, rezultatai ir elgesys atitiktų žmonių tikslus ir vertybes. Tai ypaÄ svarbu pažangioms sistemoms, kurios gali vystyti neaiÅ¡kiai numatytÄ… elgesį.
Pavyzdys: Užtikrinti, kad pokalbių robotas, skirtas psichikos sveikatos palaikymui, niekada nerekomenduotų žalingų veiksmų, nepaisant raginimų.
Taikomųjų programų programavimo sąsaja (API) (Application Programming Interface (API))
Application Programming Interface (API)
Nustatytų taisyklių ir protokolų rinkinys, leidžiantis skirtingoms programinės įrangos sistemoms bendrauti ir keistis duomenimis.
Pavyzdys: Naudojant OpenAI API siųsti raginimą ir gauti kalbos modelio sugeneruotą atsakymą jūsų žiniatinklio programoje.
Dirbtinis bendrasis intelektas (AGI) (Artificial General Intelligence (AGI))
Artificial General Intelligence (AGI)
Teorinė DI forma, galinti atlikti bet kokią intelektualią užduotį, kurią gali atlikti žmogus. Ji generalizuoja mokymąsi įvairiose srityse.
Pavyzdys: AGI sistema galÄ—tų mokytis muzikos kompozicijos, atlikti chirurgines operacijas ir iÅ¡laikyti filosofijos egzaminÄ… be užduoÄiai specifinio programavimo.
Dirbtinis intelektas (DI) (Artificial Intelligence (AI))
Artificial Intelligence (AI)
Žmogaus intelekto imitacija mašinose, kurios yra užprogramuotos mąstyti, samprotauti ir veikti autonomiškai.
Pavyzdys: DI maitina tokius asmeninius asistentus kaip Siri ir autonomines vairavimo sistemas kaip Tesla Autopilot.
DI Etika (AI Ethics)
AI Ethics
Drausmė, susijusi su DI kūrimo ir naudojimo moralinėmis pasekmėmis, įskaitant sąžiningumą, privatumą, atskaitomybę ir nediskriminavimą.
Pavyzdys: Sukurti gaires, kad būtų išvengta diskriminacijos pagal lytį ar etninę kilmę įdarbinimo algoritmuose.
Papildytas intelektas (Augmented Intelligence)
Augmented Intelligence
Bendradarbiavimo modelis, kuriame DI papildo ir sustiprina žmogaus intelektÄ…, o ne jį pakeiÄia.
Pavyzdys: DI maitinami radiologijos įrankiai, kurie išryškina anomalijas gydytojams, o šie priima galutinę diagnozę.
Autonominis agentas (Autonomous Agent)
Autonomous Agent
DI sistema, galinti savarankiškai priimti sprendimus ir imtis veiksmų, kad pasiektų savo tikslus be žmogaus įsikišimo.
Pavyzdys: SavarankiÅ¡kai važiuojantis pristatymo robotas, naviguojantis miesto gatvÄ—mis ir vengiantis kliÅ«Äių.
Atgalinis sklidimas (Backpropagation)
Backpropagation
Technika, naudojama mokant neuroninius tinklus, atnaujinant svorius atvirkÅ¡Äiai nuo iÅ¡vesties iki įvesties sluoksnių, minimizuojant prognozavimo klaidas.
Pavyzdys: Naudojamas mokant vaizdų klasifikatorius, siekiant sumažinti ranka rašytų skaitmenų atpažinimo klaidos rodiklį.
Šališkumas (Algoritminis šališkumas) (Bias (Algorithmic Bias))
Bias (Algorithmic Bias)
NetyÄinis ir sistemingas Å¡aliÅ¡kumas DI rezultatuose dÄ—l nesubalansuotų ar nereprezentatyvių mokymo duomenų.
Pavyzdys: Veido atpažinimo sistema, kuri dažniau klaidingai atpažįsta spalvotus žmones dėl nepakankamo jų atstovavimo mokymo duomenyse.
Dideli duomenys (Big Data)
Big Data
YpaÄ dideli duomenų rinkiniai, kuriems reikia specialių įrankių saugoti, analizuoti ir iÅ¡gauti vertÄ™, dažnai naudojami DI modeliams mokyti.
Pavyzdys: Naudojant milijonus vartotojų sąveikų, siekiant mokyti rekomendacijų variklius elektroninės prekybos platformoms.
Juodosios dėžės modelis (Black Box Model)
Black Box Model
DI arba mašininio mokymosi modelio tipas, kurio vidinė logika nėra lengvai suprantama žmonėms, todėl sunku suprasti, kaip priimami sprendimai.
Pavyzdys: Gilusis neuroninis tinklas, naudojamas paskoloms tvirtinti, bet nepateikiantis aiškaus paaiškinimo, kodėl vienas pareiškėjas buvo priimtas, o kitas atmestas.
Kognityvinis skaiÄiavimas (Cognitive Computing)
Cognitive Computing
DI sistemos, sukurtos imituoti žmogaus mąstymo procesus, tokius kaip samprotavimas ir mokymasis, naudojant tokias technikas kaip NLP ir modelių atpažinimas.
Pavyzdys: Kognityvinio skaiÄiavimo sistema, padedanti teisininkams analizuoti teismo praktikÄ… ir prognozuoti rezultatus.
KompiuterinÄ— rega (Computer Vision)
Computer Vision
Dirbtinio intelekto sritis, leidžianti kompiuteriams interpretuoti ir apdoroti vizualinius duomenis, tokius kaip vaizdai ir vaizdo įrašai.
Pavyzdys: Veido atpažinimo sistemos, kurios identifikuoja žmones saugumo vaizdo įrašuose, naudodamos kompiuterinę regą.
Korpusas (Corpus)
Corpus
Didelė rašytinių ar sakytinių tekstų kolekcija, naudojama kalbos modeliams mokyti.
Pavyzdys: Common Crawl duomenų rinkinys yra viešas žiniatinklio korpusas, naudojamas dideliems kalbos modeliams, tokiems kaip GPT, mokyti.
Duomenų dreifas (Data Drift)
Data Drift
ReiÅ¡kinys, kai įvesties duomenys keiÄiasi laikui bÄ—gant, dÄ—l ko modelio naÅ¡umas suprastÄ—ja.
Pavyzdys: Numatomo pramoninės įrangos techninės priežiūros modelis tampa mažiau tikslus, kai įvedama nauja jutiklių technologija.
Duomenų žymėjimas (Data Labelling)
Data Labelling
Duomenų anotavimo su žymomis ar etiketėmis procesas, kad jie taptų tinkami prižiūrimam mokymuisi.
Pavyzdys: ŽymÄ—jimas tÅ«kstanÄių navikų vaizdų kaip gerybinių ar piktybinių, siekiant mokyti vėžio aptikimo modelį.
Duomenų gavyba (Data Mining)
Data Mining
Reikšmingų modelių, koreliacijų ir anomalijų dideliuose duomenų rinkiniuose atradimo procesas.
Pavyzdys: Mažmenininkai naudoja duomenų gavybą, kad nustatytų, jog žmonės, perkantys sauskelnes, taip pat perka alų.
Giluminis mokymasis (Deep Learning)
Deep Learning
Mašininio mokymosi subdisciplina, naudojanti daugiasluoksnius neuroninius tinklus sudėtingiems duomenų modeliams kurti.
Pavyzdys: Giluminis mokymasis naudojamas kalbos modeliuose, tokiuose kaip GPT-4, ir vaizdų generavimo modeliuose, tokiuose kaip Stable Diffusion.
Difuziniai modeliai (Diffusion Models)
Diffusion Models
Generatyvinių modelių klasė, kuri mokosi kurti duomenis, palaipsniui transformuodama atsitiktinį triukšmą į struktūrizuotus rezultatus.
Pavyzdys: Stable Diffusion sukuria fotorealistiškus vaizdus iš teksto raginimų, naudojant difuzijos technikas.
Įterpimas (Embedding)
Embedding
Skaitmeninis duomenų atvaizdavimas, dažnai naudojamas žodžių, vaizdų ar sakinių semantinei reikšmei užfiksuoti.
Pavyzdys: NLP, žodis 'bankas' gali turėti panašius įterpimus kaip 'pinigai', bet skirtingus nuo 'upės kranto', priklausomai nuo konteksto.
Epocha (Epoch)
Epoch
Vienas pilnas iteravimas per visą mokymo duomenų rinkinį mašininio mokymosi modelio mokymo proceso metu.
Pavyzdys: Jei duomenų rinkinyje yra 1000 pavyzdžių, o modelis juos visus pamato vieną kartą mokymo metu, tai yra viena epocha.
Etinis DI (Ethical AI)
Ethical AI
Projektavimo ir diegimo filosofija, užtikrinanti, kad DI technologijos veiktų skaidriai, sąžiningai ir pagal visuomenės vertybes.
Pavyzdys: DI įdarbinimo įrankis, apimantis šališkumo patikrinimus, siekiant užkirsti kelią diskriminacijai prieš mažumų kandidatus.
Ekspertų sistema (Expert System)
Expert System
DI sistema, kuri imituoja žmogaus eksperto sprendimų priÄ—mimo gebÄ—jimus konkreÄioje srityje, naudojant taisykles ir logikÄ….
Pavyzdys: Ekspertų sistema, naudojama žemės ūkyje, siekiant rekomenduoti pasėlių apdorojimą pagal dirvožemio duomenis ir kenkėjų istoriją.
Paaiškinamas DI (XAI) (Explainable AI (XAI))
Explainable AI (XAI)
DI sistemos, sukurtos taip, kad jų vidiniai procesai ir sprendimai būtų suprantami žmonėms, didinant pasitikėjimą ir atskaitomybę.
Pavyzdys: Medicininis diagnostikos DI, kuris ne tik pateikia rekomendaciją, bet ir paaiškina, kurie simptomai lėmė tą išvadą.
Mokymasis su keliais pavyzdžiais (Few-shot Learning)
Few-shot Learning
Mašininio mokymosi metodas, kai modelis mokomas arba tiksliai derinamas naudojant tik kelis žymėtus pavyzdžius.
Pavyzdys: Pritaikyti LLM rašyti teisines el. žinutes, parodžius tik 10 pavyzdžių.
Tikslus derinimas (Fine-tuning)
Fine-tuning
Procesas, kai imamas iÅ¡ anksto apmokytas modelis ir toliau mokomas ant naujo, mažesnio duomenų rinkinio, kad jis bÅ«tų specializuotas konkreÄiai užduoÄiai.
Pavyzdys: Tiksliai derinant bendrą LLM, pvz., GPT, ant vidinių teisinių dokumentų, kad būtų sukurtas teisės aktų rengimo asistentas.
Pamatinis modelis (Foundation Model)
Foundation Model
Didelio masto modelis, apmokytas ant įvairių ir plaÄių duomenų, kuris gali bÅ«ti pritaikytas daugeliui vÄ—lesnių užduoÄių.
Pavyzdys: GPT-4 ir PaLM 2 yra pamatiniai modeliai, galintys atlikti santraukÄ…, klausimus ir atsakymus, vertimus ir kt.
Fuzzy logika (Fuzzy Logic)
Fuzzy Logic
Logikos forma, kuri dirba su apytikslėmis reikšmėmis, o ne su fiksuota teisinga/klaidinga (binarine) logika, naudinga samprotaujant esant netikrumui.
Pavyzdys: Naudojama klimato kontrolės sistemose temperatūrai reguliuoti pagal fuzzy įvestis, tokias kaip „šiek tiek karšta“ arba „labai šalta“.
Generatyvinis priešiškas tinklas (GAN) (Generative Adversarial Network (GAN))
Generative Adversarial Network (GAN)
Generatyvinio modelio architektūra, kurioje du tinklai – generatorius ir diskriminatorius – konkuruoja, kad pagerintų išvesties kokybę.
Pavyzdys: GAN naudojami kuriant deepfake vaizdo įrašus arba generuojant realistiškas produktų nuotraukas iš eskizų.
Generatyvinis DI (Generative AI)
Generative AI
Dirbtinio intelekto kategorija, galinti kurti naują turinį – pvz., tekstą, vaizdus, muziką ar vaizdo įrašus – iš mokymo duomenų.
Pavyzdys: ChatGPT generuoja tinklaraÅ¡Äio įraÅ¡us arba Midjourney kuria skaitmeninį menÄ… iÅ¡ tekstinių raginimų.
Generatyvinis iš anksto apmokytas transformatorius (GPT) (Generative Pre-trained Transformer (GPT))
Generative Pre-trained Transformer (GPT)
Didelių kalbos modelių, sukurtų OpenAI, klasė, kuri naudoja transformatoriaus architektūrą ir yra iš anksto apmokyta ant didžiulių teksto duomenų, kad atliktų įvairias kalbos užduotis.
Pavyzdys: GPT-4 gali rašyti esė, versti kalbas ir apibendrinti dokumentus su minimaliu raginimu.
Genetiniai algoritmai (Genetic Algorithm)
Genetic Algorithm
Optimizavimo technika, įkvėpta natūralios atrankos, kurioje sprendimai laikui bėgant vystosi per mutaciją, kryžminimą ir atranką.
Pavyzdys: Naudojami efektyvioms neuroninių tinklų architektūroms projektuoti, imituojant „išgyvena stipriausias“.
Haliucinacija (Hallucination)
Hallucination
PanaÅ¡iai skambanÄio, bet faktinių klaidų turinÄio ar nesÄ…moningo turinio generavimas DI modelio.
Pavyzdys: Kalbos modelis iÅ¡galvoja neegzistuojanÄiÄ… citatÄ… arba pateikia neteisingus istorijos faktus.
Heuristika (Heuristic)
Heuristic
Praktinis problemų sprendimo metodas, kuris negarantuoja tobulo sprendimo, bet yra pakankamas dabartiniams tikslams.
Pavyzdys: Naudojant taisyklÄ™ „nykÅ¡Äio“ pristatymo laiko prognozavimui logistikos DI sistemoje.
Hiperparametras (Hyperparameter)
Hyperparameter
KonfigÅ«racijos reikÅ¡mÄ—, nustatyta prieÅ¡ mokant maÅ¡ininio mokymosi modelį, pvz., mokymosi sparta ar sluoksnių skaiÄius.
Pavyzdys: Pakoreguojant partijos dydį nuo 32 iki 128, siekiant pagerinti mokymo greitį ir modelio našumą.
Išvedimas (Inference)
Inference
Apmokyto mašininio mokymosi modelio naudojimo procesas, siekiant prognozuoti arba generuoti rezultatus iš naujų įvesties duomenų.
Pavyzdys: Tiksliai apmokyto GPT modelio naudojimas el. laiškams klientų aptarnavimo komandai parengti.
Ketinimų aptikimas (Intent Detection)
Intent Detection
Natūralios kalbos supratimo užduotis, kurioje sistema nustato vartotojo tikslą ar paskirtį pranešime.
Pavyzdys: Pokalbių robote, atpažįstant „noriu užsisakyti skrydį“ kaip kelionės užsakymo ketinimą.
Daiktų internetas (IoT) (Internet of Things (IoT))
Internet of Things (IoT)
Tarpusavyje sujungtų fizinių prietaisų tinklas, kuriame įterpti jutikliai, programinė įranga ir kitos technologijos duomenims rinkti ir keistis.
Pavyzdys: Išmanieji termostatai ir šaldytuvai, kurie praneša naudojimo duomenis ir reguliuoja nustatymus naudodami DI analizę.
Interpretacija (Interpretability)
Interpretability
Laipsnis, iki kurio žmogus gali suprasti mašininio mokymosi modelio vidinius mechanizmus ir jo sprendimų priėmimo procesą.
Pavyzdys: Sprendimų medis yra labiau interpretuojamas nei gilusis neuroninis tinklas, nes jo sprendimai yra atsekami.
Jupyter Notebook (Jupyter Notebook)
Jupyter Notebook
Atvirojo kodo interaktyvi skaiÄiavimo aplinka, leidžianti vartotojams raÅ¡yti kodÄ…, vizualizuoti rezultatus ir dokumentuoti analizÄ™ vienoje sÄ…sajoje.
Pavyzdys: Duomenų mokslininkai naudoja Jupyter Notebooks, kad prototipuotų mašininio mokymosi modelius ir dalintųsi rezultatais.
K-artimiausi kaimynai (KNN) (K-Nearest Neighbours (KNN))
K-Nearest Neighbours (KNN)
Paprastas, neparametrinis mašininio mokymosi algoritmas, naudojamas klasifikavimui ir regresijai. Jis priima sprendimus remdamasis artimiausiais mokymo pavyzdžiais ypatybių erdvėje.
Pavyzdys: Norint klasifikuoti naujÄ… vaisių kaip obuolį ar kriaušę, KNN tikrina, kurie žymÄ—ti vaisiai yra arÄiausiai pagal formÄ… ir spalvÄ….
Žinių grafikas (Knowledge Graph)
Knowledge Graph
Duomenų struktūra, kuri naudoja mazgus ir kraštus, kad atvaizduotų ir saugotų susietus aprašymus apie subjektus ir jų santykius.
Pavyzdys: Google žinių skydelis maitinamas žinių grafiko, kuris jungia tokius subjektus kaip žmonės, vietos ir įvykiai.
Kalbos mokymosi modelio optimizavimas (LLMO) (Language Learning Model Optimisation (LLMO))
Language Learning Model Optimisation (LLMO)
Technikos, naudojamos didelių kalbos modelių naÅ¡umui, efektyvumui ar pritaikomumui konkreÄioms užduotims ar sritims pagerinti.
Pavyzdys: Naudojant kvantifikavimą ir instrukcijų derinimo metodus, siekiant optimizuoti LLM verslo reikmėms.
Didelis kalbos modelis (LLM) (Large Language Model (LLM))
Large Language Model (LLM)
Giluminio mokymosi modelio tipas, apmokytas ant didžiulių teksto duomenų kiekių, galintis generuoti, suprasti ir samprotauti su žmogaus kalba.
Pavyzdys: ChatGPT ir Claude yra LLM, apmokyti padėti rašyti, koduoti ir atsakyti į klausimus.
PaslÄ—pta erdvÄ— (Latent Space)
Latent Space
Aukšto matmenų abstraktus atvaizdavimas, kuriame panašūs įėjimai yra sugrupuoti arti vienas kito, naudojamas generatyviniuose modeliuose ir įterpimuose.
Pavyzdys: Vaizdų generavime, paslėptos erdvės manipuliavimas gali pakeisti tokias savybes kaip ryškumas ar emocija.
Mokymosi sparta (Learning Rate)
Learning Rate
Pagrindinis hiperparametras mokymo metu, kontroliuojantis, kiek modelio svoriai yra koreguojami atsižvelgiant į nuostolio gradientą.
Pavyzdys: Aukšta mokymosi sparta gali lemti minimumų peršokimą, o per maža sparta sulėtina mokymo eigą.
Mašininis mokymasis (ML) (Machine Learning (ML))
Machine Learning (ML)
DI šaka, leidžianti sistemoms mokytis iš duomenų ir gerinti našumą be tiesioginio programavimo.
Pavyzdys: Šlamšto filtrai naudoja mašininį mokymąsi, kad klasifikuotų el. laiškus kaip šlamštą ar ne, remdamiesi ankstesniais pavyzdžiais.
Modelio dreifas (Model Drift)
Model Drift
ReiÅ¡kinys, kai modelio tikslumas laikui bÄ—gant mažėja dÄ—l duomenų ar aplinkos pokyÄių.
Pavyzdys: SukÄiavimo aptikimo modelis tampa mažiau tikslus, nes keiÄiasi sukÄiavimo taktikos.
Modelio mokymas (Model Training)
Model Training
Duomenų pateikimo mašininio mokymosi modeliui ir jo parametrų koregavimo procesas, siekiant minimizuoti klaidą.
Pavyzdys: Rekomendacijų variklio mokymas pagal klientų pirkimo istoriją, siekiant pasiūlyti naujus produktus.
Multimodinis DI (Multimodal AI)
Multimodal AI
DI sistemos, galinÄios apdoroti ir integruoti kelis duomenų tipus, tokius kaip tekstas, vaizdai, garsas ir vaizdo įraÅ¡ai.
Pavyzdys: Toks modelis kaip GPT-4 Vision, kuris vienu metu gali skaityti tekstÄ… ir interpretuoti vaizdus.
Natūralios kalbos apdorojimas (NLP) (Natural Language Processing (NLP))
Natural Language Processing (NLP)
DI subdisciplina, orientuota į kompiuterių ir žmogaus (natūralių) kalbų sąveiką. Ji leidžia mašinoms skaityti, suprasti ir atsakyti žmogaus kalba.
Pavyzdys: NLP naudojamas balso asistentuose, kalbos vertimo programose ir pokalbių robotuose.
Neuroninis tinklas (Neural Network)
Neural Network
Mašininio mokymosi modelis, įkvėptas žmogaus smegenų struktūros, sudarytas iš tarpusavyje sujungtų mazgų (neuronų) sluoksnių.
Pavyzdys: Neuroniniai tinklai yra gilaus mokymosi modelių, naudojamų vaizdų ir kalbos atpažinimui, pagrindas.
Triukšmas (Noise)
Noise
Atsitiktinė arba nereikšminga informacija duomenyse, kuri gali užgožti reikšmingus modelius ir neigiamai paveikti modelio našumą.
Pavyzdys: Jutiklių klaidos arba duomenų įrašai su klaidomis gali būti laikomi triukšmu.
Ontologija (Ontology)
Ontology
Struktūrizuota sistema, kuri kategorizuoja ir apibrėžia sąvokų santykius tam tikroje srityje, dažnai naudojama semantinėse DI sistemose.
Pavyzdys: Ontologija sveikatos priežiūros srityje gali apibrėžti, kaip simptomai susiję su ligomis ir gydymu.
Perteklinis pritaikymas (Overfitting)
Overfitting
Modelio klaida, kai mašininio mokymosi modelis užfiksuoja mokymo duomenų triukšmą ir prastai veikia su naujais duomenimis.
Pavyzdys: Modelis, kuris įsimena mokymo atsakymus, bet negali apdoroti nematytų testų duomenų, yra pertekliškai pritaikytas.
Numatomasis analitikas (Predictive Analytics)
Predictive Analytics
Duomenų, algoritmų ir DI naudojimas, siekiant nustatyti būsimų rezultatų tikimybę pagal istorinius duomenis.
Pavyzdys: Mažmenininkai naudoja numatomąjį analitiką, kad prognozuotų tam tikrų produktų paklausą.
Išankstinis apmokymas (Pre-training)
Pre-training
Pradinis modelio mokymas ant didelio, bendro duomenų rinkinio prieÅ¡ tikslų jo derinimo konkreÄioms užduotims procesas.
Pavyzdys: GPT modeliai yra iš anksto apmokyti ant didelių korpusų prieš pritaikymą klientų aptarnavimo pokalbių robotams.
Promptų inžinerija (Prompt Engineering)
Prompt Engineering
Veiksmingų raginimų kūrimo menas ir mokslas, siekiant nukreipti didelių kalbos modelių rezultatus.
Pavyzdys: Sistemos instrukcijų, pvz., „Atsakyk kaip mandagus mokytojas“, pridėjimas yra promptų inžinerijos pavyzdys.
Kvantifikavimas (Quantisation)
Quantisation
Modelio suspaudimo technika, kuri sumažina svoriams ir aktyvacijoms atvaizduoti naudojamų bitų skaiÄių, pagerindama efektyvumÄ….
Pavyzdys: Modelio kvantifikavimas iš 32 bitų į 8 bitus pagerina našumą mobiliuosiuose įrenginiuose.
Kvantinis skaiÄiavimas (Quantum Computing)
Quantum Computing
Nauja skaiÄiavimo paradigma, pagrįsta kvantine mechanika, kuri suteikia potencialÄ… eksponentiniams apdorojimo pajÄ—gumams.
Pavyzdys: Kvantinis skaiÄiavimas vienÄ… dienÄ… gali pagreitinti DI mokymÄ…si virÅ¡ijant klasikinį limitÄ….
Samprotavimo variklis (Reasoning Engine)
Reasoning Engine
DI sistema, kuri logiškai išvedžioja išvadas iš faktų ar duomenų rinkinio, naudojant taisykles ar išvedimo algoritmus.
Pavyzdys: DI diagnostikos įrankis naudoja samprotavimo variklį, kad nustatytų galimas medicinines sąlygas pagal simptomus.
Mokymasis su grįžtamuoju ryšiu (RL) (Reinforcement Learning (RL))
Reinforcement Learning (RL)
Mašininio mokymosi sritis, kurioje agentai mokosi sąveikaudami su savo aplinka, siekdami maksimaliai padidinti kaupiamus atlygius.
Pavyzdys: Robotas, besimokantis vaikÅ¡Äioti bandymų ir klaidų bÅ«du, naudojant RL technikas.
Mokymasis su grįžtamuoju ryšiu ir žmonių atsiliepimais (RLHF) (Reinforcement Learning with Human Feedback (RLHF))
Reinforcement Learning with Human Feedback (RLHF)
Mokymosi metodas, kuriame žmonių nuostatos vadovauja DI atlygio signalui, dažnai naudojamas kalbos modelių tiksliniam derinimui.
Pavyzdys: ChatGPT buvo apmokytas su RLHF, kad gamintų naudingesnius ir saugesnius atsakymus.
Paieška su papildymu (RAG) (Retrieval-Augmented Generation (RAG))
Retrieval-Augmented Generation (RAG)
Metodas, derinantis informacijos paiešką su generavimu, kai LLM ieško atitinkamų dokumentų, kad pagerintų savo atsakymą.
Pavyzdys: DI asistentas ieško ir cituoja produktų specifikacijas, generuodamas atsakymą į techninį klausimą.
Savarankis mokymasis (Self-Supervised Learning)
Self-Supervised Learning
Mokymo metodas, kuriame modelis mokosi modelių, generuodamas savo žymes iš neapdorotų duomenų, mažinant priklausomybę nuo žmonių anotacijų.
Pavyzdys: BERT mokomas savarankišku mokymusi, prognozuojant trūkstamus žodžius tekste.
Semantinė paieška (Semantic Search)
Semantic Search
Paieškos technika, suprantanti vartotojo ketinimą ir kontekstinę reikšmę, o ne tik raktinių žodžių atitikimą.
Pavyzdys: IeÅ¡kant „kaip sutaisyti pratekantį Äiaupą“, pateikiami vadovai, net jei dokumente nÄ—ra termino „pratekantis Äiaupas“.
Nuotaikų analizė (Sentiment Analysis)
Sentiment Analysis
Emocijų, nuomonių ar požiūrių tekste nustatymo procesas, dažnai klasifikuojant kaip teigiamas, neigiamas ar neutralus.
Pavyzdys: Analizuojant tviterius, siekiant įvertinti visuomenės reakciją į naują produktą.
Stochastinis (Stochastic)
Stochastic
Apimantis atsitiktinį ar tikimybinį elgesį, dažnai naudojamas generatyviniame DI ir optimizavimo algoritmuose.
Pavyzdys: GPT-4 rezultatai skiriasi esant tam paÄiam įėjimui dÄ—l jo stochastinio dekodavimo proceso.
Stiprus DI (Strong AI)
Strong AI
Taip pat žinomas kaip Dirbtinis bendrasis intelektas (AGI), reiškia mašinas su žmogaus lygio kognityviniais gebėjimais visose srityse.
Pavyzdys: Ateities DI, kuri galėtų savarankiškai rašyti romanus, planuoti miestus ir spręsti etines dilemas vienodai gerai.
Super dirbtinis intelektas (SAI) (Super Artificial Intelligence (SAI))
Super Artificial Intelligence (SAI)
Teorinis DI, gerokai viršijantis žmogaus intelektą visais aspektais – samprotavimu, kūrybiškumu, emociniu intelektu ir kt.
Pavyzdys: SAI teoriškai galėtų savarankiškai kurti naujus mokslus ir filosofijas.
Priežiūrinis mokymasis (Supervised Learning)
Supervised Learning
Mašininio mokymosi technika, kurioje modeliai mokomi ant žymėtų duomenų, kad išmoktų įvesties-išvesties atvaizdavimus.
Pavyzdys: Mokyti modelį klasifikuoti el. laiškus kaip šlamštą ar ne, naudojant istorinius pavyzdžius.
Sintetiniai duomenys (Synthetic Data)
Synthetic Data
Dirbtinai sugeneruoti duomenys, kurie imituoja realaus pasaulio duomenis, dažnai naudojami mokymui, kai realūs duomenys yra reti arba jautrūs.
Pavyzdys: Sintetinių medicininių vaizdų kūrimas, siekiant mokyti diagnostikos modelius nepažeidžiant pacientų privatumo.
Tokenas (Token)
Token
Teksto vienetas, apdorojamas LLM – paprastai žodis arba žodžio dalis.
Pavyzdys: Sakinys „Labas pasauli!“ yra suskaidytas į 3 tokenus: „Labas“, „pasauli“ ir „!“.
Tokenizacija (Tokenisation)
Tokenisation
Teksto suskaidymo į tokenus procesas, siekiant jį apdoroti modeliu.
Pavyzdys: NLP, „ChatGPT yra puikus“ tampa [„Chat“, „G“, „PT“, „yra“, „puikus“].
Perdavimo mokymasis (Transfer Learning)
Transfer Learning
Žinių iš vienos užduoties naudojimas, siekiant pagerinti mokymąsi kitoje susijusioje užduotyje, sumažinant mokymo laiką ir duomenų poreikius.
Pavyzdys: Anglų kalbos tekstu apmokyto modelio tikslinis derinimas, siekiant atlikti nuotaikų analizę kitoje kalboje.
Transformatorius (Transformer)
Transformer
Neuroninio tinklo architektÅ«ra, kuri naudoja dÄ—mesio mechanizmus sekos duomenims modeliuoti, plaÄiai naudojama LLM.
Pavyzdys: BERT, GPT ir T5 yra transformatoriais pagrįsti modeliai.
Nepakankamas pritaikymas (Underfitting)
Underfitting
Kai modelis yra per daug paprastas, kad užfiksuotų mokymo duomenų modelius, todėl našumas yra prastas.
Pavyzdys: Linijinis modelis, bandantis prognozuoti sudėtingas vaizdų klasifikacijas, gali nepakankamai pritaikyti.
Neprižiūrimas mokymasis (Unsupervised Learning)
Unsupervised Learning
Mokymosi metodas, kuriame modeliai nustato modelius ar klasterius nepažymėtuose duomenyse.
Pavyzdys: Klientų grupavimas pagal pirkimo elgesį be iš anksto nustatytų žymų.
Vartotojo ketinimas (User Intent)
User Intent
Tikslas ar paskirtis, slypinti už vartotojo užklausos ar sąveikos.
Pavyzdys: Vartotojas, įvesdamas „kaip kepti pyragą“, tikriausiai ketina rasti receptą.
Validavimo rinkinys (Validation Set)
Validation Set
Duomenų pogrupis, naudojamas modelio našumui vertinti mokymo metu ir hiperparametroms derinti.
Pavyzdys: Naudojamas aptikti perteklinį pritaikymą prieš galutinį testavimą.
Vektorinė duomenų bazė (Vector Database)
Vector Database
Duomenų bazė, skirta saugoti ir ieškoti vektorinių įterpimų, naudojamų DI užduotims, tokioms kaip panašumo paieška ir RAG.
Pavyzdys: Pinecone ir Weaviate yra vektorinės duomenų bazės, skirtos teksto ar vaizdų įterpimams saugoti.
Vektorinis įterpimas (Vector Embedding)
Vector Embedding
Skaitmeninis duomenų atvaizdavimas, išsaugantis semantinę reikšmę ir santykius vektorinėje erdvėje.
Pavyzdys: Žodžiai „karalius“ ir „karalienė“ turi panašius įterpimus su subtiliais lyties skirtumais.
Virtualus asistentas (Virtual Assistant)
Virtual Assistant
DI maitinamas programinės įrangos agentas, padedantis vartotojams atlikti užduotis per pokalbį ar balso komandas.
Pavyzdys: Siri, Alexa ir Google Assistant yra populiarūs virtualūs asistentai.
Balso atpažinimas (Voice Recognition)
Voice Recognition
Technologija, kuri interpretuoja ir konvertuoja sakytinę kalbą į tekstą ar veiksmą.
Pavyzdys: Balso rašymas ir balso komandos priklauso nuo balso atpažinimo sistemų.
Silpnas DI (Weak AI)
Weak AI
DI sistemos, sukurtos atlikti siaurą, specifinę užduotį be bendrojo intelekto.
Pavyzdys: Šachmatų žaidimo DI, kuris negali suprasti kalbos ar vairuoti automobilio, yra silpno DI pavyzdys.
Žiniatinklio skrapingas (Web Scraping)
Web Scraping
Automatizuotas informacijos iš žiniatinklio svetainių ištraukimas, dažnai naudojamas mokymo duomenims rinkti ar turiniui stebėti.
Pavyzdys: Nekilnojamojo turto skelbimų skrapingas, siekiant mokyti turto vertinimo modelį.
Svoris (Weight)
Weight
Parametras neuroniniuose tinkluose, kuris nustato vieno mazgo įtakos kitam stiprumą.
Pavyzdys: Svoris koreguojamas mokymo metu, siekiant minimizuoti modelio klaidÄ….
Whisper (Whisper)
Whisper
Kalbos į tekstą modelis, sukurtas OpenAI, galintis transkribuoti garsą įvairiomis kalbomis.
Pavyzdys: Whisper gali dideliu tikslumu transkribuoti paskaitas ir podcast'us.
YAML (YAML)
YAML
Žmogui suprantamas duomenų serializavimo formatas, dažnai naudojamas konfigūracijos failams mašininio mokymosi darbo eigose.
Pavyzdys: Modelio parametrų apibrėžimas YAML faile mokymui PyTorch.
Mokymasis su nuliniu pavyzdžiu (Zero-shot Learning)
Zero-shot Learning
Modelio gebėjimas atlikti užduotis, kurioms jis niekada nebuvo specialiai apmokytas, pasitelkiant bendrąsias žinias.
Pavyzdys: Modelis, atsakantis į teisinius klausimus, nors ir nebuvo specialiai apmokytas teisinių duomenų.
Zettabaitas (Zettabyte)
Zettabyte
Skaitmeninių duomenų vienetas, lygus vienam sekstilionui (10^21) baitų, dažnai naudojamas apibūdinti interneto duomenų mastą.
Pavyzdys: Pasaulinis interneto srautas viršijo 1 zettabaitą per metus iki 2016 m.