AI-jargonin selittäjä

Selkeytä tekoälytermejä kattavalla sanastollamme. Koneoppimisesta neuroverkkoihin, puramme monimutkaiset tekoälykonseptit yksinkertaisiksi termeiksi.

Kohdistus (Alignment)

Alignment
Prosessi, jolla varmistetaan, että tekoälyjärjestelmän tavoitteet, tulokset ja käyttäytyminen ovat linjassa ihmisten tavoitteiden ja arvojen kanssa. Tämä on erityisen tärkeää edistyneissä järjestelmissä, jotka voivat kehittää ei-tarkoituksellista käyttäytymistä.
Esimerkki: Varmistetaan, että mielenterveyskeskusteluun tarkoitettu chatbot ei koskaan suosittele haitallisia toimia kehotteista riippumatta.

Sovellusohjelmointirajapinta (API) (Application Programming Interface (API))

Application Programming Interface (API)
Joukkio määriteltyjä sääntöjä ja protokollia, jotka sallivat eri ohjelmistojärjestelmien kommunikoida ja vaihtaa tietoja.
Esimerkki: Käytetään OpenAI API:a lähettämään kehote ja vastaanottamaan kielimallin tuottama vastaus verkkosovellukseesi.

Yleinen tekoäly (AGI) (Artificial General Intelligence (AGI))

Artificial General Intelligence (AGI)
Teoreettinen tekoälyn muoto, joka pystyy suorittamaan minkä tahansa ihmisen suorittaman älyllisen tehtävän. Se yleistää oppimisen eri aloille.
Esimerkki: AGI-järjestelmä voisi oppia musiikin säveltämistä, suorittaa leikkauksia ja läpäistä filosofian kokeen ilman tehtäväkohtaista ohjelmointia.

Tekoäly (AI) (Artificial Intelligence (AI))

Artificial Intelligence (AI)
Ihmisälyn simulointi koneissa, jotka on ohjelmoitu ajattelemaan, järkeilemään ja toimimaan itsenäisesti.
Esimerkki: Tekoäly pyörittää henkilökohtaisia avustajia, kuten Siriä, ja autonomisia ajojärjestelmiä, kuten Tesla Autopilotia.

Tekoälyn etiikka (AI Ethics)

AI Ethics
Käsittelee tekoälyn kehityksen ja käytön moraalisia seurauksia, mukaan lukien oikeudenmukaisuus, yksityisyys, vastuuvelvollisuus ja syrjimättömyys.
Esimerkki: Ohjeiden luominen, jotta rekrytointialgoritmit eivät syrji sukupuolen tai etnisen taustan perusteella.

Lisätty älykkyys (Augmented Intelligence)

Augmented Intelligence
Yhteistyömalli, jossa tekoäly täydentää ja parantaa ihmisälyä sen sijaan, että se korvaisi sen.
Esimerkki: Tekoälypohjaiset radiologiatyökalut, jotka korostavat poikkeamia lääkäreille, jotka tekevät lopullisen diagnoosin.

Autonominen agentti (Autonomous Agent)

Autonomous Agent
Tekoälyjärjestelmä, joka pystyy tekemään omia päätöksiä ja toteuttamaan toimia tavoitteidensa saavuttamiseksi ilman ihmisen väliintuloa.
Esimerkki: Itseajava toimitusrobotti, joka navigoi kaupungin kaduilla ja välttää esteitä itsenäisesti.

Takaisinpropagointi (Backpropagation)

Backpropagation
Tekniikka neuroverkkojen kouluttamiseen päivittämällä painoja käänteisesti tulos- ja syötekerroksista, minimoiden ennustusvirheet.
Esimerkki: Käytetään kuvien luokittelijoiden kouluttamisessa virheiden vähentämiseksi käsinkirjoitettujen numeroiden tunnistamisessa.

Vinouma (Algoritminen vinouma) (Bias (Algorithmic Bias))

Bias (Algorithmic Bias)
Tekoälyn tulosten tahaton ja järjestelmällinen suosiminen epätasapainoisen tai ei-edustavan koulutusdatan vuoksi.
Esimerkki: Kasvojentunnistusjärjestelmä, joka tunnistaa värillisistä ihmisistä useammin virheellisesti koulutusdatan aliedustuksen vuoksi.

Big Data (Big Data)

Big Data
Erittäin suuret tietojoukot, jotka vaativat erikoistyökaluja tallentamiseen, analysointiin ja arvon poimimiseen, usein käytetään tekoälymallien kouluttamiseen.
Esimerkki: Miljoonien käyttäjävuorovaikutusten käyttäminen suositusmoottoreiden kouluttamiseen verkkokauppa-alustoille.

Musta laatikko -malli (Black Box Model)

Black Box Model
Tekoäly- tai koneoppimismalli, jonka sisäinen logiikka ei ole helposti ihmisten tulkittavissa, mikä vaikeuttaa päätöksenteon ymmärtämistä.
Esimerkki: Syvä neuroverkko, jota käytetään lainojen hyväksymiseen, mutta joka ei tarjoa selkeää selitystä sille, miksi yksi hakija hyväksyttiin ja toinen hylättiin.

Kognitiivinen laskenta (Cognitive Computing)

Cognitive Computing
Tekoälyjärjestelmät, jotka on suunniteltu simuloimaan ihmisen ajatteluprosesseja, kuten päättelyä ja oppimista, käyttäen tekniikoita kuten NLP ja kuvioiden tunnistus.
Esimerkki: Kognitiivinen laskentajärjestelmä, joka auttaa lakimiehiä analysoimaan oikeustapauksia ja ennustamaan tuloksia.

Konenäkö (Computer Vision)

Computer Vision
Tekoälyn ala, joka mahdollistaa tietokoneiden tulkita ja käsitellä visuaalista dataa, kuten kuvia ja videoita.
Esimerkki: Kasvojentunnistusjärjestelmät, jotka tunnistavat ihmisiä turvavalokuvissa käyttämällä konenäköä.

Korpus (Corpus)

Corpus
Suuri kokoelma kirjoitettuja tai puhuttuja tekstejä, jota käytetään kielimallien kouluttamiseen.
Esimerkki: Common Crawl -tietokanta on julkinen verkkokorpus, jota käytetään suurten kielimallien, kuten GPT:n, kouluttamiseen.

Datan ajautuminen (Data Drift)

Data Drift
Ilmiö, jossa syötedata muuttuu ajan myötä, mikä heikentää mallin suorituskykyä.
Esimerkki: Ennakoiva huoltomalli teollisuuslaitteille muuttuu vähemmän tarkaksi, kun uutta anturiteknologiaa otetaan käyttöön.

Datan merkintä (Data Labelling)

Data Labelling
Prosessi, jossa data annotoidaan tunnisteilla tai merkinnöillä, jotta se soveltuu ohjattuun oppimiseen.
Esimerkki: Tuhansien kasvaimia sisältävien kuvien merkitseminen hyvänlaatuisiksi tai pahanlaatuisiksi syövän tunnistusmallin kouluttamiseksi.

Tiedonlouhinta (Data Mining)

Data Mining
Prosessi, jossa löydetään merkityksellisiä kuvioita, korrelaatioita ja poikkeamia suurista tietojoukoista.
Esimerkki: Vähittäiskauppiaat käyttävät tiedonlouhintaa tunnistaakseen, että vaippoja ostavat ihmiset ostavat usein myös olutta.

Syväoppiminen (Deep Learning)

Deep Learning
Koneoppimisen osa-alue, joka käyttää monikerroksisia neuroverkkoja monimutkaisten datakuvioiden mallintamiseen.
Esimerkki: Syväoppimista käytetään kielimalleissa, kuten GPT-4, ja kuvien luontimalleissa, kuten Stable Diffusion.

Diffuusiomallit (Diffusion Models)

Diffusion Models
Luokitusmalleja, jotka oppivat tuottamaan dataa muuttamalla asteittain satunnaista kohinaa jäsennellyiksi tuloksiksi.
Esimerkki: Stable Diffusion luo fotorealistisia kuvia tekstikehotteista käyttämällä diffuusiotekniikoita.

Upotus (Embedding)

Embedding
Datan numeerinen vektorirepresentaatio, jota käytetään usein sanojen, kuvien tai lauseiden semanttisen merkityksen tallentamiseen.
Esimerkki: NLP:ssä sana 'pankki' voi olla samankaltaisissa upotuksissa kuin 'raha', mutta erilainen kuin 'joenranta' kontekstista riippuen.

Epookki (Epoch)

Epoch
Koko koulutusdatan läpikäynti koneoppimismallin koulutusprosessin aikana.
Esimerkki: Jos tietojoukossa on 1 000 esimerkkiä ja malli näkee ne kaikki kerran koulutuksen aikana, se on yksi epookki.

Eettinen tekoäly (Ethical AI)

Ethical AI
Suunnittelu- ja käyttöönottofilosofia, joka varmistaa, että tekoälyteknologiat toimivat läpinäkyvästi, tasapuolisesti ja yhteiskunnallisten arvojen mukaisesti.
Esimerkki: Tekoälyrekrytointityökalu, joka sisältää vinoumatarkistuksia syrjinnän estämiseksi vähemmistöehdokkaita kohtaan.

Asiantuntijajärjestelmä (Expert System)

Expert System
Tekoälyjärjestelmä, joka jäljittelee ihmisasiantuntijan päätöksentekokykyjä tietyllä alalla käyttämällä sääntöjä ja logiikkaa.
Esimerkki: Maataloudessa käytettävä asiantuntijajärjestelmä, joka suosittelee kasvien hoitoja maaperätietojen ja tuholaishistorian perusteella.

Selitettävä tekoäly (XAI) (Explainable AI (XAI))

Explainable AI (XAI)
Tekoälyjärjestelmät, jotka on suunniteltu tekemään sisäiset prosessinsa ja päätöksensä ymmärrettäviksi ihmisille, lisäten luottamusta ja vastuullisuutta.
Esimerkki: Lääketieteellinen diagnostiikka-tekoäly, joka ei ainoastaan anna suositusta, vaan myös selittää, mitkä oireet johtivat kyseiseen johtopäätökseen.

Vähän esimerkkejä oppiminen (Few-shot Learning)

Few-shot Learning
Koneoppimismenetelmä, jossa malli koulutetaan tai hienosäädetään käyttämällä vain pientä määrää merkittyjä esimerkkejä.
Esimerkki: Yleisen LLM:n mukauttaminen lakisähköpostien kirjoittamiseen näyttämällä sille vain 10 esimerkkiä.

Hienosäätö (Fine-tuning)

Fine-tuning
Prosessi, jossa esikoulutettu malli otetaan ja koulutetaan edelleen uudella, pienemmällä tietojoukolla sen erikoistamiseksi tiettyyn tehtävään.
Esimerkki: Yleisen LLM:n, kuten GPT:n, hienosäätö sisäisillä lakiasiakirjoilla lakikirjoitusavustajan luomiseksi.

Perusmalli (Foundation Model)

Foundation Model
Suuren mittakaavan malli, joka on koulutettu monipuolisella ja laajalla datalla ja jota voidaan mukauttaa moniin jatkotehtäviin.
Esimerkki: GPT-4 ja PaLM 2 ovat perusmalleja, jotka pystyvät tiivistämään, vastaamaan kysymyksiin, kääntämään ja paljon muuta.

Sumuinen logiikka (Fuzzy Logic)

Fuzzy Logic
Logiikan muoto, joka käsittelee likiarvoja kiinteän tosi/epätosi (binäärisen) logiikan sijaan, hyödyllinen epävarmuuden alaisessa päättelyssä.
Esimerkki: Käytetään ilmastointijärjestelmissä lämpötilan säätämiseen sumeiden syötteiden, kuten 'hieman kuuma' tai 'erittäin kylmä', perusteella.

Generatiivinen kilpaileva verkko (GAN) (Generative Adversarial Network (GAN))

Generative Adversarial Network (GAN)
Generatiivinen malliarkkitehtuuri, jossa kaksi verkkoa – generaattori ja diskriminaattori – kilpailevat tulosteen laadun parantamiseksi.
Esimerkki: GAN-verkkoja käytetään luomaan deepfake-videoita tai tuottamaan realistisia tuotekuvia luonnoksista.

Generatiivinen tekoäly (Generative AI)

Generative AI
Tekoälyn luokka, joka voi luoda uutta sisältöä – kuten tekstiä, kuvia, musiikkia tai videota – koulutusdatasta.
Esimerkki: ChatGPT luo blogikirjoituksia tai Midjourney luo digitaalista taidetta tekstikehotteista.

Generatiivinen esikoulutettu muuntaja (GPT) (Generative Pre-trained Transformer (GPT))

Generative Pre-trained Transformer (GPT)
Suurten kielimallien luokka, jonka OpenAI on kehittänyt ja joka käyttää muuntaja-arkkitehtuuria ja on esikoulutettu valtavalla tekstimäärällä suorittamaan erilaisia kielitehtäviä.
Esimerkki: GPT-4 pystyy kirjoittamaan esseitä, kääntämään kieliä ja tiivistämään asiakirjoja vähäisellä kehotteella.

Geneettinen algoritmi (Genetic Algorithm)

Genetic Algorithm
Optimointitekniikka, joka on saanut inspiraationsa luonnonvalinnasta, jossa ratkaisut kehittyvät ajan myötä mutaation, risteytyksen ja valinnan kautta.
Esimerkki: Käytetään tehokkaiden neuroverkkoarkkitehtuurien suunnitteluun simuloimalla parhaiten menestyvien selviytymistä.

Hallusinaatio (Hallucination)

Hallucination
Tekoälymallin tuottama uskottavalta kuulostava, mutta tosiasiallisesti virheellinen tai järjetön sisältö.
Esimerkki: Kielimalli keksii olemattoman viittauksen tai antaa vääriä historiallisia faktoja.

Heuristiikka (Heuristic)

Heuristic
Käytännöllinen lähestymistapa ongelmanratkaisuun, joka ei takaa täydellistä ratkaisua, mutta on riittävä välittömiin tavoitteisiin.
Esimerkki: Käytetään nyrkkisääntöä toimitusajan arvioimiseksi logistiikan tekoälyjärjestelmässä.

Hyperparametri (Hyperparameter)

Hyperparameter
Määritetty konfiguraatioarvo ennen koneoppimismallin koulutusta, kuten oppimisnopeus tai kerrosten määrä.
Esimerkki: Eräkokoa säädetään 32:sta 128:aan koulutusnopeuden ja mallin suorituskyvyn parantamiseksi.

Päättely (Inference)

Inference
Prosessia, jossa koulutettua koneoppimismallia käytetään ennusteiden tekemiseen tai tulosten tuottamiseen uudesta syötedatasta.
Esimerkki: Hienosäädetyn GPT-mallin käyttö sähköpostien laatimiseen asiakaspalvelutiimille.

Tarkoituksen tunnistus (Intent Detection)

Intent Detection
Luonnollisen kielen ymmärtämisen tehtävä, jossa järjestelmä tunnistaa käyttäjän tavoitteen tai tarkoituksen viestissä.
Esimerkki: Chatbotissa tunnistetaan 'Haluan varata lennon' matkanvaraus tarkoitukseksi.

Esineiden internet (IoT) (Internet of Things (IoT))

Internet of Things (IoT)
Verkosto yhdistettyjä fyysisiä laitteita, joihin on upotettu antureita, ohjelmistoja ja muita teknologioita datan keräämiseksi ja vaihtamiseksi.
Esimerkki: Älykkäät termostaatit ja jääkaapit, jotka raportoivat käyttötietoja ja säätävät asetuksia tekoälyanalytiikan avulla.

Tulkittavuus (Interpretability)

Interpretability
Se, missä määrin ihminen voi ymmärtää koneoppimismallin sisäiset mekanismit ja sen päätöksentekoprosessin.
Esimerkki: Päätöspuu on tulkittavampi kuin syvä neuroverkko, koska sen päätökset ovat jäljitettävissä.

Jupyter Notebook (Jupyter Notebook)

Jupyter Notebook
Avoimen lähdekoodin interaktiivinen laskentaympäristö, joka sallii käyttäjien kirjoittaa koodia, visualisoida tuloksia ja dokumentoida analyysejä yhdessä käyttöliittymässä.
Esimerkki: Data-analyytikot käyttävät Jupyter Notebookeja koneoppimismallien prototyyppien luomiseen ja tulosten jakamiseen.

K-lähimmän naapurin menetelmä (KNN) (K-Nearest Neighbours (KNN))

K-Nearest Neighbours (KNN)
Yksinkertainen, ei-parametrinen koneoppimisalgoritmi luokitteluun ja regressioon. Se tekee päätöksiä lähimpien koulutusesimerkkien perusteella ominaisuusavaruudessa.
Esimerkki: Uuden hedelmän luokittelemiseksi omenaksi tai päärynäksi KNN tarkistaa, mitkä merkityt hedelmät ovat lähimpänä muodoltaan ja väriltään.

Tietograafi (Knowledge Graph)

Knowledge Graph
Datastruktuuri, joka käyttää solmuja ja reunoja esittämään ja tallentamaan linkitettyjä kuvauksia entiteeteistä ja niiden suhteista.
Esimerkki: Googlen tietopaneeli perustuu tietograafiin, joka yhdistää entiteettejä, kuten ihmisiä, paikkoja ja tapahtumia.

Kielimallin optimointi (LLMO) (Language Learning Model Optimisation (LLMO))

Language Learning Model Optimisation (LLMO)
Tekniikat, joita käytetään suurten kielimallien suorituskyvyn, tehokkuuden tai mukautuvuuden parantamiseksi tiettyihin tehtäviin tai aloihin.
Esimerkki: Kvantisoinnin ja ohjeiden virityksen käyttö LLM:n optimoimiseksi yrityskäyttöön.

Suuri kielimalli (LLM) (Large Language Model (LLM))

Large Language Model (LLM)
Syväoppimismallin tyyppi, joka on koulutettu valtavalla määrällä tekstidataa ja joka pystyy tuottamaan, ymmärtämään ja järkeilemään ihmiskielellä.
Esimerkki: ChatGPT ja Claude ovat LLM-malleja, jotka on koulutettu auttamaan kirjoittamisessa, koodaamisessa ja kysymyksiin vastaamisessa.

Piilevä tila (Latent Space)

Latent Space
Korkeaulotteinen abstrakti representaatio, jossa samankaltaiset syötteet ryhmitellään lähelle toisiaan, käytetään generatiivisissa malleissa ja upotuksissa.
Esimerkki: Kuvien luonnissa piilevän tilan manipulointi voi muuttaa ominaisuuksia, kuten kirkkautta tai tunnetta.

Oppimisnopeus (Learning Rate)

Learning Rate
Keskeinen hyperparametri koulutuksessa, joka säätelee, kuinka paljon mallin painoja säädetään suhteessa häviögradienttiin.
Esimerkki: Korkea oppimisnopeus voi johtaa minimien ylittämiseen, kun taas liian matala nopeus hidastaa koulutuksen edistymistä.

Koneoppiminen (ML) (Machine Learning (ML))

Machine Learning (ML)
Tekoälyn haara, joka mahdollistaa järjestelmien oppimisen datasta ja suorituskyvyn parantamisen ilman erillistä ohjelmointia.
Esimerkki: Roskapostisuodattimet käyttävät koneoppimista luokittelemaan sähköposteja roskapostiksi tai ei-roskapostiksi aiempien esimerkkien perusteella.

Mallin ajautuminen (Model Drift)

Model Drift
Ilmiö, jossa mallin tarkkuus heikkenee ajan myötä datan tai ympäristön muutosten vuoksi.
Esimerkki: Petosten tunnistusmalli muuttuu vähemmän tarkaksi petostaktiikoiden kehittyessä.

Mallin koulutus (Model Training)

Model Training
Prosessi, jossa data syötetään koneoppimismalliin ja sen parametreja säädetään virheen minimoimiseksi.
Esimerkki: Suositusmoottorin kouluttaminen asiakkaiden ostoshistorian perusteella uusien tuotteiden ehdottamiseksi.

Multimodaalinen tekoäly (Multimodal AI)

Multimodal AI
Tekoälyjärjestelmät, jotka pystyvät käsittelemään ja integroimaan useita datatyyppejä, kuten tekstiä, kuvia, ääntä ja videota.
Esimerkki: Malli, kuten GPT-4 Vision, joka pystyy lukemaan tekstiä ja tulkitsemaan kuvia samanaikaisesti.

Luonnollisen kielen käsittely (NLP) (Natural Language Processing (NLP))

Natural Language Processing (NLP)
Tekoälyn osa-alue, joka keskittyy tietokoneiden ja ihmisten (luonnollisten) kielten väliseen vuorovaikutukseen. Se mahdollistaa koneiden lukemisen, ymmärtämisen ja vastaamisen ihmiskielellä.
Esimerkki: NLP:tä käytetään puheavustajissa, kieltenkääntösovelluksissa ja chatboteissa.

Neuroverkko (Neural Network)

Neural Network
Koneoppimismalli, joka on saanut inspiraationsa ihmisaivojen rakenteesta ja koostuu toisiinsa yhdistettyjen solmujen (neuronien) kerroksista.
Esimerkki: Neuroverkot ovat syväoppimismallien takana, joita käytetään kuvan- ja puheentunnistuksessa.

Kohina (Noise)

Noise
Satunnainen tai merkityksetön tieto datassa, joka voi peittää merkityksellisiä kuvioita ja heikentää mallin suorituskykyä.
Esimerkki: Anturivirheet tai kirjoitusvirheitä sisältävät datasyötteet voidaan katsoa kohinaksi.

Ontologia (Ontology)

Ontology
Jäsennelty kehys, joka luokittelee ja määrittelee käsitteiden välisiä suhteita tietyllä alalla, usein käytetään semanttisissa tekoälyjärjestelmissä.
Esimerkki: Ontologia terveydenhuollossa voi määritellä, miten oireet liittyvät sairauksiin ja hoitoihin.

Ylisovittaminen (Overfitting)

Overfitting
Mallinnusvirhe, jossa koneoppimismalli sieppaa koulutusdatan kohinan ja suoriutuu huonosti uudesta datasta.
Esimerkki: Malli, joka muistaa koulutuksen vastaukset, mutta ei pysty käsittelemään näkymätöntä testidataa, on ylisovitettu.

Ennakoiva analytiikka (Predictive Analytics)

Predictive Analytics
Datan, algoritmien ja tekoälyn käyttö todennäköisyyden tunnistamiseksi tulevista tuloksista historiallisten tietojen perusteella.
Esimerkki: Vähittäiskauppiaat käyttävät ennakoivaa analytiikkaa ennustaakseen tiettyjen tuotteiden kysyntää.

Esikoulutus (Pre-training)

Pre-training
Prosessi, jossa malli koulutetaan aluksi suurella, yleisellä tietojoukolla ennen sen hienosäätöä tiettyihin tehtäviin.
Esimerkki: GPT-malleja esikoulutetaan suurilla korpuksilla ennen niiden mukauttamista asiakaspalveluchatbotteihin.

Kehotetekniikka (Prompt Engineering)

Prompt Engineering
Taito ja tiede tehokkaiden kehotteiden luomiseksi suurten kielimallien tulosten ohjaamiseksi.
Esimerkki: Järjestelmän ohjeiden, kuten 'Vastaa kohteliaana tutorina', lisääminen on esimerkki kehotetekniikasta.

Kvantisointi (Quantisation)

Quantisation
Mallin pakkaustekniikka, joka vähentää painojen ja aktivointien esittämiseen käytettyjen bittien määrää, parantaen tehokkuutta.
Esimerkki: Mallin kvantisointi 32-bittisestä 8-bittiseksi parantaa suorituskykyä mobiililaitteissa.

Kvanttilaskenta (Quantum Computing)

Quantum Computing
Uusi laskennan paradigma, joka perustuu kvanttimekaniikkaan ja jolla on potentiaalia eksponentiaalisiin prosessointikykyihin.
Esimerkki: Kvanttilaskenta voi tulevaisuudessa nopeuttaa tekoälyn koulutusta klassisten rajojen yli.

Päättelymoottori (Reasoning Engine)

Reasoning Engine
Tekoälyn järjestelmä, joka johtaa loogisia päätelmiä faktojen tai datan joukosta käyttämällä sääntöjä tai päättelyalgoritmeja.
Esimerkki: Tekoälydiagnoosiavustaja käyttää päättelymoottoria päätelläkseen mahdollisia sairauksia oireiden perusteella.

Vahvistusoppiminen (RL) (Reinforcement Learning (RL))

Reinforcement Learning (RL)
Koneoppimisen alue, jossa agentit oppivat vuorovaikuttamalla ympäristönsä kanssa maksimoidakseen kumulatiiviset palkkiot.
Esimerkki: Robotti oppii kävelemään yrityksen ja erehdyksen kautta käyttämällä RL-tekniikoita.

Vahvistusoppiminen ihmispalautteella (RLHF) (Reinforcement Learning with Human Feedback (RLHF))

Reinforcement Learning with Human Feedback (RLHF)
Oppimismenetelmä, jossa ihmisten mieltymykset ohjaavat tekoälyn palkkiota, usein käytetään kielimallien hienosäätöön.
Esimerkki: ChatGPT koulutettiin RLHF:llä tuottamaan hyödyllisempiä ja turvallisempia vastauksia.

Hakuun perustuva generointi (RAG) (Retrieval-Augmented Generation (RAG))

Retrieval-Augmented Generation (RAG)
Menetelmä, joka yhdistää tiedonhaun ja generoinnin, jossa LLM hakee asiaankuuluvia asiakirjoja parantaakseen vastaustaan.
Esimerkki: Tekoälyavustaja hakee ja viittaa tuotespesifikaatioihin vastatessaan tekniseen kysymykseen.

Itseohjattu oppiminen (Self-Supervised Learning)

Self-Supervised Learning
Koulutusmenetelmä, jossa malli oppii kuvioita luomalla omia merkintöjä raakadatasta, vähentäen riippuvuutta ihmisen annotoimasta datasta.
Esimerkki: BERT koulutetaan itseohjatulla oppimisella ennustamalla puuttuvia sanoja tekstissä.

Semanttinen haku (Semantic Search)

Semantic Search
Hakutekniikka, joka ymmärtää käyttäjän tarkoituksen ja kontekstuaalisen merkityksen, ei vain avainsanojen vastaavuutta.
Esimerkki: Hakemalla 'miten korjata vuotava hana' palautetaan ohjeita, vaikka termiä 'vuotava hana' ei olisikaan dokumentissa.

Sentimenttianalyysi (Sentiment Analysis)

Sentiment Analysis
Prosessi, jossa tunnistetaan tunteita, mielipiteitä tai asenteita tekstissä, usein luokitellen ne positiivisiksi, negatiivisiksi tai neutraaleiksi.
Esimerkki: Tweetien analysointi julkisen reaktion mittaamiseksi uuteen tuotteeseen.

Stokastinen (Stochastic)

Stochastic
Sisältää satunnaisuutta tai todennäköisyyskäyttäytymistä, usein käytetään generatiivisessa tekoälyssä ja optimointialgoritmeissa.
Esimerkki: GPT-4:n tulos vaihtelee samalle syötteelle sen stokastisen dekoodausprosessin vuoksi.

Vahva tekoäly (Strong AI)

Strong AI
Tunnetaan myös nimellä Yleinen tekoäly (AGI), viittaa koneisiin, joilla on ihmisen tasoiset kognitiiviset kyvyt kaikilla aloilla.
Esimerkki: Tulevaisuuden tekoäly, joka voi itsenäisesti kirjoittaa romaaneja, suunnitella kaupunkeja ja ratkaista eettisiä dilemmoja yhtä hyvin.

Supertekoäly (SAI) (Super Artificial Intelligence (SAI))

Super Artificial Intelligence (SAI)
Teoreettinen tekoäly, joka ylittää ihmisälyn kaikilla osa-alueilla – päättely, luovuus, emotionaalinen älykkyys jne.
Esimerkki: SAI voisi teoreettisesti kehittää uusia tieteitä ja filosofioita itsenäisesti.

Ohjattu oppiminen (Supervised Learning)

Supervised Learning
Koneoppimistekniikka, jossa mallit koulutetaan merkityllä datalla oppimaan syöte-tuloste-yhdistelmiä.
Esimerkki: Mallin opettaminen luokittelemaan sähköposteja roskapostiksi tai ei-roskapostiksi käyttämällä historiallisia esimerkkejä.

Synteettinen data (Synthetic Data)

Synthetic Data
Keinotekoisesti luotu data, joka simuloi todellista dataa, usein käytetään koulutukseen, kun todellista dataa on vähän tai se on arkaluonteista.
Esimerkki: Synteettisten lääketieteellisten kuvien luominen diagnostiikkamallien kouluttamiseksi rikkomatta potilaan yksityisyyttä.

Tokeni (Token)

Token
Tekstin yksikkö, jota LLM:t käsittelevät – tyypillisesti sana tai sanan osa.
Esimerkki: Lause 'Hei maailma!' jaetaan 3 tokeniin: 'Hei', 'maailma' ja '!'.

Tokenisointi (Tokenisation)

Tokenisation
Prosessi, jossa teksti jaetaan tokeneiksi mallin käsittelyä varten.
Esimerkki: NLP:ssä 'ChatGPT on mahtava' muuttuu muotoon ['Chat', 'G', 'PT', 'on', 'mahtava'].

Siirto-oppiminen (Transfer Learning)

Transfer Learning
Tiedon käyttäminen yhdestä tehtävästä toisen liittyvän tehtävän oppimisen parantamiseksi, vähentäen koulutusaikaa ja datatarpeita.
Esimerkki: Englanninkielisellä tekstillä koulutetun mallin hienosäätö tunnesanalyysin suorittamiseksi toisella kielellä.

Muuntaja (Transformer)

Transformer
Neuroverkkoarkkitehtuuri, joka käyttää huomiomekanismeja sekvenssidatan mallintamiseen, laajalti käytössä LLM:issä.
Esimerkki: BERT, GPT ja T5 ovat kaikki muuntajapohjaisia malleja.

Alisovittaminen (Underfitting)

Underfitting
Kun malli on liian yksinkertainen kaapatakseen koulutusdatan kuviot, mikä johtaa huonoon suorituskykyyn.
Esimerkki: Lineaarinen malli, joka yrittää ennustaa monimutkaisia kuvien luokitteluja, voi alisovittua.

Ohjaamaton oppiminen (Unsupervised Learning)

Unsupervised Learning
Oppimismenetelmä, jossa mallit tunnistavat kuvioita tai klustereita merkitsemättömästä datasta.
Esimerkki: Asiakkaiden ryhmittely ostokäyttäytymisen perusteella ilman ennalta määriteltyjä merkintöjä.

Käyttäjän tarkoitus (User Intent)

User Intent
Käyttäjän kyselyn tai vuorovaikutuksen takana oleva tavoite tai tarkoitus.
Esimerkki: Käyttäjä, joka kirjoittaa 'miten leipoa kakku', todennäköisesti aikoo löytää reseptin.

Validointijoukko (Validation Set)

Validation Set
Datan alijoukko, jota käytetään mallin suorituskyvyn arviointiin koulutuksen aikana ja hyperparametrien virittämiseen.
Esimerkki: Käytetään ylisovittamisen havaitsemiseen ennen lopullista testausta.

Vektorikanta (Vector Database)

Vector Database
Tietokanta, joka on suunniteltu tallentamaan ja hakemaan vektoripohjaisia upotuksia, joita käytetään tekoälytehtävissä, kuten samankaltaisuushaku ja RAG.
Esimerkki: Pinecone ja Weaviate ovat vektorikantoja teksti- tai kuvaupotusten tallentamiseen.

Vektoriupotus (Vector Embedding)

Vector Embedding
Datan numeerinen representaatio, joka säilyttää semanttisen merkityksen ja suhteet vektoritilassa.
Esimerkki: Sanat 'kuningas' ja 'kuningatar' ovat samankaltaisissa upotuksissa pienillä sukupuolieroilla.

Virtuaaliavustaja (Virtual Assistant)

Virtual Assistant
Tekoälypohjainen ohjelmistoagentti, joka auttaa käyttäjiä suorittamaan tehtäviä keskustelun tai äänikomentojen avulla.
Esimerkki: Siri, Alexa ja Google Assistant ovat suosittuja virtuaaliavustajia.

Puheentunnistus (Voice Recognition)

Voice Recognition
Teknologia, joka tulkitsee ja muuntaa puhutun kielen tekstiksi tai toiminnoksi.
Esimerkki: Puhekirjoitus ja äänikomennot perustuvat puheentunnistusjärjestelmiin.

Heikko tekoäly (Weak AI)

Weak AI
Tekoälyjärjestelmät, jotka on suunniteltu suorittamaan kapea, spesifinen tehtävä ilman yleistä älykkyyttä.
Esimerkki: Shakkia pelaava tekoäly, joka ei pysty ymmärtämään kieltä tai ajamaan autoa, on esimerkki heikosta tekoälystä.

Verkkosivujen kaavinta (Web Scraping)

Web Scraping
Automaattinen tiedon poiminta verkkosivuilta, usein käytetään koulutusdatan keräämiseen tai sisällön seurantaan.
Esimerkki: Kiinteistöilmoitusten kaavinta kiinteistöjen arvostusmallin kouluttamiseksi.

Paino (Weight)

Weight
Neuroverkkojen parametri, joka määrittää yhden solmun vaikutuksen vahvuuden toiseen.
Esimerkki: Painot säätyvät koulutuksen aikana mallin virheen minimoimiseksi.

Kuiskata (Whisper)

Whisper
OpenAI:n kehittämä puheesta tekstiksi -malli, joka pystyy transkriboimaan ääntä useilla kielillä.
Esimerkki: Whisper voi transkriboida luentoja ja podcasteja suurella tarkkuudella.

YAML (YAML)

YAML
Ihmisluettava formaatti datan serialisointiin, jota käytetään yleisesti konfiguraatiotiedostoissa koneoppimistyönkuluissa.
Esimerkki: Malliparametrien määrittäminen YAML-tiedostossa koulutusta varten PyTorchissa.

Nolla-esimerkin oppiminen (Zero-shot Learning)

Zero-shot Learning
Mallin kyky suorittaa tehtäviä, joihin sitä ei ole erikseen koulutettu, hyödyntämällä yleistä tietoa.
Esimerkki: Malli vastaa oikeudellisiin kysymyksiin, vaikka sitä ei ole koulutettu erityisesti oikeudellisella datalla.

Zettatavu (Zettabyte)

Zettabyte
Digitaalisen datan yksikkö, joka on yhtä suuri kuin yksi sekstilliardia (10^21) tavua, usein käytetään kuvaamaan internet-datan mittakaavaa.
Esimerkki: Globaali internetliikenne ylitti 1 zettatavun vuodessa vuoteen 2016 mennessä.