Penjajaran (Alignment)
Alignment
Proses memastikan bahwa tujuan, keluaran, dan perilaku sistem AI selaras dengan tujuan dan nilai-nilai manusia. Ini sangat penting dalam sistem canggih yang mungkin mengembangkan perilaku yang tidak dimaksudkan secara eksplisit.
Contoh: Memastikan chatbot untuk dukungan kesehatan mental tidak pernah merekomendasikan tindakan berbahaya terlepas dari perintah.
Antarmuka Pemrograman Aplikasi (API) (Application Programming Interface (API))
Application Programming Interface (API)
Serangkaian aturan dan protokol yang ditentukan yang memungkinkan sistem perangkat lunak yang berbeda untuk berkomunikasi dan bertukar data.
Contoh: Menggunakan API OpenAI untuk mengirim perintah dan menerima respons yang dihasilkan model bahasa di aplikasi web Anda.
Kecerdasan Buatan Umum (AGI) (Artificial General Intelligence (AGI))
Artificial General Intelligence (AGI)
Bentuk AI teoretis yang dapat melakukan tugas intelektual apa pun yang dapat dilakukan manusia. Ini menggeneralisasi pembelajaran di berbagai domain.
Contoh: Sistem AGI dapat belajar komposisi musik, melakukan operasi bedah, dan lulus ujian filsafat tanpa pemrograman khusus tugas.
Kecerdasan Buatan (AI) (Artificial Intelligence (AI))
Artificial Intelligence (AI)
Simulasi kecerdasan manusia dalam mesin yang diprogram untuk berpikir, bernalar, dan bertindak secara otonom.
Contoh: AI menggerakkan asisten pribadi seperti Siri dan sistem mengemudi otonom seperti Tesla Autopilot.
Etika AI (AI Ethics)
AI Ethics
Disiplin yang berkaitan dengan implikasi moral dari pengembangan dan penggunaan AI, termasuk keadilan, privasi, akuntabilitas, dan non-diskriminasi.
Contoh: Membuat pedoman untuk mencegah algoritma perekrutan mendiskriminasi berdasarkan gender atau etnis.
Kecerdasan Tertambah (Augmented Intelligence)
Augmented Intelligence
Model kolaboratif di mana AI melengkapi dan meningkatkan kecerdasan manusia daripada menggantikannya.
Contoh: Alat radiologi bertenaga AI yang menyoroti anomali untuk dokter, yang membuat diagnosis akhir.
Agen Otonom (Autonomous Agent)
Autonomous Agent
Sistem AI yang mampu membuat keputusan sendiri dan mengambil tindakan untuk mencapai tujuannya tanpa campur tangan manusia.
Contoh: Robot pengiriman otonom yang menavigasi jalan kota dan menghindari rintangan secara independen.
Backpropagation (Backpropagation)
Backpropagation
Teknik untuk melatih jaringan saraf dengan memperbarui bobot secara terbalik dari lapisan keluaran ke masukan, meminimalkan kesalahan prediksi.
Contoh: Digunakan dalam melatih pengklasifikasi gambar untuk mengurangi tingkat kesalahan dalam mengenali digit tulisan tangan.
Bias (Bias Algoritmik) (Bias (Algorithmic Bias))
Bias (Algorithmic Bias)
Favoritisme yang tidak disengaja dan sistematis dalam hasil AI karena data pelatihan yang tidak seimbang atau tidak representatif.
Contoh: Sistem pengenalan wajah yang lebih sering salah mengidentifikasi orang kulit berwarna karena kurangnya representasi dalam data pelatihan.
Big Data (Big Data)
Big Data
Kumpulan data yang sangat besar yang memerlukan alat khusus untuk menyimpan, menganalisis, dan mengekstrak nilai, sering digunakan untuk melatih model AI.
Contoh: Menggunakan jutaan interaksi pengguna untuk melatih mesin rekomendasi untuk platform e-commerce.
Model Kotak Hitam (Black Box Model)
Black Box Model
Jenis model AI atau pembelajaran mesin yang logika internalnya tidak mudah ditafsirkan oleh manusia, sehingga sulit untuk memahami bagaimana keputusan dibuat.
Contoh: Jaringan saraf dalam yang digunakan untuk menyetujui pinjaman tetapi tidak memberikan penjelasan yang jelas mengapa satu pelamar diterima dan yang lain ditolak.
Komputasi Kognitif (Cognitive Computing)
Cognitive Computing
Sistem AI yang dirancang untuk mensimulasikan proses berpikir manusia, seperti penalaran dan pembelajaran, menggunakan teknik seperti NLP dan pengenalan pola.
Contoh: Sistem komputasi kognitif yang membantu profesional hukum menganalisis undang-undang kasus dan memprediksi hasil.
Visi Komputer (Computer Vision)
Computer Vision
Bidang kecerdasan buatan yang memungkinkan komputer untuk menafsirkan dan memproses data visual seperti gambar dan video.
Contoh: Sistem pengenalan wajah yang mengidentifikasi orang dalam rekaman keamanan menggunakan visi komputer.
Korpus (Corpus)
Corpus
Kumpulan besar teks tertulis atau lisan yang digunakan untuk melatih model bahasa.
Contoh: Dataset Common Crawl adalah korpus web publik yang digunakan untuk melatih model bahasa besar seperti GPT.
Data Drift (Data Drift)
Data Drift
Fenomena di mana data masukan berubah seiring waktu, menyebabkan kinerja model menurun.
Contoh: Model pemeliharaan prediktif untuk peralatan industri menjadi kurang akurat karena teknologi sensor baru diperkenalkan.
Pelabelan Data (Data Labelling)
Data Labelling
Proses anotasi data dengan tag atau label agar sesuai untuk pembelajaran terawasi.
Contoh: Melabeli ribuan gambar tumor sebagai jinak atau ganas untuk melatih model deteksi kanker.
Data Mining (Data Mining)
Data Mining
Proses menemukan pola, korelasi, dan anomali yang bermakna dalam kumpulan data besar.
Contoh: Pengecer menggunakan data mining untuk mengidentifikasi bahwa orang yang membeli popok sering juga membeli bir.
Pembelajaran Mendalam (Deep Learning)
Deep Learning
Sub-bidang pembelajaran mesin yang menggunakan jaringan saraf berlapis-lapis untuk memodelkan pola kompleks dalam data.
Contoh: Pembelajaran mendalam digunakan dalam model bahasa seperti GPT-4 dan model generasi gambar seperti Stable Diffusion.
Model Difusi (Diffusion Models)
Diffusion Models
Kelas model generatif yang belajar menghasilkan data dengan mengubah derau acak secara bertahap menjadi keluaran terstruktur.
Contoh: Stable Diffusion membuat gambar fotorealistik dari perintah teks menggunakan teknik difusi.
Embedding (Embedding)
Embedding
Representasi numerik data, sering digunakan untuk menangkap makna semantik kata, gambar, atau kalimat.
Contoh: Dalam NLP, kata 'bank' mungkin memiliki embedding yang mirip dengan 'uang' tetapi berbeda dari 'tepi sungai' tergantung pada konteksnya.
Epoch (Epoch)
Epoch
Satu iterasi penuh atas seluruh kumpulan data pelatihan selama proses pelatihan model pembelajaran mesin.
Contoh: Jika kumpulan data memiliki 1.000 contoh dan model melihat semuanya sekali selama pelatihan, itu adalah satu epoch.
AI Etis (Ethical AI)
Ethical AI
Filosofi desain dan penerapan yang memastikan teknologi AI beroperasi secara transparan, adil, dan sejalan dengan nilai-nilai masyarakat.
Contoh: Alat perekrutan AI yang menyertakan pemeriksaan bias untuk mencegah diskriminasi terhadap kandidat minoritas.
Sistem Pakar (Expert System)
Expert System
Sistem AI yang meniru kemampuan pengambilan keputusan seorang ahli manusia dalam domain tertentu menggunakan aturan dan logika.
Contoh: Sistem pakar yang digunakan dalam pertanian untuk merekomendasikan perawatan tanaman berdasarkan data tanah dan riwayat hama.
AI yang Dapat Dijelaskan (XAI) (Explainable AI (XAI))
Explainable AI (XAI)
Sistem AI yang dirancang untuk membuat proses dan keputusan internalnya dapat dipahami oleh manusia, meningkatkan kepercayaan dan akuntabilitas.
Contoh: AI diagnostik medis yang tidak hanya memberikan rekomendasi tetapi juga menjelaskan gejala apa yang mengarah pada kesimpulan tersebut.
Pembelajaran Sedikit Contoh (Few-shot Learning)
Few-shot Learning
Metode pembelajaran mesin di mana model dilatih atau disesuaikan menggunakan hanya sejumlah kecil contoh berlabel.
Contoh: Menyesuaikan LLM untuk menulis email hukum setelah menunjukkannya hanya 10 contoh.
Fine-tuning (Fine-tuning)
Fine-tuning
Proses mengambil model yang telah dilatih sebelumnya dan melatihnya lebih lanjut pada kumpulan data baru yang lebih kecil untuk mengkhususkannya pada tugas tertentu.
Contoh: Menyesuaikan LLM umum seperti GPT pada dokumen internal untuk membuat asisten penyusunan hukum.
Model Fondasi (Foundation Model)
Foundation Model
Model skala besar yang dilatih pada data yang beragam dan luas yang dapat diadaptasi untuk banyak tugas hilir.
Contoh: GPT-4 dan PaLM 2 adalah model fondasi yang mampu melakukan ringkasan, tanya jawab, terjemahan, dan lainnya.
Logika Fuzzy (Fuzzy Logic)
Fuzzy Logic
Bentuk logika yang berurusan dengan nilai perkiraan alih-alih logika biner benar/salah yang tetap, berguna untuk penalaran dalam ketidakpastian.
Contoh: Digunakan dalam sistem kontrol iklim untuk menyesuaikan suhu berdasarkan masukan fuzzy seperti 'agak panas' atau 'sangat dingin'.
Jaringan Generatif Adversarial (GAN) (Generative Adversarial Network (GAN))
Generative Adversarial Network (GAN)
Arsitektur model generatif di mana dua jaringan — generator dan diskriminator — bersaing untuk meningkatkan kualitas keluaran.
Contoh: GAN digunakan untuk membuat video deepfake atau menghasilkan foto produk realistis dari sketsa.
AI Generatif (Generative AI)
Generative AI
Kategori kecerdasan buatan yang dapat membuat konten baru — seperti teks, gambar, musik, atau video — dari data pelatihan.
Contoh: ChatGPT menghasilkan posting blog atau Midjourney membuat karya seni digital dari perintah tekstual.
Transformer yang Dilatih Sebelumnya (GPT) (Generative Pre-trained Transformer (GPT))
Generative Pre-trained Transformer (GPT)
Kelas model bahasa besar yang dikembangkan oleh OpenAI yang menggunakan arsitektur transformer dan dilatih sebelumnya pada data teks dalam jumlah besar untuk melakukan berbagai tugas bahasa.
Contoh: GPT-4 mampu menulis esai, menerjemahkan bahasa, dan meringkas dokumen dengan sedikit perintah.
Algoritma Genetik (Genetic Algorithm)
Genetic Algorithm
Teknik optimasi yang terinspirasi oleh seleksi alam di mana solusi berevolusi dari waktu ke waktu melalui mutasi, persilangan, dan seleksi.
Contoh: Digunakan untuk merancang arsitektur jaringan saraf yang efisien dengan mensimulasikan kelangsungan hidup yang terkuat.
Halusinasi (Hallucination)
Hallucination
Pembuatan konten yang terdengar masuk akal tetapi secara faktual salah atau tidak masuk akal oleh model AI.
Contoh: Model bahasa menciptakan kutipan yang tidak ada atau memberikan fakta sejarah yang salah.
Heuristik (Heuristic)
Heuristic
Pendekatan praktis untuk pemecahan masalah yang tidak menjamin solusi sempurna tetapi cukup untuk tujuan langsung.
Contoh: Menggunakan aturan praktis untuk memperkirakan waktu pengiriman dalam sistem AI logistik.
Hiperparameter (Hyperparameter)
Hyperparameter
Nilai konfigurasi yang ditetapkan sebelum melatih model pembelajaran mesin, seperti tingkat pembelajaran atau jumlah lapisan.
Contoh: Menyesuaikan ukuran batch dari 32 menjadi 128 untuk meningkatkan kecepatan pelatihan dan kinerja model.
Inferensi (Inference)
Inference
Proses menggunakan model pembelajaran mesin yang telah dilatih untuk membuat prediksi atau menghasilkan keluaran dari data masukan baru.
Contoh: Menggunakan model GPT yang telah disesuaikan untuk menyusun email untuk tim dukungan pelanggan.
Deteksi Niat (Intent Detection)
Intent Detection
Tugas dalam pemahaman bahasa alami di mana sistem mengidentifikasi tujuan atau maksud pengguna dalam sebuah pesan.
Contoh: Dalam chatbot, mengenali 'Saya ingin memesan penerbangan' sebagai niat pemesanan perjalanan.
Internet of Things (IoT) (Internet of Things (IoT))
Internet of Things (IoT)
Jaringan perangkat fisik yang saling terhubung yang tertanam dengan sensor, perangkat lunak, dan teknologi lainnya untuk mengumpulkan dan bertukar data.
Contoh: Termostat pintar dan kulkas yang melaporkan data penggunaan dan menyesuaikan pengaturan menggunakan analisis AI.
Interpretasi (Interpretability)
Interpretability
Sejauh mana manusia dapat memahami mekanisme internal model pembelajaran mesin dan proses pengambilan keputusannya.
Contoh: Pohon keputusan lebih dapat diinterpretasikan daripada jaringan saraf dalam karena keputusannya dapat dilacak.
Jupyter Notebook (Jupyter Notebook)
Jupyter Notebook
Lingkungan komputasi interaktif sumber terbuka yang memungkinkan pengguna menulis kode, memvisualisasikan keluaran, dan mendokumentasikan analisis dalam satu antarmuka.
Contoh: Ilmuwan data menggunakan Jupyter Notebook untuk membuat prototipe model pembelajaran mesin dan berbagi hasil.
K-Nearest Neighbours (KNN) (K-Nearest Neighbours (KNN))
K-Nearest Neighbours (KNN)
Algoritma pembelajaran mesin yang sederhana dan non-parametrik yang digunakan untuk klasifikasi dan regresi. Ini membuat keputusan berdasarkan contoh pelatihan terdekat dalam ruang fitur.
Contoh: Untuk mengklasifikasikan buah baru sebagai apel atau pir, KNN memeriksa buah berlabel mana yang terdekat dalam bentuk dan warna.
Grafik Pengetahuan (Knowledge Graph)
Knowledge Graph
Struktur data yang menggunakan node dan edge untuk merepresentasikan dan menyimpan deskripsi entitas yang saling terkait dan hubungannya.
Contoh: Panel pengetahuan Google didukung oleh grafik pengetahuan yang menghubungkan entitas seperti orang, tempat, dan peristiwa.
Optimasi Model Pembelajaran Bahasa (LLMO) (Language Learning Model Optimisation (LLMO))
Language Learning Model Optimisation (LLMO)
Teknik yang digunakan untuk meningkatkan kinerja, efisiensi, atau kemampuan adaptasi model bahasa besar untuk tugas atau domain tertentu.
Contoh: Menggunakan kuantisasi dan penyetelan instruksi untuk mengoptimalkan LLM untuk penggunaan perusahaan.
Model Bahasa Besar (LLM) (Large Language Model (LLM))
Large Language Model (LLM)
Jenis model pembelajaran mendalam yang dilatih pada data tekstual dalam jumlah besar yang mampu menghasilkan, memahami, dan bernalar dengan bahasa manusia.
Contoh: ChatGPT dan Claude adalah LLM yang dilatih untuk membantu dalam menulis, pengkodean, dan menjawab pertanyaan.
Ruang Laten (Latent Space)
Latent Space
Representasi abstrak berdimensi tinggi di mana masukan serupa dikelompokkan berdekatan, digunakan dalam model generatif dan embedding.
Contoh: Dalam generasi gambar, memanipulasi ruang laten dapat mengubah fitur seperti kecerahan atau emosi.
Tingkat Pembelajaran (Learning Rate)
Learning Rate
Hiperparameter utama dalam pelatihan yang mengontrol seberapa banyak bobot model disesuaikan sehubungan dengan gradien kerugian.
Contoh: Tingkat pembelajaran yang tinggi dapat menyebabkan pelampauan minimum, sementara tingkat yang terlalu rendah memperlambat kemajuan pelatihan.
Pembelajaran Mesin (ML) (Machine Learning (ML))
Machine Learning (ML)
Cabang AI yang memungkinkan sistem belajar dari data dan meningkatkan kinerja tanpa diprogram secara eksplisit.
Contoh: Filter spam menggunakan pembelajaran mesin untuk mengklasifikasikan email sebagai spam atau tidak berdasarkan contoh sebelumnya.
Model Drift (Model Drift)
Model Drift
Fenomena di mana akurasi model menurun seiring waktu karena perubahan dalam data atau lingkungan.
Contoh: Model deteksi penipuan menjadi kurang akurat karena taktik penipuan berkembang.
Pelatihan Model (Model Training)
Model Training
Proses memasukkan data ke model pembelajaran mesin dan menyesuaikan parameternya untuk meminimalkan kesalahan.
Contoh: Melatih mesin rekomendasi pada riwayat pembelian pelanggan untuk menyarankan produk baru.
AI Multimodal (Multimodal AI)
Multimodal AI
Sistem AI yang mampu memproses dan mengintegrasikan berbagai jenis data seperti teks, gambar, audio, dan video.
Contoh: Model seperti GPT-4 Vision yang dapat membaca teks dan menafsirkan gambar secara bersamaan.
Pemrosesan Bahasa Alami (NLP) (Natural Language Processing (NLP))
Natural Language Processing (NLP)
Sub-bidang AI yang berfokus pada interaksi antara komputer dan bahasa manusia (alami). Ini memungkinkan mesin untuk membaca, memahami, dan merespons dalam bahasa manusia.
Contoh: NLP digunakan dalam asisten suara, aplikasi terjemahan bahasa, dan chatbot.
Jaringan Saraf (Neural Network)
Neural Network
Model pembelajaran mesin yang terinspirasi oleh struktur otak manusia, terdiri dari lapisan node (neuron) yang saling terhubung.
Contoh: Jaringan saraf berada di balik model pembelajaran mendalam yang digunakan dalam pengenalan gambar dan suara.
Derau (Noise)
Noise
Informasi acak atau tidak relevan dalam data yang dapat mengaburkan pola yang bermakna dan berdampak negatif pada kinerja model.
Contoh: Kesalahan sensor atau entri data yang penuh salah ketik dapat dianggap sebagai derau.
Ontologi (Ontology)
Ontology
Kerangka kerja terstruktur yang mengkategorikan dan mendefinisikan hubungan antar konsep dalam suatu domain, sering digunakan dalam sistem AI semantik.
Contoh: Ontologi dalam perawatan kesehatan mungkin mendefinisikan bagaimana gejala berhubungan dengan penyakit dan pengobatan.
Overfitting (Overfitting)
Overfitting
Kesalahan pemodelan di mana model pembelajaran mesin menangkap derau dalam data pelatihan dan berkinerja buruk pada data baru.
Contoh: Model yang menghafal jawaban pelatihan tetapi tidak dapat menangani data uji yang tidak terlihat telah mengalami overfitting.
Analitik Prediktif (Predictive Analytics)
Predictive Analytics
Penggunaan data, algoritma, dan AI untuk mengidentifikasi kemungkinan hasil di masa depan berdasarkan data historis.
Contoh: Pengecer menggunakan analitik prediktif untuk memperkirakan permintaan produk tertentu.
Pra-pelatihan (Pre-training)
Pre-training
Proses awal melatih model pada kumpulan data umum yang besar sebelum menyesuaikannya untuk tugas-tugas tertentu.
Contoh: Model GPT dilatih sebelumnya pada korpus besar sebelum disesuaikan untuk chatbot layanan pelanggan.
Rekayasa Prompt (Prompt Engineering)
Prompt Engineering
Seni dan ilmu membuat perintah yang efektif untuk mengarahkan keluaran model bahasa besar.
Contoh: Menambahkan instruksi sistem seperti 'Balas sebagai tutor yang sopan' adalah contoh rekayasa prompt.
Kuantisasi (Quantisation)
Quantisation
Teknik kompresi model yang mengurangi jumlah bit yang digunakan untuk merepresentasikan bobot dan aktivasi, meningkatkan efisiensi.
Contoh: Mengkuantisasi model dari 32-bit menjadi 8-bit meningkatkan kinerja pada perangkat seluler.
Komputasi Kuantum (Quantum Computing)
Quantum Computing
Paradigma komputasi baru berdasarkan mekanika kuantum, yang memiliki potensi untuk kemampuan pemrosesan eksponensial.
Contoh: Komputasi kuantum suatu hari nanti dapat mempercepat pelatihan AI melebihi batas klasik.
Mesin Penalaran (Reasoning Engine)
Reasoning Engine
Sistem dalam AI yang menurunkan kesimpulan logis dari serangkaian fakta atau data menggunakan aturan atau algoritma inferensi.
Contoh: Alat diagnosis AI menggunakan mesin penalaran untuk menyimpulkan kemungkinan kondisi medis berdasarkan gejala.
Pembelajaran Penguatan (RL) (Reinforcement Learning (RL))
Reinforcement Learning (RL)
Area pembelajaran mesin di mana agen belajar dengan berinteraksi dengan lingkungan mereka untuk memaksimalkan imbalan kumulatif.
Contoh: Robot belajar berjalan dengan coba-coba menggunakan teknik RL.
Pembelajaran Penguatan dengan Umpan Balik Manusia (RLHF) (Reinforcement Learning with Human Feedback (RLHF))
Reinforcement Learning with Human Feedback (RLHF)
Metode pembelajaran di mana preferensi manusia memandu sinyal imbalan AI, sering digunakan dalam penyesuaian model bahasa.
Contoh: ChatGPT dilatih dengan RLHF untuk menghasilkan respons yang lebih membantu dan aman.
Generasi yang Diperkaya Pengambilan (RAG) (Retrieval-Augmented Generation (RAG))
Retrieval-Augmented Generation (RAG)
Metode yang menggabungkan pengambilan informasi dengan generasi, di mana LLM mengambil dokumen yang relevan untuk meningkatkan responsnya.
Contoh: Asisten AI mengambil dan mengutip spesifikasi produk saat menghasilkan jawaban atas pertanyaan teknis.
Pembelajaran Mandiri (Self-Supervised Learning)
Self-Supervised Learning
Pendekatan pelatihan di mana model belajar pola dengan menghasilkan labelnya sendiri dari data mentah, mengurangi ketergantungan pada data yang dianotasi manusia.
Contoh: BERT dilatih dengan pembelajaran mandiri dengan memprediksi kata-kata yang hilang dalam teks.
Pencarian Semantik (Semantic Search)
Semantic Search
Teknik pencarian yang memahami niat pengguna dan makna kontekstual, bukan hanya pencocokan kata kunci.
Contoh: Mencari 'cara memperbaiki keran bocor' mengembalikan panduan meskipun istilah 'keran bocor' tidak ada dalam dokumen.
Analisis Sentimen (Sentiment Analysis)
Sentiment Analysis
Proses mengidentifikasi emosi, opini, atau sikap dalam teks, seringkali mengklasifikasikannya sebagai positif, negatif, atau netral.
Contoh: Menganalisis tweet untuk mengukur reaksi publik terhadap produk baru.
Stokastik (Stochastic)
Stochastic
Melibatkan keacakan atau perilaku probabilistik, sering digunakan dalam AI generatif dan algoritma optimasi.
Contoh: Keluaran GPT-4 bervariasi untuk masukan yang sama karena proses decoding stokastiknya.
AI Kuat (Strong AI)
Strong AI
Juga dikenal sebagai Kecerdasan Buatan Umum (AGI), mengacu pada mesin dengan kemampuan kognitif setara manusia di semua domain.
Contoh: AI masa depan yang dapat secara otonom menulis novel, merencanakan kota, dan memecahkan dilema etika dengan baik.
Kecerdasan Buatan Super (SAI) (Super Artificial Intelligence (SAI))
Super Artificial Intelligence (SAI)
AI teoretis yang jauh melampaui kecerdasan manusia dalam semua aspek — penalaran, kreativitas, kecerdasan emosional, dll.
Contoh: SAI secara teoretis dapat mengembangkan sains dan filsafat baru secara independen.
Pembelajaran Terawasi (Supervised Learning)
Supervised Learning
Teknik pembelajaran mesin di mana model dilatih pada data berlabel untuk mempelajari pemetaan masukan-keluaran.
Contoh: Mengajari model untuk mengklasifikasikan email sebagai spam atau tidak menggunakan contoh historis.
Data Sintetis (Synthetic Data)
Synthetic Data
Data yang dihasilkan secara artifisial yang mensimulasikan data dunia nyata, sering digunakan untuk pelatihan ketika data nyata langka atau sensitif.
Contoh: Membuat gambar medis sintetis untuk melatih model diagnostik tanpa melanggar privasi pasien.
Token (Token)
Token
Unit teks yang diproses oleh LLM — biasanya kata atau bagian kata.
Contoh: Kalimat 'Halo dunia!' dipecah menjadi 3 token: 'Halo', 'dunia', dan '!'.
Tokenisasi (Tokenisation)
Tokenisation
Proses memecah teks menjadi token untuk diproses oleh model.
Contoh: Dalam NLP, 'ChatGPT hebat' menjadi ['Chat', 'G', 'PT', 'hebat'].
Pembelajaran Transfer (Transfer Learning)
Transfer Learning
Menggunakan pengetahuan dari satu tugas untuk meningkatkan pembelajaran pada tugas terkait lainnya, mengurangi waktu pelatihan dan kebutuhan data.
Contoh: Menyesuaikan model yang dilatih pada teks bahasa Inggris untuk melakukan analisis sentimen dalam bahasa lain.
Transformer (Transformer)
Transformer
Arsitektur jaringan saraf yang menggunakan mekanisme perhatian untuk memodelkan data sekuensial, banyak digunakan dalam LLM.
Contoh: BERT, GPT, dan T5 semuanya adalah model berbasis transformer.
Underfitting (Underfitting)
Underfitting
Ketika model terlalu sederhana untuk menangkap pola dalam data pelatihan, mengakibatkan kinerja yang buruk.
Contoh: Model linier yang mencoba memprediksi klasifikasi gambar yang kompleks mungkin mengalami underfitting.
Pembelajaran Tanpa Pengawasan (Unsupervised Learning)
Unsupervised Learning
Pendekatan pembelajaran di mana model mengidentifikasi pola atau kluster dalam data tanpa label.
Contoh: Mengelompokkan pelanggan berdasarkan perilaku pembelian tanpa label yang telah ditentukan.
Niat Pengguna (User Intent)
User Intent
Tujuan atau maksud di balik kueri atau interaksi pengguna.
Contoh: Pengguna yang mengetik 'cara membuat kue' kemungkinan bermaksud untuk menemukan resep.
Set Validasi (Validation Set)
Validation Set
Sub-kumpulan data yang digunakan untuk mengevaluasi kinerja model selama pelatihan dan menyetel hiperparameter.
Contoh: Digunakan untuk mendeteksi overfitting sebelum pengujian akhir.
Basis Data Vektor (Vector Database)
Vector Database
Basis data yang dirancang untuk menyimpan dan mencari embedding vektor yang digunakan dalam tugas AI seperti pencarian kesamaan dan RAG.
Contoh: Pinecone dan Weaviate adalah basis data vektor untuk menyimpan embedding teks atau gambar.
Embedding Vektor (Vector Embedding)
Vector Embedding
Representasi numerik data yang mempertahankan makna semantik dan hubungan dalam ruang vektor.
Contoh: Kata 'raja' dan 'ratu' memiliki embedding yang serupa dengan perbedaan gender yang halus.
Asisten Virtual (Virtual Assistant)
Virtual Assistant
Agen perangkat lunak bertenaga AI yang membantu pengguna menyelesaikan tugas melalui percakapan atau perintah suara.
Contoh: Siri, Alexa, dan Google Assistant adalah asisten virtual populer.
Pengenalan Suara (Voice Recognition)
Voice Recognition
Teknologi yang menafsirkan dan mengubah bahasa lisan menjadi teks atau tindakan.
Contoh: Pengetikan suara dan perintah suara bergantung pada sistem pengenalan suara.
AI Lemah (Weak AI)
Weak AI
Sistem AI yang dirancang untuk melakukan tugas yang sempit dan spesifik tanpa kecerdasan umum.
Contoh: AI bermain catur yang tidak dapat memahami bahasa atau mengemudikan mobil adalah contoh AI lemah.
Web Scraping (Web Scraping)
Web Scraping
Ekstraksi informasi otomatis dari situs web, sering digunakan untuk mengumpulkan data pelatihan atau memantau konten.
Contoh: Mengikis daftar real estat untuk melatih model penilaian properti.
Bobot (Weight)
Weight
Parameter dalam jaringan saraf yang menentukan kekuatan pengaruh satu node terhadap node lain.
Contoh: Bobot menyesuaikan selama pelatihan untuk meminimalkan kesalahan model.
Whisper (Whisper)
Whisper
Model ucapan-ke-teks yang dikembangkan oleh OpenAI yang mampu mentranskripsikan audio dalam berbagai bahasa.
Contoh: Whisper dapat mentranskripsikan kuliah dan podcast dengan akurasi tinggi.
YAML (YAML)
YAML
Format yang dapat dibaca manusia untuk serialisasi data, umum digunakan untuk file konfigurasi dalam alur kerja pembelajaran mesin.
Contoh: Mendefinisikan parameter model dalam file YAML untuk pelatihan di PyTorch.
Pembelajaran Tanpa Contoh (Zero-shot Learning)
Zero-shot Learning
Kemampuan model untuk melakukan tugas yang belum pernah dilatih secara eksplisit dengan memanfaatkan pengetahuan umum.
Contoh: Model menjawab pertanyaan hukum meskipun tidak dilatih secara khusus pada data hukum.
Zettabyte (Zettabyte)
Zettabyte
Unit data digital yang setara dengan satu sextillion (10^21) byte, sering digunakan untuk menggambarkan skala data internet.
Contoh: Lalu lintas internet global melampaui 1 zettabyte per tahun pada tahun 2016.