Penghapus Jargon AI

Nyahkod istilah kecerdasan buatan dengan glosari komprehensif kami. Daripada pembelajaran mesin kepada rangkaian saraf, kami memecahkan konsep AI yang kompleks kepada istilah yang mudah.

Penjajaran (Alignment)

Alignment
Proses memastikan objektif, output, dan tingkah laku sistem AI selaras dengan matlamat dan nilai manusia. Ini amat penting dalam sistem termaju yang mungkin membangunkan tingkah laku yang tidak dijangka.
Contoh: Memastikan chatbot kesihatan mental tidak pernah mengesyorkan tindakan berbahaya tanpa mengira gesaan.

Antara Muka Pengaturcaraan Aplikasi (API) (Application Programming Interface (API))

Application Programming Interface (API)
Satu set peraturan dan protokol yang ditetapkan yang membolehkan sistem perisian yang berbeza berkomunikasi dan bertukar data.
Contoh: Menggunakan API OpenAI untuk menghantar gesaan dan menerima respons yang dijana oleh model bahasa dalam aplikasi web anda.

Kecerdasan Umum Buatan (AGI) (Artificial General Intelligence (AGI))

Artificial General Intelligence (AGI)
Bentuk AI teoretikal yang boleh melakukan sebarang tugas intelektual yang boleh dilakukan oleh manusia. Ia menggeneralisasikan pembelajaran merentasi domain.
Contoh: Sistem AGI boleh belajar komposisi muzik, melakukan pembedahan, dan lulus peperiksaan falsafah tanpa pengaturcaraan khusus tugas.

Kecerdasan Buatan (AI) (Artificial Intelligence (AI))

Artificial Intelligence (AI)
Simulasi kecerdasan manusia dalam mesin yang diprogram untuk berfikir, menaakul, dan bertindak secara autonomi.
Contoh: AI menggerakkan pembantu peribadi seperti Siri dan sistem pemanduan autonomi seperti Tesla Autopilot.

Etika AI (AI Ethics)

AI Ethics
Disiplin yang berkaitan dengan implikasi moral pembangunan dan penggunaan AI, termasuk keadilan, privasi, akauntabiliti, dan tiada diskriminasi.
Contoh: Mencipta garis panduan untuk mengelakkan algoritma pengambilan pekerja daripada mendiskriminasi berdasarkan jantina atau etnik.

Kecerdasan Terperluas (Augmented Intelligence)

Augmented Intelligence
Model kolaboratif di mana AI melengkapkan dan meningkatkan kecerdasan manusia berbanding menggantikannya.
Contoh: Alat radiologi berkuasa AI yang menyorot anomali untuk doktor, yang membuat diagnosis akhir.

Ejen Autonomi (Autonomous Agent)

Autonomous Agent
Sistem AI yang mampu membuat keputusannya sendiri dan mengambil tindakan untuk mencapai matlamatnya tanpa campur tangan manusia.
Contoh: Robot penghantaran pandu sendiri yang menavigasi jalan bandar dan mengelakkan halangan secara bebas.

Pengembalian Ralat (Backpropagation)

Backpropagation
Teknik untuk melatih rangkaian saraf dengan mengemas kini berat secara songsang dari lapisan output ke input, meminimumkan ralat ramalan.
Contoh: Digunakan dalam melatih pengelas imej untuk mengurangkan kadar ralat dalam mengenali digit tulisan tangan.

Bias (Bias Algoritmik) (Bias (Algorithmic Bias))

Bias (Algorithmic Bias)
Favortisme yang tidak disengajakan dan sistematik dalam hasil AI disebabkan oleh data latihan yang tidak seimbang atau tidak mewakili.
Contoh: Sistem pengecaman muka yang salah mengenal pasti orang kulit berwarna lebih kerap kerana kurangnya perwakilan dalam data latihan.

Data Besar (Big Data)

Big Data
Set data yang sangat besar yang memerlukan alatan khas untuk menyimpan, menganalisis, dan mengekstrak nilai, sering digunakan untuk melatih model AI.
Contoh: Menggunakan berjuta-juta interaksi pengguna untuk melatih enjin cadangan untuk platform e-dagang.

Model Kotak Hitam (Black Box Model)

Black Box Model
Jenis model AI atau pembelajaran mesin yang logik dalamannya tidak mudah ditafsirkan oleh manusia, menjadikannya sukar untuk memahami bagaimana keputusan dibuat.
Contoh: Rangkaian saraf mendalam yang digunakan untuk meluluskan pinjaman tetapi tidak menawarkan penjelasan yang jelas mengapa seorang pemohon diterima dan yang lain ditolak.

Pengkomputeran Kognitif (Cognitive Computing)

Cognitive Computing
Sistem AI yang direka untuk meniru proses pemikiran manusia, seperti penaakulan dan pembelajaran, menggunakan teknik seperti NLP dan pengecaman corak.
Contoh: Sistem pengkomputeran kognitif yang membantu profesional undang-undang menganalisis undang-undang kes dan meramalkan hasil.

Visi Komputer (Computer Vision)

Computer Vision
Bidang kecerdasan buatan yang membolehkan komputer mentafsir dan memproses data visual seperti imej dan video.
Contoh: Sistem pengecaman muka yang mengenal pasti orang dalam rakaman keselamatan menggunakan visi komputer.

Korpus (Corpus)

Corpus
Koleksi besar teks bertulis atau lisan yang digunakan untuk melatih model bahasa.
Contoh: Set data Common Crawl ialah korpus web awam yang digunakan untuk melatih model bahasa besar seperti GPT.

Pesongan Data (Data Drift)

Data Drift
Fenomena di mana data input berubah dari semasa ke semasa, menyebabkan prestasi model merosot.
Contoh: Model penyelenggaraan ramalan untuk peralatan industri menjadi kurang tepat apabila teknologi sensor baharu diperkenalkan.

Pelabelan Data (Data Labelling)

Data Labelling
Proses menganotasi data dengan tag atau label untuk menjadikannya sesuai untuk pembelajaran terawasi.
Contoh: Melabelkan beribu-ribu imej tumor sebagai benigna atau maligna untuk melatih model pengesanan kanser.

Perlombongan Data (Data Mining)

Data Mining
Proses menemui corak, korelasi, dan anomali yang bermakna dalam set data yang besar.
Contoh: Peruncit menggunakan perlombongan data untuk mengenal pasti bahawa orang yang membeli lampin sering membeli bir juga.

Pembelajaran Mendalam (Deep Learning)

Deep Learning
Subbidang pembelajaran mesin yang menggunakan rangkaian saraf berbilang lapisan untuk memodelkan corak kompleks dalam data.
Contoh: Pembelajaran mendalam digunakan dalam model bahasa seperti GPT-4 dan model penjanaan imej seperti Stable Diffusion.

Model Resapan (Diffusion Models)

Diffusion Models
Kelas model generatif yang belajar menghasilkan data dengan mengubah hingar rawak secara beransur-ansur kepada output terstruktur.
Contoh: Stable Diffusion mencipta imej fotorealistik daripada gesaan teks menggunakan teknik resapan.

Penyerapan (Embedding)

Embedding
Representasi vektor numerik data, sering digunakan untuk menangkap makna semantik perkataan, imej, atau ayat.
Contoh: Dalam NLP, perkataan 'bank' mungkin mempunyai penyerapan yang serupa dengan 'wang' tetapi berbeza daripada 'tepi sungai' bergantung pada konteks.

Epok (Epoch)

Epoch
Satu iterasi penuh ke atas keseluruhan set data latihan semasa proses latihan model pembelajaran mesin.
Contoh: Jika set data mempunyai 1,000 contoh dan model melihat semuanya sekali semasa latihan, itu ialah satu epok.

AI Etika (Ethical AI)

Ethical AI
Falsafah reka bentuk dan penggunaan yang memastikan teknologi AI beroperasi secara telus, saksama, dan selaras dengan nilai masyarakat.
Contoh: Alat pengambilan pekerja AI yang merangkumi pemeriksaan bias untuk mengelakkan diskriminasi terhadap calon minoriti.

Sistem Pakar (Expert System)

Expert System
Sistem AI yang meniru keupayaan membuat keputusan pakar manusia dalam domain tertentu menggunakan peraturan dan logik.
Contoh: Sistem pakar yang digunakan dalam pertanian untuk mengesyorkan rawatan tanaman berdasarkan data tanah dan sejarah perosak.

AI Boleh Dijelaskan (XAI) (Explainable AI (XAI))

Explainable AI (XAI)
Sistem AI yang direka untuk menjadikan proses dan keputusan dalaman mereka difahami oleh manusia, meningkatkan kepercayaan dan akauntabiliti.
Contoh: AI diagnostik perubatan yang bukan sahaja memberikan cadangan tetapi juga menjelaskan simptom mana yang membawa kepada kesimpulan tersebut.

Pembelajaran Sedikit Contoh (Few-shot Learning)

Few-shot Learning
Kaedah pembelajaran mesin di mana model dilatih atau ditala halus menggunakan hanya beberapa contoh berlabel.
Contoh: Menyesuaikan LLM untuk menulis e-mel undang-undang selepas menunjukkannya hanya 10 contoh.

Penalaan Halus (Fine-tuning)

Fine-tuning
Proses mengambil model pra-latih dan melatihnya selanjutnya pada set data baharu yang lebih kecil untuk mengkhususnya untuk tugas tertentu.
Contoh: Menala halus LLM umum seperti GPT pada dokumen undang-undang dalaman untuk mencipta pembantu draf undang-undang.

Model Asas (Foundation Model)

Foundation Model
Model berskala besar yang dilatih pada data yang pelbagai dan luas yang boleh diadaptasi kepada banyak tugas hiliran.
Contoh: GPT-4 dan PaLM 2 ialah model asas yang mampu meringkas, Q&A, terjemahan, dan banyak lagi.

Logik Kabur (Fuzzy Logic)

Fuzzy Logic
Bentuk logik yang berurusan dengan nilai anggaran dan bukannya logik binari benar/salah yang tetap, berguna untuk penaakulan dalam ketidakpastian.
Contoh: Digunakan dalam sistem kawalan iklim untuk melaraskan suhu berdasarkan input kabur seperti 'agak panas' atau 'sangat sejuk'.

Rangkaian Generatif Adversari (GAN) (Generative Adversarial Network (GAN))

Generative Adversarial Network (GAN)
Arkitektur model generatif di mana dua rangkaian — penjana dan diskriminator — bersaing untuk meningkatkan kualiti output.
Contoh: GAN digunakan untuk mencipta video deepfake atau menjana foto produk realistik daripada lakaran.

AI Generatif (Generative AI)

Generative AI
Kategori kecerdasan buatan yang boleh mencipta kandungan baharu — seperti teks, imej, muzik, atau video — daripada data latihan.
Contoh: ChatGPT menjana siaran blog atau Midjourney mencipta karya seni digital daripada gesaan teks.

Transformer Pra-latih Generatif (GPT) (Generative Pre-trained Transformer (GPT))

Generative Pre-trained Transformer (GPT)
Kelas model bahasa besar yang dibangunkan oleh OpenAI yang menggunakan arkitektur transformer dan dipra-latih pada sejumlah besar data teks untuk melakukan pelbagai tugas bahasa.
Contoh: GPT-4 mampu menulis esei, menterjemah bahasa, dan meringkas dokumen dengan gesaan minimum.

Algoritma Genetik (Genetic Algorithm)

Genetic Algorithm
Teknik pengoptimuman yang diinspirasikan oleh pemilihan semula jadi di mana penyelesaian berkembang dari semasa ke semasa melalui mutasi, persilangan, dan pemilihan.
Contoh: Digunakan untuk mereka bentuk arkitektur rangkaian saraf yang cekap dengan mensimulasikan kelangsungan hidup yang paling sesuai.

Halusinasi (Hallucination)

Hallucination
Penjanaan kandungan yang kedengaran munasabah tetapi secara fakta salah atau tidak masuk akal oleh model AI.
Contoh: Model bahasa mencipta petikan yang tidak wujud atau memberikan fakta sejarah yang salah.

Heuristik (Heuristic)

Heuristic
Pendekatan praktikal untuk penyelesaian masalah yang tidak menjamin penyelesaian yang sempurna tetapi mencukupi untuk matlamat segera.
Contoh: Menggunakan peraturan ibu jari untuk menganggarkan masa penghantaran dalam sistem AI logistik.

Hiperparameter (Hyperparameter)

Hyperparameter
Nilai konfigurasi yang ditetapkan sebelum melatih model pembelajaran mesin, seperti kadar pembelajaran atau bilangan lapisan.
Contoh: Melaraskan saiz kelompok daripada 32 kepada 128 untuk meningkatkan kelajuan latihan dan prestasi model.

Inferens (Inference)

Inference
Proses menggunakan model pembelajaran mesin yang dilatih untuk membuat ramalan atau menjana output daripada data input baharu.
Contoh: Menggunakan model GPT yang ditala halus untuk membuat draf e-mel untuk pasukan sokongan pelanggan.

Pengesanan Niat (Intent Detection)

Intent Detection
Tugas dalam pemahaman bahasa semula jadi di mana sistem mengenal pasti matlamat atau tujuan pengguna dalam mesej.
Contoh: Dalam chatbot, mengenali 'Saya mahu menempah penerbangan' sebagai niat tempahan perjalanan.

Internet Perkara (IoT) (Internet of Things (IoT))

Internet of Things (IoT)
Rangkaian peranti fizikal yang saling bersambung yang tertanam dengan sensor, perisian, dan teknologi lain untuk mengumpul dan bertukar data.
Contoh: Termostat pintar dan peti sejuk yang melaporkan data penggunaan dan melaraskan tetapan menggunakan analitik AI.

Keboleh tafsiran (Interpretability)

Interpretability
Sejauh mana manusia boleh memahami mekanik dalaman model pembelajaran mesin dan proses membuat keputusannya.
Contoh: Pokok keputusan lebih boleh ditafsirkan daripada rangkaian saraf mendalam kerana keputusannya boleh dikesan.

Jupyter Notebook (Jupyter Notebook)

Jupyter Notebook
Persekitaran pengkomputeran interaktif sumber terbuka yang membolehkan pengguna menulis kod, memvisualisasikan output, dan mendokumentasikan analisis dalam satu antara muka.
Contoh: Saintis data menggunakan Jupyter Notebook untuk prototaip model pembelajaran mesin dan berkongsi hasil.

K-Jiranan Terdekat (KNN) (K-Nearest Neighbours (KNN))

K-Nearest Neighbours (KNN)
Algoritma pembelajaran mesin yang mudah dan tidak parametrik yang digunakan untuk klasifikasi dan regresi. Ia membuat keputusan berdasarkan contoh latihan terdekat dalam ruang ciri.
Contoh: Untuk mengklasifikasikan buah baharu sebagai epal atau pir, KNN menyemak buah berlabel mana yang paling hampir dari segi bentuk dan warna.

Graf Pengetahuan (Knowledge Graph)

Knowledge Graph
Struktur data yang menggunakan nod dan tepi untuk mewakili dan menyimpan penerangan entiti yang saling berkaitan dan hubungannya.
Contoh: Panel pengetahuan Google dikuasakan oleh graf pengetahuan yang menghubungkan entiti seperti orang, tempat, dan peristiwa.

Pengoptimuman Model Pembelajaran Bahasa (LLMO) (Language Learning Model Optimisation (LLMO))

Language Learning Model Optimisation (LLMO)
Teknik yang digunakan untuk meningkatkan prestasi, kecekapan, atau kebolehsuaian model bahasa besar untuk tugas atau domain tertentu.
Contoh: Menggunakan kuantisasi dan penalaan arahan untuk mengoptimumkan LLM untuk kegunaan perusahaan.

Model Bahasa Besar (LLM) (Large Language Model (LLM))

Large Language Model (LLM)
Jenis model pembelajaran mendalam yang dilatih pada sejumlah besar data teks yang mampu menjana, memahami, dan menaakul dengan bahasa manusia.
Contoh: ChatGPT dan Claude ialah LLM yang dilatih untuk membantu dalam penulisan, pengekodan, dan menjawab soalan.

Ruang Tersembunyi (Latent Space)

Latent Space
Representasi abstrak berdimensi tinggi di mana input yang serupa dikumpulkan berdekatan, digunakan dalam model generatif dan penyerapan.
Contoh: Dalam penjanaan imej, memanipulasi ruang tersembunyi boleh mengubah ciri seperti kecerahan atau emosi.

Kadar Pembelajaran (Learning Rate)

Learning Rate
Hiperparameter utama dalam latihan yang mengawal sejauh mana berat model diselaraskan berhubung dengan kecerunan kerugian.
Contoh: Kadar pembelajaran yang tinggi mungkin membawa kepada melepasi minima, manakala kadar yang terlalu rendah melambatkan kemajuan latihan.

Pembelajaran Mesin (ML) (Machine Learning (ML))

Machine Learning (ML)
Cawangan AI yang membolehkan sistem belajar daripada data dan meningkatkan prestasi tanpa diprogramkan secara eksplisit.
Contoh: Penapis spam menggunakan pembelajaran mesin untuk mengklasifikasikan e-mel sebagai spam atau tidak berdasarkan contoh lepas.

Pesongan Model (Model Drift)

Model Drift
Fenomena di mana ketepatan model menurun dari semasa ke semasa disebabkan oleh perubahan dalam data atau persekitaran.
Contoh: Model pengesanan penipuan menjadi kurang tepat apabila taktik penipuan berkembang.

Latihan Model (Model Training)

Model Training
Proses memberi data kepada model pembelajaran mesin dan melaraskan parameternya untuk meminimumkan ralat.
Contoh: Melatih enjin cadangan pada sejarah pembelian pelanggan untuk mencadangkan produk baharu.

AI Multimodal (Multimodal AI)

Multimodal AI
Sistem AI yang mampu memproses dan mengintegrasikan pelbagai jenis data seperti teks, imej, audio, dan video.
Contoh: Model seperti GPT-4 Vision yang boleh membaca teks dan mentafsir imej pada masa yang sama.

Pemprosesan Bahasa Semula Jadi (NLP) (Natural Language Processing (NLP))

Natural Language Processing (NLP)
Subbidang AI yang menumpukan pada interaksi antara komputer dan bahasa manusia (semula jadi). Ia membolehkan mesin membaca, memahami, dan bertindak balas dalam bahasa manusia.
Contoh: NLP digunakan dalam pembantu suara, aplikasi terjemahan bahasa, dan chatbot.

Rangkaian Saraf (Neural Network)

Neural Network
Model pembelajaran mesin yang diinspirasikan oleh struktur otak manusia, terdiri daripada lapisan nod (neuron) yang saling berkaitan.
Contoh: Rangkaian saraf berada di sebalik model pembelajaran mendalam yang digunakan dalam pengecaman imej dan pertuturan.

Bunyi (Noise)

Noise
Maklumat rawak atau tidak relevan dalam data yang boleh mengaburkan corak yang bermakna dan menjejaskan prestasi model secara negatif.
Contoh: Ralat sensor atau kemasukan data yang penuh dengan kesilapan taip boleh dianggap sebagai bunyi.

Ontologi (Ontology)

Ontology
Rangka kerja terstruktur yang mengkategorikan dan mentakrifkan hubungan antara konsep dalam domain, sering digunakan dalam sistem AI semantik.
Contoh: Ontologi dalam penjagaan kesihatan mungkin mentakrifkan bagaimana simptom berkaitan dengan penyakit dan rawatan.

Terlalu Serasi (Overfitting)

Overfitting
Ralat pemodelan di mana model pembelajaran mesin menangkap bunyi dalam data latihan dan berprestasi buruk pada data baharu.
Contoh: Model yang menghafal jawapan latihan tetapi tidak dapat mengendalikan data ujian yang tidak dilihat adalah terlalu serasi.

Analitik Ramalan (Predictive Analytics)

Predictive Analytics
Penggunaan data, algoritma, dan AI untuk mengenal pasti kemungkinan hasil masa depan berdasarkan data sejarah.
Contoh: Peruncit menggunakan analitik ramalan untuk meramalkan permintaan untuk produk tertentu.

Pra-latihan (Pre-training)

Pre-training
Proses melatih model pada mulanya pada set data umum yang besar sebelum menala halusnya untuk tugas tertentu.
Contoh: Model GPT dipra-latih pada korpus besar sebelum disesuaikan untuk chatbot perkhidmatan pelanggan.

Kejuruteraan Prompt (Prompt Engineering)

Prompt Engineering
Seni dan sains mencipta gesaan yang berkesan untuk mengarahkan output model bahasa besar.
Contoh: Menambah arahan sistem seperti 'Balas sebagai tutor yang sopan' ialah contoh kejuruteraan prompt.

Kuantisasi (Quantisation)

Quantisation
Teknik mampatan model yang mengurangkan bilangan bit yang digunakan untuk mewakili berat dan pengaktifan, meningkatkan kecekapan.
Contoh: Mengkuantisasi model daripada 32-bit kepada 8-bit meningkatkan prestasi pada peranti mudah alih.

Pengkomputeran Kuantum (Quantum Computing)

Quantum Computing
Paradigma pengkomputeran baharu berdasarkan mekanik kuantum, yang memegang potensi untuk keupayaan pemprosesan eksponensial.
Contoh: Pengkomputeran kuantum mungkin suatu hari nanti mempercepatkan latihan AI melebihi had klasik.

Enjin Penaakulan (Reasoning Engine)

Reasoning Engine
Sistem dalam AI yang memperoleh kesimpulan logik daripada satu set fakta atau data menggunakan peraturan atau algoritma inferens.
Contoh: Alat diagnosis AI menggunakan enjin penaakulan untuk menyimpulkan kemungkinan keadaan perubatan berdasarkan simptom.

Pembelajaran Pengukuhan (RL) (Reinforcement Learning (RL))

Reinforcement Learning (RL)
Satu bidang pembelajaran mesin di mana ejen belajar dengan berinteraksi dengan persekitaran mereka untuk memaksimumkan ganjaran kumulatif.
Contoh: Robot belajar berjalan melalui percubaan dan kesilapan menggunakan teknik RL.

Pembelajaran Pengukuhan dengan Maklum Balas Manusia (RLHF) (Reinforcement Learning with Human Feedback (RLHF))

Reinforcement Learning with Human Feedback (RLHF)
Kaedah pembelajaran di mana keutamaan manusia membimbing isyarat ganjaran AI, sering digunakan dalam menala halus model bahasa.
Contoh: ChatGPT dilatih dengan RLHF untuk menghasilkan respons yang lebih membantu dan selamat.

Penjanaan Diperkaya Pengambilan (RAG) (Retrieval-Augmented Generation (RAG))

Retrieval-Augmented Generation (RAG)
Kaedah yang menggabungkan pengambilan maklumat dengan penjanaan, di mana LLM mengambil dokumen yang berkaitan untuk meningkatkan responsnya.
Contoh: Pembantu AI mengambil dan memetik spesifikasi produk sambil menjana jawapan kepada soalan teknikal.

Pembelajaran Kendiri (Self-Supervised Learning)

Self-Supervised Learning
Pendekatan latihan di mana model belajar corak dengan menjana labelnya sendiri daripada data mentah, mengurangkan kebergantungan pada data yang dianotasi manusia.
Contoh: BERT dilatih dengan pembelajaran kendiri dengan meramalkan perkataan yang hilang dalam teks.

Carian Semantik (Semantic Search)

Semantic Search
Teknik carian yang memahami niat pengguna dan makna kontekstual, bukan hanya padanan kata kunci.
Contoh: Mencari 'cara membaiki paip bocor' mengembalikan panduan walaupun istilah 'paip bocor' tidak terdapat dalam dokumen.

Analisis Sentimen (Sentiment Analysis)

Sentiment Analysis
Proses mengenal pasti emosi, pendapat, atau sikap dalam teks, selalunya mengklasifikasikannya sebagai positif, negatif, atau neutral.
Contoh: Menganalisis tweet untuk mengukur reaksi awam terhadap produk baharu.

Stokastik (Stochastic)

Stochastic
Melibatkan keacakan atau tingkah laku probabilistik, sering digunakan dalam AI generatif dan algoritma pengoptimuman.
Contoh: Output GPT-4 berbeza untuk input yang sama kerana proses penyahkodan stokastiknya.

AI Kuat (Strong AI)

Strong AI
Juga dikenali sebagai Kecerdasan Umum Buatan (AGI), merujuk kepada mesin dengan keupayaan kognitif tahap manusia di semua domain.
Contoh: AI masa depan yang boleh secara autonomi menulis novel, merancang bandar, dan menyelesaikan dilema etika dengan baik.

Kecerdasan Buatan Super (SAI) (Super Artificial Intelligence (SAI))

Super Artificial Intelligence (SAI)
AI teoretikal yang jauh melebihi kecerdasan manusia dalam semua aspek—penaakulan, kreativiti, kecerdasan emosi, dll.
Contoh: SAI secara teori boleh membangunkan sains dan falsafah baharu secara bebas.

Pembelajaran Terawasi (Supervised Learning)

Supervised Learning
Teknik pembelajaran mesin di mana model dilatih pada data berlabel untuk mempelajari pemetaan input-output.
Contoh: Mengajar model untuk mengklasifikasikan e-mel sebagai spam atau tidak menggunakan contoh sejarah.

Data Sintetik (Synthetic Data)

Synthetic Data
Data yang dijana secara buatan yang mensimulasikan data dunia sebenar, sering digunakan untuk latihan apabila data sebenar jarang atau sensitif.
Contoh: Mencipta imej perubatan sintetik untuk melatih model diagnostik tanpa melanggar privasi pesakit.

Token (Token)

Token
Unit teks yang diproses oleh LLM—biasanya perkataan atau bahagian perkataan.
Contoh: Ayat 'Hello world!' dipecahkan kepada 3 token: 'Hello', 'world', dan '!'.

Tokenisasi (Tokenisation)

Tokenisation
Proses memecahkan teks kepada token untuk diproses oleh model.
Contoh: Dalam NLP, 'ChatGPT is great' menjadi ['Chat', 'G', 'PT', 'is', 'great'].

Pembelajaran Pemindahan (Transfer Learning)

Transfer Learning
Menggunakan pengetahuan daripada satu tugas untuk meningkatkan pembelajaran pada tugas berkaitan lain, mengurangkan masa latihan dan keperluan data.
Contoh: Menala halus model yang dilatih pada teks Inggeris untuk melakukan analisis sentimen dalam bahasa lain.

Transformer (Transformer)

Transformer
Arkitektur rangkaian saraf yang menggunakan mekanisme perhatian untuk memodelkan data berurutan, digunakan secara meluas dalam LLM.
Contoh: BERT, GPT, dan T5 semuanya ialah model berasaskan transformer.

Kurang Serasi (Underfitting)

Underfitting
Apabila model terlalu ringkas untuk menangkap corak dalam data latihan, mengakibatkan prestasi yang buruk.
Contoh: Model linear yang cuba meramalkan klasifikasi imej yang kompleks mungkin kurang serasi.

Pembelajaran Tanpa Pengawasan (Unsupervised Learning)

Unsupervised Learning
Pendekatan pembelajaran di mana model mengenal pasti corak atau kelompok dalam data tanpa label.
Contoh: Mengelompokkan pelanggan berdasarkan tingkah laku pembelian tanpa label yang telah ditetapkan.

Niat Pengguna (User Intent)

User Intent
Matlamat atau tujuan di sebalik pertanyaan atau interaksi pengguna.
Contoh: Pengguna menaip 'cara membakar kek' mungkin berniat untuk mencari resipi.

Set Pengesahan (Validation Set)

Validation Set
Bahagian data yang digunakan untuk menilai prestasi model semasa latihan dan menala hiperparameter.
Contoh: Digunakan untuk mengesan terlalu serasi sebelum ujian akhir.

Pangkalan Data Vektor (Vector Database)

Vector Database
Pangkalan data yang direka untuk menyimpan dan mencari penyerapan vektor yang digunakan dalam tugas AI seperti carian kesamaan dan RAG.
Contoh: Pinecone dan Weaviate ialah pangkalan data vektor untuk menyimpan penyerapan teks atau imej.

Penyerapan Vektor (Vector Embedding)

Vector Embedding
Representasi numerik data yang mengekalkan makna semantik dan hubungan dalam ruang vektor.
Contoh: Perkataan 'king' dan 'queen' mempunyai penyerapan yang serupa dengan perbezaan jantina yang halus.

Pembantu Maya (Virtual Assistant)

Virtual Assistant
Ejen perisian berkuasa AI yang membantu pengguna menyelesaikan tugas melalui perbualan atau arahan suara.
Contoh: Siri, Alexa, dan Google Assistant ialah pembantu maya yang popular.

Pengecaman Suara (Voice Recognition)

Voice Recognition
Teknologi yang mentafsir dan menukar bahasa pertuturan kepada teks atau tindakan.
Contoh: Perintah suara dan menaip suara bergantung pada sistem pengecaman suara.

AI Lemah (Weak AI)

Weak AI
Sistem AI yang direka untuk melakukan tugas tertentu yang sempit tanpa kecerdasan umum.
Contoh: AI bermain catur yang tidak dapat memahami bahasa atau memandu kereta ialah contoh AI lemah.

Pengikisan Web (Web Scraping)

Web Scraping
Pengekstrakan maklumat secara automatik daripada laman web, sering digunakan untuk mengumpul data latihan atau memantau kandungan.
Contoh: Mengikis penyenaraian hartanah untuk melatih model penilaian hartanah.

Berat (Weight)

Weight
Parameter dalam rangkaian saraf yang menentukan kekuatan pengaruh satu nod ke atas nod lain.
Contoh: Berat diselaraskan semasa latihan untuk meminimumkan ralat model.

Bisikan (Whisper)

Whisper
Model pertuturan kepada teks yang dibangunkan oleh OpenAI yang mampu mentranskrip audio dalam pelbagai bahasa.
Contoh: Bisikan boleh mentranskrip kuliah dan podcast dengan ketepatan tinggi.

YAML (YAML)

YAML
Format yang boleh dibaca manusia untuk serialisasi data, biasa digunakan untuk fail konfigurasi dalam aliran kerja pembelajaran mesin.
Contoh: Menentukan parameter model dalam fail YAML untuk latihan dalam PyTorch.

Pembelajaran Sifar Contoh (Zero-shot Learning)

Zero-shot Learning
Keupayaan model untuk melakukan tugas yang tidak pernah dilatih secara eksplisit dengan memanfaatkan pengetahuan umum.
Contoh: Model menjawab soalan undang-undang walaupun tidak dilatih secara khusus pada data undang-undang.

Zettabyte (Zettabyte)

Zettabyte
Unit data digital yang bersamaan dengan satu sextillion (10^21) bait, sering digunakan untuk menerangkan skala data internet.
Contoh: Trafik internet global melebihi 1 zettabyte setahun menjelang 2016.