AI Jargon Buster

Giải mã thuật ngữ trí tuệ nhân tạo với bảng thuật ngữ toàn diện của chúng tôi. Từ học máy đến mạng nơ-ron, chúng tôi giải thích các khái niệm AI phức tạp bằng những thuật ngữ đơn giản.

Căn chỉnh (Alignment)

Alignment
Quá trình đảm bảo rằng các mục tiêu, đầu ra và hành vi của hệ thống AI phù hợp với các mục tiêu và giá trị của con người. Điều này đặc biệt quan trọng đối với các hệ thống tiên tiến có thể phát triển các hành vi không được dự định rõ ràng.
Ví dụ: Đảm bảo chatbot hỗ trợ sức khỏe tâm thần không bao giờ đề xuất các hành động có hại bất kể lời nhắc.

Giao diện Lập trình Ứng dụng (API) (Application Programming Interface (API))

Application Programming Interface (API)
Một tập hợp các quy tắc và giao thức được xác định cho phép các hệ thống phần mềm khác nhau giao tiếp và trao đổi dữ liệu.
Ví dụ: Sử dụng API của OpenAI để gửi một lời nhắc và nhận phản hồi được tạo bởi mô hình ngôn ngữ trong ứng dụng web của bạn.

Trí tuệ Nhân tạo Tổng quát (AGI) (Artificial General Intelligence (AGI))

Artificial General Intelligence (AGI)
Một dạng AI lý thuyết có thể thực hiện bất kỳ nhiệm vụ trí tuệ nào mà con người có thể làm. Nó tổng quát hóa việc học trên nhiều lĩnh vực.
Ví dụ: Một hệ thống AGI có thể học sáng tác nhạc, thực hiện phẫu thuật và vượt qua kỳ thi triết học mà không cần lập trình chuyên biệt cho từng nhiệm vụ.

Trí tuệ Nhân tạo (AI) (Artificial Intelligence (AI))

Artificial Intelligence (AI)
Sự mô phỏng trí tuệ con người trong các máy móc được lập trình để suy nghĩ, lý luận và hành động một cách tự chủ.
Ví dụ: AI cung cấp năng lượng cho các trợ lý cá nhân như Siri và các hệ thống lái xe tự động như Tesla Autopilot.

Đạo đức AI (AI Ethics)

AI Ethics
Một lĩnh vực liên quan đến các hàm ý đạo đức của việc phát triển và sử dụng AI, bao gồm sự công bằng, quyền riêng tư, trách nhiệm giải trình và không phân biệt đối xử.
Ví dụ: Tạo ra các hướng dẫn để ngăn chặn các thuật toán tuyển dụng phân biệt đối xử dựa trên giới tính hoặc sắc tộc.

Trí tuệ Tăng cường (Augmented Intelligence)

Augmented Intelligence
Một mô hình hợp tác nơi AI bổ sung và nâng cao trí tuệ con người thay vì thay thế nó.
Ví dụ: Các công cụ X quang được hỗ trợ bởi AI làm nổi bật các bất thường cho bác sĩ, người đưa ra chẩn đoán cuối cùng.

Tác nhân Tự hành (Autonomous Agent)

Autonomous Agent
Một hệ thống AI có khả năng đưa ra quyết định và hành động để đạt được mục tiêu của mình mà không cần sự can thiệp của con người.
Ví dụ: Một robot giao hàng tự lái điều hướng đường phố và tránh chướng ngại vật một cách độc lập.

Lan truyền ngược (Backpropagation)

Backpropagation
Một kỹ thuật để huấn luyện mạng nơ-ron bằng cách cập nhật trọng số theo chiều ngược lại từ lớp đầu ra đến lớp đầu vào, giảm thiểu lỗi dự đoán.
Ví dụ: Được sử dụng trong việc huấn luyện các bộ phân loại hình ảnh để giảm tỷ lệ lỗi trong việc nhận dạng chữ số viết tay.

Thiên vị (Thiên vị Thuật toán) (Bias (Algorithmic Bias))

Bias (Algorithmic Bias)
Sự ưu ái không mong muốn và có hệ thống trong kết quả AI do dữ liệu huấn luyện mất cân bằng hoặc không đại diện.
Ví dụ: Một hệ thống nhận dạng khuôn mặt nhận dạng sai người da màu thường xuyên hơn do thiếu đại diện trong dữ liệu huấn luyện.

Dữ liệu Lớn (Big Data)

Big Data
Các tập dữ liệu cực kỳ lớn đòi hỏi các công cụ đặc biệt để lưu trữ, phân tích và trích xuất giá trị, thường được sử dụng để huấn luyện các mô hình AI.
Ví dụ: Sử dụng hàng triệu tương tác của người dùng để huấn luyện các công cụ đề xuất cho các nền tảng thương mại điện tử.

Mô hình Hộp Đen (Black Box Model)

Black Box Model
Một loại mô hình AI hoặc học máy mà logic nội bộ của nó không dễ dàng diễn giải bởi con người, khiến việc hiểu cách đưa ra quyết định trở nên khó khăn.
Ví dụ: Một mạng nơ-ron sâu được sử dụng để phê duyệt khoản vay nhưng không đưa ra lời giải thích rõ ràng về lý do tại sao một người nộp đơn được chấp nhận và người khác bị từ chối.

Điện toán Nhận thức (Cognitive Computing)

Cognitive Computing
Các hệ thống AI được thiết kế để mô phỏng các quy trình tư duy của con người, chẳng hạn như lý luận và học tập, sử dụng các kỹ thuật như NLP và nhận dạng mẫu.
Ví dụ: Một hệ thống điện toán nhận thức giúp các chuyên gia pháp lý phân tích luật án lệ và dự đoán kết quả.

Thị giác Máy tính (Computer Vision)

Computer Vision
Một lĩnh vực của trí tuệ nhân tạo cho phép máy tính diễn giải và xử lý dữ liệu hình ảnh như hình ảnh và video.
Ví dụ: Các hệ thống nhận dạng khuôn mặt nhận dạng người trong cảnh quay an ninh bằng thị giác máy tính.

Tập dữ liệu (Corpus)

Corpus
Một bộ sưu tập lớn các văn bản viết hoặc nói được sử dụng để huấn luyện các mô hình ngôn ngữ.
Ví dụ: Tập dữ liệu Common Crawl là một tập dữ liệu web công khai được sử dụng để huấn luyện các mô hình ngôn ngữ lớn như GPT.

Trôi dạt Dữ liệu (Data Drift)

Data Drift
Hiện tượng mà dữ liệu đầu vào thay đổi theo thời gian, gây ra sự suy giảm hiệu suất của mô hình.
Ví dụ: Một mô hình bảo trì dự đoán cho thiết bị công nghiệp trở nên kém chính xác hơn khi công nghệ cảm biến mới được giới thiệu.

Gán nhãn Dữ liệu (Data Labelling)

Data Labelling
Quá trình chú thích dữ liệu bằng các thẻ hoặc nhãn để làm cho nó phù hợp với học có giám sát.
Ví dụ: Gán nhãn hàng nghìn hình ảnh khối u là lành tính hoặc ác tính để huấn luyện mô hình phát hiện ung thư.

Khai phá Dữ liệu (Data Mining)

Data Mining
Quá trình khám phá các mẫu, mối tương quan và bất thường có ý nghĩa trong các tập dữ liệu lớn.
Ví dụ: Các nhà bán lẻ sử dụng khai phá dữ liệu để xác định rằng những người mua tã thường cũng mua bia.

Học Sâu (Deep Learning)

Deep Learning
Một lĩnh vực con của học máy sử dụng mạng nơ-ron nhiều lớp để mô hình hóa các mẫu phức tạp trong dữ liệu.
Ví dụ: Học sâu được sử dụng trong các mô hình ngôn ngữ như GPT-4 và các mô hình tạo hình ảnh như Stable Diffusion.

Mô hình Khuếch tán (Diffusion Models)

Diffusion Models
Một lớp các mô hình sinh tạo học cách tạo ra dữ liệu bằng cách dần dần biến đổi nhiễu ngẫu nhiên thành các đầu ra có cấu trúc.
Ví dụ: Stable Diffusion tạo ra hình ảnh chân thực từ các lời nhắc văn bản bằng kỹ thuật khuếch tán.

Nhúng (Embedding)

Embedding
Một biểu diễn vector số của dữ liệu, thường được sử dụng để nắm bắt ý nghĩa ngữ nghĩa của từ, hình ảnh hoặc câu.
Ví dụ: Trong NLP, từ 'bank' có thể có các nhúng tương tự như 'money' nhưng khác với 'riverbank' tùy thuộc vào ngữ cảnh.

Epoch (Epoch)

Epoch
Một lần lặp hoàn chỉnh trên toàn bộ tập dữ liệu huấn luyện trong quá trình huấn luyện của mô hình học máy.
Ví dụ: Nếu một tập dữ liệu có 1.000 ví dụ và một mô hình nhìn thấy tất cả chúng một lần trong quá trình huấn luyện, đó là một epoch.

AI Đạo đức (Ethical AI)

Ethical AI
Một triết lý thiết kế và triển khai đảm bảo rằng các công nghệ AI hoạt động minh bạch, công bằng và phù hợp với các giá trị xã hội.
Ví dụ: Một công cụ tuyển dụng AI bao gồm các kiểm tra thiên vị để ngăn chặn sự phân biệt đối xử với các ứng viên thiểu số.

Hệ Chuyên gia (Expert System)

Expert System
Một hệ thống AI bắt chước khả năng ra quyết định của một chuyên gia con người trong một lĩnh vực cụ thể bằng cách sử dụng các quy tắc và logic.
Ví dụ: Một hệ thống chuyên gia được sử dụng trong nông nghiệp để đề xuất các phương pháp xử lý cây trồng dựa trên dữ liệu đất và lịch sử sâu bệnh.

AI Giải thích được (XAI) (Explainable AI (XAI))

Explainable AI (XAI)
Các hệ thống AI được thiết kế để làm cho các quy trình và quyết định nội bộ của chúng có thể hiểu được đối với con người, tăng cường sự tin cậy và trách nhiệm giải trình.
Ví dụ: Một AI chẩn đoán y tế không chỉ đưa ra khuyến nghị mà còn giải thích các triệu chứng nào đã dẫn đến kết luận đó.

Học Ít Mẫu (Few-shot Learning)

Few-shot Learning
Một phương pháp học máy mà mô hình được huấn luyện hoặc tinh chỉnh chỉ với một số lượng nhỏ các ví dụ được gán nhãn.
Ví dụ: Tùy chỉnh một LLM để viết email pháp lý sau khi cho nó xem chỉ 10 ví dụ.

Tinh chỉnh (Fine-tuning)

Fine-tuning
Quá trình lấy một mô hình đã được huấn luyện trước và tiếp tục huấn luyện nó trên một tập dữ liệu mới, nhỏ hơn để chuyên biệt hóa nó cho một nhiệm vụ cụ thể.
Ví dụ: Tinh chỉnh một LLM chung như GPT trên các tài liệu nội bộ để tạo ra một trợ lý soạn thảo pháp lý.

Mô hình Nền tảng (Foundation Model)

Foundation Model
Một mô hình quy mô lớn được huấn luyện trên dữ liệu đa dạng và rộng lớn có thể được điều chỉnh cho nhiều nhiệm vụ hạ nguồn.
Ví dụ: GPT-4 và PaLM 2 là các mô hình nền tảng có khả năng tóm tắt, hỏi đáp, dịch thuật và nhiều hơn nữa.

Logic Mờ (Fuzzy Logic)

Fuzzy Logic
Một dạng logic xử lý các giá trị gần đúng thay vì logic nhị phân đúng/sai cố định, hữu ích cho việc suy luận trong điều kiện không chắc chắn.
Ví dụ: Được sử dụng trong các hệ thống điều khiển khí hậu để điều chỉnh nhiệt độ dựa trên các đầu vào mờ như 'hơi nóng' hoặc 'rất lạnh'.

Mạng Đối nghịch Sinh tạo (GAN) (Generative Adversarial Network (GAN))

Generative Adversarial Network (GAN)
Một kiến trúc mô hình sinh tạo nơi hai mạng - một bộ tạo và một bộ phân biệt - cạnh tranh để cải thiện chất lượng đầu ra.
Ví dụ: GAN được sử dụng để tạo video deepfake hoặc tạo ảnh sản phẩm chân thực từ bản phác thảo.

AI Sinh tạo (Generative AI)

Generative AI
Một loại trí tuệ nhân tạo có thể tạo ra nội dung mới - chẳng hạn như văn bản, hình ảnh, âm nhạc hoặc video - từ dữ liệu huấn luyện.
Ví dụ: ChatGPT tạo các bài đăng blog hoặc Midjourney tạo tác phẩm nghệ thuật kỹ thuật số từ các lời nhắc văn bản.

Mô hình Máy biến áp Được Huấn luyện Trước (GPT) (Generative Pre-trained Transformer (GPT))

Generative Pre-trained Transformer (GPT)
Một lớp các mô hình ngôn ngữ lớn được OpenAI phát triển, sử dụng kiến trúc máy biến áp và được huấn luyện trước trên một lượng lớn dữ liệu văn bản để thực hiện nhiều nhiệm vụ ngôn ngữ.
Ví dụ: GPT-4 có khả năng viết bài luận, dịch ngôn ngữ và tóm tắt tài liệu với lời nhắc tối thiểu.

Thuật toán Di truyền (Genetic Algorithm)

Genetic Algorithm
Một kỹ thuật tối ưu hóa lấy cảm hứng từ chọn lọc tự nhiên, nơi các giải pháp tiến hóa theo thời gian thông qua đột biến, lai ghép và chọn lọc.
Ví dụ: Được sử dụng để thiết kế các kiến trúc mạng nơ-ron hiệu quả bằng cách mô phỏng sự sống sót của những người phù hợp nhất.

Ảo giác (Hallucination)

Hallucination
Việc tạo ra nội dung nghe có vẻ hợp lý nhưng sai sự thật hoặc vô nghĩa bởi một mô hình AI.
Ví dụ: Một mô hình ngôn ngữ bịa đặt một trích dẫn không tồn tại hoặc cung cấp các sự kiện lịch sử sai sự thật.

Heuristic (Heuristic)

Heuristic
Một phương pháp thực tế để giải quyết vấn đề không đảm bảo một giải pháp hoàn hảo nhưng đủ cho các mục tiêu trước mắt.
Ví dụ: Sử dụng quy tắc kinh nghiệm để ước tính thời gian giao hàng trong một hệ thống AI logistics.

Siêu tham số (Hyperparameter)

Hyperparameter
Một giá trị cấu hình được đặt trước khi huấn luyện mô hình học máy, chẳng hạn như tốc độ học hoặc số lượng lớp.
Ví dụ: Điều chỉnh kích thước lô từ 32 lên 128 để cải thiện tốc độ huấn luyện và hiệu suất mô hình.

Suy luận (Inference)

Inference
Quá trình sử dụng một mô hình học máy đã được huấn luyện để đưa ra dự đoán hoặc tạo ra đầu ra từ dữ liệu đầu vào mới.
Ví dụ: Sử dụng mô hình GPT đã được tinh chỉnh để soạn thảo email cho đội ngũ hỗ trợ khách hàng.

Phát hiện Ý định (Intent Detection)

Intent Detection
Một nhiệm vụ trong hiểu ngôn ngữ tự nhiên, nơi hệ thống xác định mục tiêu hoặc mục đích của người dùng trong một tin nhắn.
Ví dụ: Trong một chatbot, nhận dạng 'Tôi muốn đặt vé máy bay' như một ý định đặt vé du lịch.

Internet Vạn vật (IoT) (Internet of Things (IoT))

Internet of Things (IoT)
Một mạng lưới các thiết bị vật lý được kết nối với nhau, được nhúng cảm biến, phần mềm và các công nghệ khác để thu thập và trao đổi dữ liệu.
Ví dụ: Các bộ điều nhiệt và tủ lạnh thông minh báo cáo dữ liệu sử dụng và điều chỉnh cài đặt bằng phân tích AI.

Khả năng Diễn giải (Interpretability)

Interpretability
Mức độ mà con người có thể hiểu được cơ chế nội bộ của mô hình học máy và quy trình ra quyết định của nó.
Ví dụ: Cây quyết định có khả năng diễn giải hơn mạng nơ-ron sâu vì các quyết định của nó có thể truy xuất được.

Sổ tay Jupyter (Jupyter Notebook)

Jupyter Notebook
Một môi trường tính toán tương tác mã nguồn mở cho phép người dùng viết mã, trực quan hóa đầu ra và tài liệu hóa phân tích trong một giao diện duy nhất.
Ví dụ: Các nhà khoa học dữ liệu sử dụng Sổ tay Jupyter để tạo mẫu các mô hình học máy và chia sẻ kết quả.

K-Láng giềng Gần nhất (KNN) (K-Nearest Neighbours (KNN))

K-Nearest Neighbours (KNN)
Một thuật toán học máy đơn giản, phi tham số được sử dụng để phân loại và hồi quy. Nó đưa ra quyết định dựa trên các ví dụ huấn luyện gần nhất trong không gian đặc trưng.
Ví dụ: Để phân loại một loại trái cây mới là táo hay lê, KNN kiểm tra xem loại trái cây được gán nhãn nào gần nhất về hình dạng và màu sắc.

Đồ thị Tri thức (Knowledge Graph)

Knowledge Graph
Một cấu trúc dữ liệu sử dụng các nút và cạnh để biểu diễn và lưu trữ các mô tả liên kết của các thực thể và mối quan hệ của chúng.
Ví dụ: Bảng kiến thức của Google được cung cấp năng lượng bởi một đồ thị tri thức kết nối các thực thể như con người, địa điểm và sự kiện.

Tối ưu hóa Mô hình Học Ngôn ngữ (LLMO) (Language Learning Model Optimisation (LLMO))

Language Learning Model Optimisation (LLMO)
Các kỹ thuật được sử dụng để cải thiện hiệu suất, hiệu quả hoặc khả năng thích ứng của các mô hình ngôn ngữ lớn cho các nhiệm vụ hoặc lĩnh vực cụ thể.
Ví dụ: Sử dụng lượng tử hóa và tinh chỉnh hướng dẫn để tối ưu hóa LLM cho việc sử dụng trong doanh nghiệp.

Mô hình Ngôn ngữ Lớn (LLM) (Large Language Model (LLM))

Large Language Model (LLM)
Một loại mô hình học sâu được huấn luyện trên một lượng lớn dữ liệu văn bản có khả năng tạo, hiểu và suy luận bằng ngôn ngữ con người.
Ví dụ: ChatGPT và Claude là các LLM được huấn luyện để hỗ trợ viết, lập trình và trả lời câu hỏi.

Không gian Ẩn (Latent Space)

Latent Space
Một biểu diễn trừu tượng nhiều chiều nơi các đầu vào tương tự được nhóm gần nhau, được sử dụng trong các mô hình sinh tạo và nhúng.
Ví dụ: Trong tạo hình ảnh, việc thao tác không gian ẩn có thể thay đổi các tính năng như độ sáng hoặc cảm xúc.

Tốc độ Học (Learning Rate)

Learning Rate
Một siêu tham số chính trong huấn luyện kiểm soát mức độ điều chỉnh trọng số mô hình so với gradient mất mát.
Ví dụ: Tốc độ học cao có thể dẫn đến việc vượt qua các điểm cực tiểu, trong khi tốc độ quá thấp làm chậm tiến trình huấn luyện.

Học Máy (ML) (Machine Learning (ML))

Machine Learning (ML)
Một nhánh của AI cho phép các hệ thống học từ dữ liệu và cải thiện hiệu suất mà không cần được lập trình rõ ràng.
Ví dụ: Bộ lọc thư rác sử dụng học máy để phân loại email là thư rác hay không dựa trên các ví dụ trong quá khứ.

Trôi dạt Mô hình (Model Drift)

Model Drift
Một hiện tượng mà độ chính xác của mô hình giảm dần theo thời gian do những thay đổi trong dữ liệu hoặc môi trường.
Ví dụ: Một mô hình phát hiện gian lận trở nên kém chính xác hơn khi các chiến thuật gian lận phát triển.

Huấn luyện Mô hình (Model Training)

Model Training
Quá trình cung cấp dữ liệu cho mô hình học máy và điều chỉnh các tham số của nó để giảm thiểu lỗi.
Ví dụ: Huấn luyện một công cụ đề xuất dựa trên lịch sử mua hàng của khách hàng để đề xuất các sản phẩm mới.

AI Đa phương thức (Multimodal AI)

Multimodal AI
Các hệ thống AI có khả năng xử lý và tích hợp nhiều loại dữ liệu như văn bản, hình ảnh, âm thanh và video.
Ví dụ: Một mô hình như GPT-4 Vision có thể đọc văn bản và diễn giải hình ảnh cùng một lúc.

Xử lý Ngôn ngữ Tự nhiên (NLP) (Natural Language Processing (NLP))

Natural Language Processing (NLP)
Một lĩnh vực con của AI tập trung vào sự tương tác giữa máy tính và ngôn ngữ tự nhiên của con người. Nó cho phép máy móc đọc, hiểu và phản hồi bằng ngôn ngữ con người.
Ví dụ: NLP được sử dụng trong các trợ lý giọng nói, ứng dụng dịch ngôn ngữ và chatbot.

Mạng Nơ-ron (Neural Network)

Neural Network
Một mô hình học máy lấy cảm hứng từ cấu trúc của bộ não con người, bao gồm các lớp các nút (nơ-ron) được kết nối với nhau.
Ví dụ: Mạng nơ-ron là nền tảng của các mô hình học sâu được sử dụng trong nhận dạng hình ảnh và giọng nói.

Nhiá»…u (Noise)

Noise
Thông tin ngẫu nhiên hoặc không liên quan trong dữ liệu có thể làm lu mờ các mẫu có ý nghĩa và ảnh hưởng tiêu cực đến hiệu suất mô hình.
Ví dụ: Lỗi cảm biến hoặc dữ liệu nhập có lỗi chính tả có thể được coi là nhiễu.

Bản thể học (Ontology)

Ontology
Một khuôn khổ có cấu trúc phân loại và xác định mối quan hệ giữa các khái niệm trong một lĩnh vực, thường được sử dụng trong các hệ thống AI ngữ nghĩa.
Ví dụ: Một bản thể học trong chăm sóc sức khỏe có thể xác định cách các triệu chứng liên quan đến bệnh tật và điều trị.

Học quá khớp (Overfitting)

Overfitting
Một lỗi mô hình hóa trong đó mô hình học máy nắm bắt nhiễu trong dữ liệu huấn luyện và hoạt động kém trên dữ liệu mới.
Ví dụ: Một mô hình ghi nhớ các câu trả lời huấn luyện nhưng không thể xử lý dữ liệu chưa thấy là bị quá khớp.

Phân tích Dự đoán (Predictive Analytics)

Predictive Analytics
Việc sử dụng dữ liệu, thuật toán và AI để xác định khả năng xảy ra các kết quả trong tương lai dựa trên dữ liệu lịch sử.
Ví dụ: Các nhà bán lẻ sử dụng phân tích dự đoán để dự báo nhu cầu cho các sản phẩm nhất định.

Huấn luyện Trước (Pre-training)

Pre-training
Quá trình huấn luyện ban đầu một mô hình trên một tập dữ liệu lớn, chung trước khi tinh chỉnh nó cho các nhiệm vụ cụ thể.
Ví dụ: Các mô hình GPT được huấn luyện trước trên các tập dữ liệu lớn trước khi được tùy chỉnh cho các chatbot dịch vụ khách hàng.

Kỹ thuật Prompt (Prompt Engineering)

Prompt Engineering
Nghệ thuật và khoa học tạo ra các lời nhắc hiệu quả để điều hướng đầu ra của các mô hình ngôn ngữ lớn.
Ví dụ: Thêm các hướng dẫn hệ thống như 'Trả lời với tư cách là một gia sư lịch sự' là một ví dụ về kỹ thuật prompt.

Lượng tử hóa (Quantisation)

Quantisation
Một kỹ thuật nén mô hình giảm số lượng bit được sử dụng để biểu diễn trọng số và kích hoạt, tăng cường hiệu quả.
Ví dụ: Lượng tử hóa một mô hình từ 32-bit lên 8-bit cải thiện hiệu suất trên thiết bị di động.

Điện toán Lượng tử (Quantum Computing)

Quantum Computing
Một mô hình tính toán mới dựa trên cơ học lượng tử, có tiềm năng cho khả năng xử lý theo cấp số nhân.
Ví dụ: Điện toán lượng tử có thể một ngày nào đó tăng tốc độ huấn luyện AI vượt quá giới hạn cổ điển.

Công cụ Suy luận (Reasoning Engine)

Reasoning Engine
Một hệ thống trong AI suy ra các kết luận logic từ một tập hợp các sự kiện hoặc dữ liệu bằng cách sử dụng các quy tắc hoặc thuật toán suy luận.
Ví dụ: Một công cụ chẩn đoán AI sử dụng một công cụ suy luận để suy ra các tình trạng y tế có thể xảy ra dựa trên các triệu chứng.

Học Tăng cường (RL) (Reinforcement Learning (RL))

Reinforcement Learning (RL)
Một lĩnh vực học máy nơi các tác nhân học bằng cách tương tác với môi trường của chúng để tối đa hóa phần thưởng tích lũy.
Ví dụ: Một robot học cách đi bằng cách thử và sai sử dụng các kỹ thuật RL.

Học Tăng cường với Phản hồi của Con người (RLHF) (Reinforcement Learning with Human Feedback (RLHF))

Reinforcement Learning with Human Feedback (RLHF)
Một phương pháp học tập mà sở thích của con người hướng dẫn tín hiệu phần thưởng của AI, thường được sử dụng để tinh chỉnh các mô hình ngôn ngữ.
Ví dụ: ChatGPT đã được huấn luyện với RLHF để tạo ra các phản hồi hữu ích và an toàn hơn.

Sinh tạo Tăng cường Truy xuất (RAG) (Retrieval-Augmented Generation (RAG))

Retrieval-Augmented Generation (RAG)
Một phương pháp kết hợp truy xuất thông tin với sinh tạo, trong đó LLM truy xuất các tài liệu liên quan để cải thiện phản hồi của nó.
Ví dụ: Một trợ lý AI truy xuất và trích dẫn thông số kỹ thuật sản phẩm trong khi tạo câu trả lời cho một câu hỏi kỹ thuật.

Học Tự giám sát (Self-Supervised Learning)

Self-Supervised Learning
Một phương pháp huấn luyện mà mô hình học các mẫu bằng cách tạo nhãn của riêng nó từ dữ liệu thô, giảm sự phụ thuộc vào dữ liệu được chú thích bởi con người.
Ví dụ: BERT được huấn luyện với học tự giám sát bằng cách dự đoán các từ bị thiếu trong văn bản.

Tìm kiếm Ngữ nghĩa (Semantic Search)

Semantic Search
Một kỹ thuật tìm kiếm hiểu ý định của người dùng và ý nghĩa ngữ cảnh, không chỉ khớp từ khóa.
Ví dụ: Tìm kiếm 'cách sửa vòi bị rò rỉ' trả về các hướng dẫn ngay cả khi thuật ngữ 'vòi bị rò rỉ' không có trong tài liệu.

Phân tích Cảm xúc (Sentiment Analysis)

Sentiment Analysis
Quá trình xác định cảm xúc, ý kiến hoặc thái độ trong văn bản, thường phân loại là tích cực, tiêu cực hoặc trung tính.
Ví dụ: Phân tích các tweet để đánh giá phản ứng của công chúng đối với một sản phẩm mới.

Ngẫu nhiên (Stochastic)

Stochastic
Liên quan đến hành vi ngẫu nhiên hoặc xác suất, thường được sử dụng trong AI sinh tạo và thuật toán tối ưu hóa.
Ví dụ: Đầu ra của GPT-4 thay đổi cho cùng một đầu vào do quá trình giải mã ngẫu nhiên của nó.

AI Mạnh (Strong AI)

Strong AI
Còn được gọi là Trí tuệ Nhân tạo Tổng quát (AGI), đề cập đến các máy móc có khả năng nhận thức ở cấp độ con người trên tất cả các lĩnh vực.
Ví dụ: Một AI trong tương lai có thể tự động viết tiểu thuyết, lập kế hoạch thành phố và giải quyết các tình huống khó xử về đạo đức một cách ngang nhau.

Siêu Trí tuệ Nhân tạo (SAI) (Super Artificial Intelligence (SAI))

Super Artificial Intelligence (SAI)
Một AI lý thuyết vượt xa trí tuệ con người ở mọi khía cạnh - lý luận, sáng tạo, trí tuệ cảm xúc, v.v.
Ví dụ: Một SAI về lý thuyết có thể phát triển các khoa học và triết học mới một cách độc lập.

Học có Giám sát (Supervised Learning)

Supervised Learning
Một kỹ thuật học máy mà mô hình được huấn luyện trên dữ liệu được gán nhãn để học các ánh xạ đầu vào-đầu ra.
Ví dụ: Dạy một mô hình phân loại email là thư rác hay không bằng các ví dụ lịch sử.

Dữ liệu Tổng hợp (Synthetic Data)

Synthetic Data
Dữ liệu được tạo ra nhân tạo mô phỏng dữ liệu thế giới thực, thường được sử dụng để huấn luyện khi dữ liệu thực khan hiếm hoặc nhạy cảm.
Ví dụ: Tạo hình ảnh y tế tổng hợp để huấn luyện các mô hình chẩn đoán mà không vi phạm quyền riêng tư của bệnh nhân.

Token (Token)

Token
Một đơn vị văn bản được xử lý bởi LLM - thường là một từ hoặc một phần của từ.
Ví dụ: Câu 'Hello world!' được chia thành 3 token: 'Hello', 'world', và '!'.

Token hóa (Tokenisation)

Tokenisation
Quá trình chia văn bản thành các token để xử lý bởi mô hình.
Ví dụ: Trong NLP, 'ChatGPT is great' trở thành ['Chat', 'G', 'PT', 'is', 'great'].

Học Chuyển giao (Transfer Learning)

Transfer Learning
Sử dụng kiến thức từ một nhiệm vụ để nâng cao việc học trên một nhiệm vụ liên quan khác, giảm nhu cầu về thời gian và dữ liệu huấn luyện.
Ví dụ: Tinh chỉnh một mô hình được huấn luyện trên văn bản tiếng Anh để thực hiện phân tích cảm xúc bằng một ngôn ngữ khác.

Máy biến áp (Transformer)

Transformer
Một kiến trúc mạng nơ-ron sử dụng các cơ chế chú ý để mô hình hóa dữ liệu tuần tự, được sử dụng rộng rãi trong LLM.
Ví dụ: BERT, GPT và T5 đều là các mô hình dựa trên máy biến áp.

Học dưới khớp (Underfitting)

Underfitting
Khi một mô hình quá đơn giản để nắm bắt các mẫu trong dữ liệu huấn luyện, dẫn đến hiệu suất kém.
Ví dụ: Một mô hình tuyến tính cố gắng dự đoán phân loại hình ảnh phức tạp có thể bị dưới khớp.

Học không Giám sát (Unsupervised Learning)

Unsupervised Learning
Một phương pháp học tập mà mô hình xác định các mẫu hoặc cụm trong dữ liệu không được gán nhãn.
Ví dụ: Nhóm khách hàng dựa trên hành vi mua hàng mà không có nhãn được xác định trước.

Ý định Người dùng (User Intent)

User Intent
Mục tiêu hoặc mục đích đằng sau truy vấn hoặc tương tác của người dùng.
Ví dụ: Người dùng nhập 'cách làm bánh' có khả năng muốn tìm một công thức.

Tập Xác thực (Validation Set)

Validation Set
Một tập con dữ liệu được sử dụng để đánh giá hiệu suất mô hình trong quá trình huấn luyện và điều chỉnh siêu tham số.
Ví dụ: Được sử dụng để phát hiện học quá khớp trước khi kiểm tra cuối cùng.

Cơ sở dữ liệu Vector (Vector Database)

Vector Database
Một cơ sở dữ liệu được thiết kế để lưu trữ và tìm kiếm các nhúng vector được sử dụng trong các tác vụ AI như tìm kiếm sự tương tự và RAG.
Ví dụ: Pinecone và Weaviate là các cơ sở dữ liệu vector để lưu trữ nhúng văn bản hoặc hình ảnh.

Nhúng Vector (Vector Embedding)

Vector Embedding
Một biểu diễn số của dữ liệu bảo tồn ý nghĩa ngữ nghĩa và mối quan hệ trong không gian vector.
Ví dụ: Các từ 'king' và 'queen' có các nhúng tương tự với sự khác biệt tinh tế về giới tính.

Trợ lý Ảo (Virtual Assistant)

Virtual Assistant
Một tác nhân phần mềm được hỗ trợ bởi AI giúp người dùng hoàn thành các tác vụ thông qua hội thoại hoặc lệnh thoại.
Ví dụ: Siri, Alexa và Google Assistant là các trợ lý ảo phổ biến.

Nhận dạng Giọng nói (Voice Recognition)

Voice Recognition
Công nghệ diễn giải và chuyển đổi ngôn ngữ nói thành văn bản hoặc hành động.
Ví dụ: Gõ bằng giọng nói và lệnh thoại dựa vào các hệ thống nhận dạng giọng nói.

AI Yếu (Weak AI)

Weak AI
Các hệ thống AI được thiết kế để thực hiện một nhiệm vụ hẹp, cụ thể mà không có trí tuệ tổng quát.
Ví dụ: Một AI chơi cờ không thể hiểu ngôn ngữ hoặc lái xe là một ví dụ về AI yếu.

Web Scraping (Web Scraping)

Web Scraping
Trích xuất thông tin tự động từ các trang web, thường được sử dụng để thu thập dữ liệu huấn luyện hoặc giám sát nội dung.
Ví dụ: Scraping danh sách bất động sản để huấn luyện mô hình định giá tài sản.

Trọng số (Weight)

Weight
Một tham số trong mạng nơ-ron xác định sức mạnh ảnh hưởng của một nút đối với nút khác.
Ví dụ: Trọng số điều chỉnh trong quá trình huấn luyện để giảm thiểu lỗi của mô hình.

Whisper (Whisper)

Whisper
Một mô hình chuyển giọng nói thành văn bản do OpenAI phát triển có khả năng phiên âm âm thanh bằng nhiều ngôn ngữ.
Ví dụ: Whisper có thể phiên âm các bài giảng và podcast với độ chính xác cao.

YAML (YAML)

YAML
Một định dạng dễ đọc cho việc tuần tự hóa dữ liệu, thường được sử dụng cho các tệp cấu hình trong quy trình làm việc học máy.
Ví dụ: Định nghĩa các tham số mô hình trong tệp YAML để huấn luyện trong PyTorch.

Học Không Mẫu (Zero-shot Learning)

Zero-shot Learning
Khả năng của một mô hình thực hiện các nhiệm vụ mà nó chưa bao giờ được huấn luyện rõ ràng bằng cách tận dụng kiến thức chung.
Ví dụ: Một mô hình trả lời các câu hỏi pháp lý mặc dù không được huấn luyện cụ thể về dữ liệu pháp lý.

Zettabyte (Zettabyte)

Zettabyte
Một đơn vị dữ liệu kỹ thuật số bằng một sextillion (10^21) byte, thường được sử dụng để mô tả quy mô dữ liệu internet.
Ví dụ: Lưu lượng truy cập internet toàn cầu đã vượt quá 1 zettabyte mỗi năm vào năm 2016.