AI Jargon Buster

Разберитесь в терминологии искусственного интеллекта с нашим полным глоссарием. От машинного обучения до нейронных сетей, мы объясняем сложные концепции ИИ простыми словами.

Согласование (Alignment)

Alignment
Процесс обеспечения соответствия целей, результатов и поведения ИИ-системы человеческим целям и ценностям. Это особенно важно для продвинутых систем, которые могут развивать поведение, не предусмотренное явно.
Пример: Обеспечение того, чтобы чат-бот для поддержки психического здоровья никогда не рекомендовал вредные действия, независимо от запросов.

Интерфейс прикладного программирования (API) (Application Programming Interface (API))

Application Programming Interface (API)
Набор определенных правил и протоколов, позволяющих различным программным системам обмениваться данными.
Пример: Использование API OpenAI для отправки запроса и получения ответа, сгенерированного языковой моделью, в вашем веб-приложении.

Общий искусственный интеллект (AGI) (Artificial General Intelligence (AGI))

Artificial General Intelligence (AGI)
Теоретическая форма ИИ, способная выполнять любую интеллектуальную задачу, которую может выполнить человек. Он обобщает обучение в различных областях.
Пример: Система AGI могла бы изучать музыкальную композицию, проводить хирургические операции и сдавать экзамен по философии без программирования под конкретную задачу.

Искусственный интеллект (ИИ) (Artificial Intelligence (AI))

Artificial Intelligence (AI)
Имитация человеческого интеллекта в машинах, которые запрограммированы на мышление, рассуждение и автономные действия.
Пример: ИИ обеспечивает работу персональных помощников, таких как Siri, и систем автономного вождения, таких как Tesla Autopilot.

Этика ИИ (AI Ethics)

AI Ethics
Дисциплина, занимающаяся моральными последствиями разработки и использования ИИ, включая справедливость, конфиденциальность, подотчетность и недискриминацию.
Пример: Создание руководств для предотвращения дискриминации со стороны алгоритмов найма по признаку пола или этнической принадлежности.

Дополненный интеллект (Augmented Intelligence)

Augmented Intelligence
Совместная модель, в которой ИИ дополняет и усиливает человеческий интеллект, а не заменяет его.
Пример: Инструменты радиологии на базе ИИ, которые выделяют аномалии для врачей, принимающих окончательный диагноз.

Автономный агент (Autonomous Agent)

Autonomous Agent
ИИ-система, способная принимать собственные решения и предпринимать действия для достижения своих целей без вмешательства человека.
Пример: Автономный робот-доставщик, самостоятельно перемещающийся по городским улицам и избегающий препятствий.

Обратное распространение ошибки (Backpropagation)

Backpropagation
Метод обучения нейронных сетей путем корректировки весов в обратном направлении от выходных к входным слоям, минимизируя ошибки прогнозирования.
Пример: Используется при обучении классификаторов изображений для снижения частоты ошибок при распознавании рукописных цифр.

Смещение (алгоритмическое смещение) (Bias (Algorithmic Bias))

Bias (Algorithmic Bias)
Непреднамеренное и систематическое предпочтение в результатах ИИ из-за несбалансированных или нерепрезентативных обучающих данных.
Пример: Система распознавания лиц, которая чаще ошибочно идентифицирует людей с темным цветом кожи из-за их недостаточной представленности в обучающих данных.

Большие данные (Big Data)

Big Data
Чрезвычайно большие наборы данных, требующие специальных инструментов для хранения, анализа и извлечения ценности, часто используемые для обучения моделей ИИ.
Пример: Использование миллионов пользовательских взаимодействий для обучения рекомендательных систем для платформ электронной коммерции.

Модель черного ящика (Black Box Model)

Black Box Model
Тип модели ИИ или машинного обучения, внутренняя логика которой нелегко интерпретируется людьми, что затрудняет понимание того, как принимаются решения.
Пример: Модель глубокой нейронной сети, используемая для одобрения кредитов, но не дающая четкого объяснения, почему один заявитель был принят, а другой отклонен.

Когнитивные вычисления (Cognitive Computing)

Cognitive Computing
ИИ-системы, разработанные для имитации человеческих мыслительных процессов, таких как рассуждение и обучение, с использованием таких методов, как NLP и распознавание образов.
Пример: Система когнитивных вычислений, которая помогает юристам анализировать судебную практику и прогнозировать результаты.

Компьютерное зрение (Computer Vision)

Computer Vision
Область искусственного интеллекта, которая позволяет компьютерам интерпретировать и обрабатывать визуальные данные, такие как изображения и видео.
Пример: Системы распознавания лиц, которые идентифицируют людей на записях с камер наблюдения с помощью компьютерного зрения.

Корпус (Corpus)

Corpus
Большая коллекция письменных или устных текстов, используемая для обучения языковых моделей.
Пример: Набор данных Common Crawl — это общедоступный веб-корпус, используемый для обучения больших языковых моделей, таких как GPT.

Дрейф данных (Data Drift)

Data Drift
Явление, при котором входные данные меняются со временем, что приводит к снижению производительности модели.
Пример: Модель предиктивного обслуживания промышленного оборудования становится менее точной по мере внедрения новых сенсорных технологий.

Маркировка данных (Data Labelling)

Data Labelling
Процесс аннотирования данных тегами или метками, чтобы сделать их пригодными для обучения с учителем.
Пример: Маркировка тысяч изображений опухолей как доброкачественных или злокачественных для обучения модели обнаружения рака.

Добыча данных (Data Mining)

Data Mining
Процесс обнаружения значимых закономерностей, корреляций и аномалий в больших наборах данных.
Пример: Розничные продавцы используют добычу данных, чтобы выяснить, что люди, покупающие подгузники, часто покупают и пиво.

Глубокое обучение (Deep Learning)

Deep Learning
Подраздел машинного обучения, который использует многослойные нейронные сети для моделирования сложных закономерностей в данных.
Пример: Глубокое обучение используется в языковых моделях, таких как GPT-4, и моделях генерации изображений, таких как Stable Diffusion.

Диффузионные модели (Diffusion Models)

Diffusion Models
Класс генеративных моделей, которые учатся создавать данные, постепенно преобразуя случайный шум в структурированные выходные данные.
Пример: Stable Diffusion создает фотореалистичные изображения по текстовым запросам, используя диффузионные методы.

Векторное представление (Embedding)

Embedding
Численное векторное представление данных, часто используемое для улавливания семантического значения слов, изображений или предложений.
Пример: В NLP слово 'банк' может иметь схожие векторные представления со словом 'деньги', но отличаться от 'берег реки' в зависимости от контекста.

Эпоха (Epoch)

Epoch
Полная итерация по всему обучающему набору данных в процессе обучения модели машинного обучения.
Пример: Если набор данных содержит 1000 примеров, и модель видит их все один раз во время обучения, это одна эпоха.

Этичный ИИ (Ethical AI)

Ethical AI
Философия проектирования и развертывания, которая гарантирует, что технологии ИИ работают прозрачно, справедливо и в соответствии с общественными ценностями.
Пример: Инструмент найма на базе ИИ, который включает проверки на предвзятость для предотвращения дискриминации кандидатов из меньшинств.

Экспертная система (Expert System)

Expert System
ИИ-система, имитирующая возможности принятия решений экспертом-человеком в определенной области, используя правила и логику.
Пример: Экспертная система, используемая в сельском хозяйстве для рекомендации методов обработки культур на основе данных о почве и истории вредителей.

Объяснимый ИИ (XAI) (Explainable AI (XAI))

Explainable AI (XAI)
ИИ-системы, разработанные для того, чтобы сделать их внутренние процессы и решения понятными для людей, повышая доверие и подотчетность.
Пример: Медицинский диагностический ИИ, который не только дает рекомендацию, но и объясняет, какие симптомы привели к этому заключению.

Обучение на малом количестве примеров (Few-shot Learning)

Few-shot Learning
Метод машинного обучения, при котором модель обучается или дообучается с использованием лишь небольшого количества размеченных примеров.
Пример: Настройка LLM для написания юридических писем после показа ей всего 10 примеров.

Дообучение (Fine-tuning)

Fine-tuning
Процесс взятия предварительно обученной модели и ее дальнейшего обучения на новом, меньшем наборе данных для специализации ее для конкретной задачи.
Пример: Дообучение общей LLM, такой как GPT, на внутренних юридических документах для создания помощника по составлению юридических документов.

Фундаментальная модель (Foundation Model)

Foundation Model
Масштабная модель, обученная на разнообразных и обширных данных, которая может быть адаптирована для множества последующих задач.
Пример: GPT-4 и PaLM 2 — это фундаментальные модели, способные к суммаризации, ответам на вопросы, переводу и многому другому.

Нечеткая логика (Fuzzy Logic)

Fuzzy Logic
Форма логики, которая имеет дело с приблизительными значениями вместо фиксированной истинно/ложной (бинарной) логики, полезная для рассуждений в условиях неопределенности.
Пример: Используется в системах климат-контроля для регулировки температуры на основе нечетких входных данных, таких как «немного жарко» или «очень холодно».

Генеративно-состязательная сеть (GAN) (Generative Adversarial Network (GAN))

Generative Adversarial Network (GAN)
Архитектура генеративной модели, в которой две сети — генератор и дискриминатор — конкурируют за улучшение качества вывода.
Пример: GAN используются для создания дипфейк-видео или генерации реалистичных фотографий продуктов по эскизам.

Генеративный ИИ (Generative AI)

Generative AI
Категория искусственного интеллекта, способная создавать новый контент — такой как текст, изображения, музыка или видео — из обучающих данных.
Пример: ChatGPT генерирует сообщения в блогах, а Midjourney создает цифровое искусство по текстовым запросам.

Генеративный предварительно обученный трансформер (GPT) (Generative Pre-trained Transformer (GPT))

Generative Pre-trained Transformer (GPT)
Класс больших языковых моделей, разработанных OpenAI, которые используют архитектуру трансформера и предварительно обучены на огромных объемах текстовых данных для выполнения различных языковых задач.
Пример: GPT-4 способен писать эссе, переводить языки и суммировать документы с минимальным количеством запросов.

Генетический алгоритм (Genetic Algorithm)

Genetic Algorithm
Метод оптимизации, вдохновленный естественным отбором, где решения развиваются со временем посредством мутации, кроссовера и отбора.
Пример: Используется для проектирования эффективных архитектур нейронных сетей путем имитации выживания наиболее приспособленных.

Галлюцинация (Hallucination)

Hallucination
Генерация правдоподобного, но фактически неверного или бессмысленного контента ИИ-моделью.
Пример: Языковая модель выдумывает несуществующую цитату или предоставляет ложные исторические факты.

Эвристика (Heuristic)

Heuristic
Практический подход к решению проблем, который не гарантирует идеального решения, но достаточен для достижения текущих целей.
Пример: Использование эмпирического правила для оценки времени доставки в логистической ИИ-системе.

Гиперпараметр (Hyperparameter)

Hyperparameter
Конфигурационное значение, устанавливаемое перед обучением модели машинного обучения, такое как скорость обучения или количество слоев.
Пример: Изменение размера пакета с 32 до 128 для ускорения обучения и улучшения производительности модели.

Вывод (Inference)

Inference
Процесс использования обученной модели машинного обучения для создания прогнозов или генерации выходных данных из новых входных данных.
Пример: Использование дообученной модели GPT для составления электронных писем для команды поддержки клиентов.

Определение намерения (Intent Detection)

Intent Detection
Задача в области понимания естественного языка, в которой система определяет цель или намерение пользователя в сообщении.
Пример: В чат-боте распознавание фразы «Я хочу забронировать авиабилет» как намерения забронировать поездку.

Интернет вещей (IoT) (Internet of Things (IoT))

Internet of Things (IoT)
Сеть взаимосвязанных физических устройств, оснащенных датчиками, программным обеспечением и другими технологиями для сбора и обмена данными.
Пример: Умные термостаты и холодильники, которые сообщают данные об использовании и корректируют настройки с помощью аналитики ИИ.

Интерпретируемость (Interpretability)

Interpretability
Степень, в которой человек может понять внутренние механизмы модели машинного обучения и ее процесс принятия решений.
Пример: Дерево решений более интерпретируемо, чем глубокая нейронная сеть, поскольку его решения отслеживаемы.

Jupyter Notebook (Jupyter Notebook)

Jupyter Notebook
Интерактивная среда вычислений с открытым исходным кодом, которая позволяет пользователям писать код, визуализировать результаты и документировать анализ в едином интерфейсе.
Пример: Специалисты по данным используют Jupyter Notebook для прототипирования моделей машинного обучения и обмена результатами.

K-ближайших соседей (KNN) (K-Nearest Neighbours (KNN))

K-Nearest Neighbours (KNN)
Простой непараметрический алгоритм машинного обучения, используемый для классификации и регрессии. Он принимает решения на основе ближайших обучающих примеров в пространстве признаков.
Пример: Чтобы классифицировать новый фрукт как яблоко или грушу, KNN проверяет, какие размеченные фрукты ближе всего по форме и цвету.

Граф знаний (Knowledge Graph)

Knowledge Graph
Структура данных, которая использует узлы и ребра для представления и хранения взаимосвязанных описаний сущностей и их отношений.
Пример: Панель знаний Google работает на основе графа знаний, который связывает такие сущности, как люди, места и события.

Оптимизация языковых моделей (LLMO) (Language Learning Model Optimisation (LLMO))

Language Learning Model Optimisation (LLMO)
Методы, используемые для улучшения производительности, эффективности или адаптивности больших языковых моделей для конкретных задач или областей.
Пример: Использование квантования и настройки инструкций для оптимизации LLM для корпоративного использования.

Большая языковая модель (LLM) (Large Language Model (LLM))

Large Language Model (LLM)
Тип модели глубокого обучения, обученный на огромных объемах текстовых данных, способный генерировать, понимать и рассуждать с человеческим языком.
Пример: ChatGPT и Claude — это LLM, обученные помогать в написании, кодировании и ответах на вопросы.

Скрытое пространство (Latent Space)

Latent Space
Высокоразмерное абстрактное представление, где похожие входные данные сгруппированы близко друг к другу, используется в генеративных моделях и векторных представлениях.
Пример: В генерации изображений манипулирование скрытым пространством может изменять такие признаки, как яркость или эмоции.

Скорость обучения (Learning Rate)

Learning Rate
Ключевой гиперпараметр в обучении, который контролирует, насколько сильно корректируются веса модели относительно градиента потерь.
Пример: Высокая скорость обучения может привести к перескакиванию минимумов, в то время как слишком низкая скорость замедляет прогресс обучения.

Машинное обучение (ML) (Machine Learning (ML))

Machine Learning (ML)
Раздел ИИ, который позволяет системам учиться на данных и улучшать производительность без явного программирования.
Пример: Спам-фильтры используют машинное обучение для классификации электронных писем как спам или не спам на основе прошлых примеров.

Дрейф модели (Model Drift)

Model Drift
Явление, при котором точность модели со временем снижается из-за изменений в данных или среде.
Пример: Модель обнаружения мошенничества становится менее точной по мере эволюции тактик мошенничества.

Обучение модели (Model Training)

Model Training
Процесс подачи данных в модель машинного обучения и корректировки ее параметров для минимизации ошибки.
Пример: Обучение рекомендательной системы на истории покупок клиентов для предложения новых продуктов.

Мультимодальный ИИ (Multimodal AI)

Multimodal AI
ИИ-системы, способные обрабатывать и интегрировать несколько типов данных, таких как текст, изображения, аудио и видео.
Пример: Модель, такая как GPT-4 Vision, которая может одновременно читать текст и интерпретировать изображения.

Обработка естественного языка (NLP) (Natural Language Processing (NLP))

Natural Language Processing (NLP)
Подраздел ИИ, посвященный взаимодействию между компьютерами и человеческими (естественными) языками. Он позволяет машинам читать, понимать и отвечать на человеческом языке.
Пример: NLP используется в голосовых помощниках, приложениях для перевода языков и чат-ботах.

Нейронная сеть (Neural Network)

Neural Network
Модель машинного обучения, вдохновленная структурой человеческого мозга, состоящая из слоев взаимосвязанных узлов (нейронов).
Пример: Нейронные сети лежат в основе моделей глубокого обучения, используемых в распознавании изображений и речи.

Шум (Noise)

Noise
Случайная или нерелевантная информация в данных, которая может скрывать значимые закономерности и негативно влиять на производительность модели.
Пример: Ошибки датчиков или данные с опечатками могут считаться шумом.

Онтология (Ontology)

Ontology
Структурированная система, которая категоризирует и определяет отношения между концепциями в пределах области, часто используемая в семантических ИИ-системах.
Пример: Онтология в здравоохранении может определять, как симптомы связаны с заболеваниями и методами лечения.

Переобучение (Overfitting)

Overfitting
Ошибка моделирования, при которой модель машинного обучения улавливает шум в обучающих данных и плохо работает на новых данных.
Пример: Модель, которая запоминает ответы из обучения, но не может обрабатывать неизвестные тестовые данные, переобучена.

Предиктивная аналитика (Predictive Analytics)

Predictive Analytics
Использование данных, алгоритмов и ИИ для определения вероятности будущих результатов на основе исторических данных.
Пример: Розничные продавцы используют предиктивную аналитику для прогнозирования спроса на определенные товары.

Предварительное обучение (Pre-training)

Pre-training
Процесс первоначального обучения модели на большом, общем наборе данных перед ее дообучением для конкретных задач.
Пример: Модели GPT предварительно обучаются на больших корпусах перед настройкой для чат-ботов поддержки клиентов.

Инженерия промптов (Prompt Engineering)

Prompt Engineering
Искусство и наука создания эффективных запросов для управления выходными данными больших языковых моделей.
Пример: Добавление системных инструкций, таких как «Отвечай как вежливый репетитор», является примером инженерии промптов.

Квантование (Quantisation)

Quantisation
Метод сжатия модели, который уменьшает количество битов, используемых для представления весов и активаций, повышая эффективность.
Пример: Квантование модели с 32-битной до 8-битной улучшает производительность на мобильных устройствах.

Квантовые вычисления (Quantum Computing)

Quantum Computing
Новая парадигма вычислений, основанная на квантовой механике, которая обладает потенциалом экспоненциальных вычислительных возможностей.
Пример: Квантовые вычисления могут однажды ускорить обучение ИИ за пределы классических пределов.

Механизм рассуждений (Reasoning Engine)

Reasoning Engine
Система в ИИ, которая выводит логические заключения из набора фактов или данных, используя правила или алгоритмы вывода.
Пример: Диагностический инструмент ИИ использует механизм рассуждений для выведения возможных медицинских состояний на основе симптомов.

Обучение с подкреплением (RL) (Reinforcement Learning (RL))

Reinforcement Learning (RL)
Область машинного обучения, где агенты учатся, взаимодействуя со своей средой, чтобы максимизировать совокупные вознаграждения.
Пример: Робот учится ходить методом проб и ошибок, используя методы RL.

Обучение с подкреплением на основе обратной связи от человека (RLHF) (Reinforcement Learning with Human Feedback (RLHF))

Reinforcement Learning with Human Feedback (RLHF)
Метод обучения, при котором предпочтения человека направляют сигнал вознаграждения ИИ, часто используемый при дообучении языковых моделей.
Пример: ChatGPT был обучен с помощью RLHF для получения более полезных и безопасных ответов.

Генерация с дополненным поиском (RAG) (Retrieval-Augmented Generation (RAG))

Retrieval-Augmented Generation (RAG)
Метод, сочетающий поиск информации с генерацией, где LLM извлекает релевантные документы для улучшения своего ответа.
Пример: ИИ-ассистент извлекает и цитирует спецификации продукта при генерации ответа на технический вопрос.

Самообучение (Self-Supervised Learning)

Self-Supervised Learning
Подход к обучению, при котором модель изучает закономерности, генерируя собственные метки из необработанных данных, уменьшая зависимость от данных, аннотированных человеком.
Пример: BERT обучается с помощью самообучения, предсказывая пропущенные слова в тексте.

Семантический поиск (Semantic Search)

Semantic Search
Техника поиска, которая понимает намерение пользователя и контекстуальное значение, а не просто совпадение по ключевым словам.
Пример: Поиск «как починить протекающий кран» возвращает руководства, даже если термин «протекающий кран» отсутствует в документе.

Анализ тональности (Sentiment Analysis)

Sentiment Analysis
Процесс выявления эмоций, мнений или отношений в тексте, часто классифицируя их как положительные, отрицательные или нейтральные.
Пример: Анализ твитов для оценки общественной реакции на новый продукт.

Стохастический (Stochastic)

Stochastic
Включающий случайность или вероятностное поведение, часто используется в генеративном ИИ и алгоритмах оптимизации.
Пример: Вывод GPT-4 варьируется для одного и того же ввода из-за его стохастического процесса декодирования.

Сильный ИИ (Strong AI)

Strong AI
Также известный как Общий искусственный интеллект (AGI), относится к машинам с когнитивными способностями на уровне человека во всех областях.
Пример: Будущий ИИ, который может автономно писать романы, планировать города и решать этические дилеммы одинаково хорошо.

Сверхинтеллект (SAI) (Super Artificial Intelligence (SAI))

Super Artificial Intelligence (SAI)
Теоретический ИИ, значительно превосходящий человеческий интеллект во всех аспектах — рассуждении, творчестве, эмоциональном интеллекте и т. д.
Пример: SAI теоретически может самостоятельно разрабатывать новые науки и философии.

Обучение с учителем (Supervised Learning)

Supervised Learning
Метод машинного обучения, при котором модели обучаются на размеченных данных для изучения отображений входных и выходных данных.
Пример: Обучение модели классифицировать электронные письма как спам или не спам, используя исторические примеры.

Синтетические данные (Synthetic Data)

Synthetic Data
Искусственно сгенерированные данные, которые имитируют реальные данные, часто используемые для обучения, когда реальные данные редки или конфиденциальны.
Пример: Создание синтетических медицинских изображений для обучения диагностических моделей без нарушения конфиденциальности пациентов.

Токен (Token)

Token
Единица текста, обрабатываемая LLM — обычно слово или часть слова.
Пример: Предложение «Hello world!» разбивается на 3 токена: «Hello», «world» и «!».

Токенизация (Tokenisation)

Tokenisation
Процесс разбиения текста на токены для обработки моделью.
Пример: В NLP «ChatGPT is great» становится [«Chat», «G», «PT», «is», «great»].

Трансферное обучение (Transfer Learning)

Transfer Learning
Использование знаний из одной задачи для улучшения обучения на другой связанной задаче, сокращая время обучения и потребность в данных.
Пример: Дообучение модели, обученной на английском тексте, для выполнения анализа тональности на другом языке.

Трансформер (Transformer)

Transformer
Архитектура нейронной сети, которая использует механизмы внимания для моделирования последовательных данных, широко используемая в LLM.
Пример: BERT, GPT и T5 — все это модели на основе трансформеров.

Недообучение (Underfitting)

Underfitting
Когда модель слишком проста, чтобы уловить закономерности в обучающих данных, что приводит к плохой производительности.
Пример: Линейная модель, пытающаяся предсказать сложные классификации изображений, может недообучиться.

Обучение без учителя (Unsupervised Learning)

Unsupervised Learning
Подход к обучению, при котором модели идентифицируют закономерности или кластеры в неразмеченных данных.
Пример: Группировка клиентов на основе покупательского поведения без предварительно определенных меток.

Намерение пользователя (User Intent)

User Intent
Цель или назначение запроса или взаимодействия пользователя.
Пример: Пользователь, вводящий «как испечь торт», вероятно, намерен найти рецепт.

Валидационный набор (Validation Set)

Validation Set
Подмножество данных, используемое для оценки производительности модели во время обучения и настройки гиперпараметров.
Пример: Используется для обнаружения переобучения перед окончательным тестированием.

Векторная база данных (Vector Database)

Vector Database
База данных, разработанная для хранения и поиска векторных представлений, используемых в задачах ИИ, таких как поиск сходства и RAG.
Пример: Pinecone и Weaviate — это векторные базы данных для хранения текстовых или векторных представлений изображений.

Векторное представление (Vector Embedding)

Vector Embedding
Числовое представление данных, которое сохраняет семантическое значение и отношения в векторном пространстве.
Пример: Слова «король» и «королева» имеют схожие векторные представления с тонкими гендерными различиями.

Виртуальный ассистент (Virtual Assistant)

Virtual Assistant
Программный агент на базе ИИ, который помогает пользователям выполнять задачи с помощью голосовых команд или диалога.
Пример: Siri, Alexa и Google Assistant — популярные виртуальные ассистенты.

Распознавание голоса (Voice Recognition)

Voice Recognition
Технология, которая интерпретирует и преобразует устную речь в текст или действия.
Пример: Голосовой ввод и голосовые команды полагаются на системы распознавания голоса.

Слабый ИИ (Weak AI)

Weak AI
ИИ-системы, разработанные для выполнения узкой, специфической задачи без общего интеллекта.
Пример: ИИ, играющий в шахматы, который не может понимать язык или управлять автомобилем, является примером слабого ИИ.

Веб-скрейпинг (Web Scraping)

Web Scraping
Автоматизированное извлечение информации с веб-сайтов, часто используемое для сбора обучающих данных или мониторинга контента.
Пример: Скрейпинг объявлений о недвижимости для обучения модели оценки недвижимости.

Вес (Weight)

Weight
Параметр в нейронных сетях, который определяет силу влияния одного узла на другой.
Пример: Веса корректируются во время обучения для минимизации ошибки модели.

Whisper (Whisper)

Whisper
Модель преобразования речи в текст, разработанная OpenAI, способная транскрибировать аудио на нескольких языках.
Пример: Whisper может с высокой точностью транскрибировать лекции и подкасты.

YAML (YAML)

YAML
Человекочитаемый формат для сериализации данных, обычно используемый для конфигурационных файлов в рабочих процессах машинного обучения.
Пример: Определение параметров модели в файле YAML для обучения в PyTorch.

Обучение с нулевым выстрелом (Zero-shot Learning)

Zero-shot Learning
Способность модели выполнять задачи, на которых она никогда не обучалась явно, используя общие знания.
Пример: Модель, отвечающая на юридические вопросы, несмотря на то, что не обучалась специально на юридических данных.

Зеттабайт (Zettabyte)

Zettabyte
Единица цифровых данных, равная одному секстиллиону (10^21) байт, часто используемая для описания масштаба интернет-данных.
Пример: Глобальный интернет-трафик превысил 1 зеттабайт в год к 2016 году.