Перейти к основному содержимому

12.4. Глоссарий терминов

Приложения Apache Ozone: Глоссарий терминов

В Apache Ozone используется множество терминов, связанных с управлением данными, репликацией, отказоустойчивостью и распределёнными системами. Понимание этих терминов поможет более эффективно работать с Ozone и легче ориентироваться в документации. Ниже приведён глоссарий основных терминов, используемых в Apache Ozone.


A

  • ACL (Access Control List) — Список контроля доступа. Определяет права доступа пользователей и групп к томам, бакетам и объектам в Ozone.

  • API (Application Programming Interface) — Интерфейс программирования, позволяющий взаимодействовать с Ozone через вызовы функций. Ozone поддерживает REST API, HDFS API и S3 API.


B

  • Бакет (Bucket) — Основная единица хранения данных внутри тома в Ozone. В бакетах хранятся объекты (ключи) и данные.

C

  • CLI (Command-Line Interface) — Интерфейс командной строки. Apache Ozone предоставляет CLI-команды через Ozone Shell для управления томами, бакетами и ключами.

  • Container (Контейнер) — Базовая единица хранения данных в Ozone, которая объединяет несколько блоков данных. Контейнеры управляются SCM и распределяются между узлами DataNode.

  • Core-site.xml — Конфигурационный файл Hadoop Core, используемый для указания параметров файловой системы, таких как файловая система по умолчанию (например, o3fs для Ozone).


D

  • DataNode — Компонент Apache Ozone, который хранит контейнеры с данными. DataNode отвечает за физическое хранение данных и поддерживает репликацию для обеспечения отказоустойчивости.

  • Дедупликация (Deduplication) — Процесс устранения дублирующихся данных для оптимизации использования дискового пространства. В Ozone не применяется автоматически, но может быть реализован на уровне приложений.


H

  • HDFS API — Интерфейс для взаимодействия с Hadoop Distributed File System. Ozone совместим с HDFS API, что позволяет использовать его в экосистеме Hadoop.

  • High Availability (HA) — Высокая доступность. В Ozone можно настроить несколько узлов Ozone Manager (OM) и Storage Container Manager (SCM) для обеспечения отказоустойчивости и отказоустойчивой работы кластера.


K

  • Ключ (Key) — Объект, хранящийся в бакете Ozone. Ключи представляют собой файлы или данные и идентифицируются уникальным именем в рамках бакета.

  • Kerberos — Протокол сетевой аутентификации, используемый для защиты данных и управления доступом в Ozone. Kerberos обеспечивает безопасную аутентификацию пользователей и сервисов.


M

  • Metadata (Метаданные) — Информация о структуре и свойствах данных в Ozone, такая как информация о томах, бакетах и ключах. Метаданные управляются компонентом Ozone Manager (OM).

O

  • Ozone Manager (OM) — Компонент Ozone, который управляет метаданными томов и бакетов, а также обрабатывает операции на уровне пользователей. OM поддерживает контроль доступа, создание бакетов и управление ключами.

  • Ozone Shell — Интерфейс командной строки для взаимодействия с Ozone. С его помощью можно создавать тома, бакеты, ключи и управлять данными в Ozone.


P

  • Policy (Политика) — Набор правил для управления хранением и репликацией данных. Например, политика репликации определяет, сколько копий данных хранить для обеспечения отказоустойчивости.

  • Principal (Принципал) — Уникальная сущность в системе безопасности Kerberos, представляющая пользователя или сервис. В Ozone используются Kerberos-принципалы для аутентификации компонентов, таких как OM и SCM.


R

  • Ratis — Протокол консенсуса, используемый в Ozone для обеспечения согласованности данных и репликации на уровне контейнеров. Ratis применяется для отказоустойчивой работы Ozone Manager и SCM.

  • Recon — Компонент мониторинга в Ozone, который собирает и отображает информацию о состоянии кластера, контейнерах, узлах и репликах. Recon предоставляет интерфейс для мониторинга кластера.

  • Replication (Репликация) — Процесс создания копий данных для повышения отказоустойчивости и защиты данных. В Ozone уровень репликации задаётся для контейнеров и может быть настроен на 2, 3 и более копий.


S

  • S3 Gateway — Компонент Apache Ozone, предоставляющий S3-совместимый интерфейс для взаимодействия с данными. S3 Gateway позволяет использовать Ozone в качестве альтернативы Amazon S3 для хранения объектов.

  • SCM (Storage Container Manager) — Компонент, управляющий контейнерами и репликацией данных в Ozone. SCM отслеживает состояние узлов DataNode и управляет размещением контейнеров.

  • SLA (Service Level Agreement) — Соглашение об уровне обслуживания. В контексте Ozone SLA может касаться доступности данных, производительности или времени восстановления данных после сбоя.


T

  • Том (Volume) — Контейнер для хранения бакетов в Ozone. Том может принадлежать определённому пользователю и выступает как область, в которой можно создавать и управлять бакетами.

V

  • Versioning (Версионирование) — Функция, позволяющая хранить несколько версий данных в бакете. Версионирование может быть включено для обеспечения доступа к предыдущим версиям объекта.

W

  • Write-Ahead Log (WAL) — Журнал предзаписи, используемый для обеспечения целостности данных при записи. В Ozone используется в основном на уровне базы данных метаданных, таких как RocksDB.

Эти термины помогут вам лучше понять ключевые концепции и компоненты Apache Ozone. Знание терминологии упрощает работу с системой и позволяет более эффективно использовать возможности, которые предоставляет Apache Ozone.