В чем разница между базой данных и хранилищем данных?
Разве они не то же самое или, по крайней мере, написаны в одном и том же (то есть Oracle RDBMS)?
В чем разница между базой данных и хранилищем данных?
Разве они не то же самое или, по крайней мере, написаны в одном и том же (то есть Oracle RDBMS)?
Обратитесь к этому для получения дополнительной информации.
Из предыдущей ссылки:
База данных
Хранилище данных
Важно также отметить, что хранилища данных могут быть получены от нуля до многих баз данных.
От нетехнического вида: База данных ограничена конкретными приложениями или набором приложений.
Хранилище данных - это репозиторий данных уровня предприятия. Он будет содержать данные из всех/многих сегментов бизнеса. Он собирается поделиться этой информацией, чтобы представить глобальную картину бизнеса. Это также важно для интеграции между различными сегментами бизнеса.
С Технического вида: Слово "Хранилище данных" не было признано никаким признанным определением. Лично я определяю хранилище данных как набор данных. Где каждый массив данных состоит из одной или нескольких баз данных, где база данных специфична для определенного набора проблем (приложение, набор данных или процесс).
Проще говоря, база данных является компонентом хранилища данных. Есть много мест для изучения этой концепции, но поскольку нет "определения", вы найдете проблемы с любым ответом, который вы даете.
Хранилище данных - это ТИП базы данных.
В дополнение к тому, что уже сказано, хранилища данных, как правило, OLAP, с индексами и т.д. настроены для чтения, а не для записи, а данные де-нормируются/преобразуются в формы, которые легче читать и анализировать.
Некоторые люди сказали, что "базы данных" такие же, как OLTP - это неверно. OLTP, опять же, представляет собой ТИП базы данных.
Другие типы "баз данных": текстовые файлы, XML, Excel, CSV..., плоские файлы: -)
Самый простой способ объяснить это - сказать, что хранилище данных состоит не только из базы данных. База данных представляет собой набор данных, организованных каким-то образом, но хранилище данных организовано специально для "облегчения отчетности и анализа". Однако это не вся история, поскольку хранилище данных также содержит "средства для извлечения и анализа данных, для извлечения, преобразования и загрузки данных и для управления словарем данных, также считаются важными компонентами системы хранилищ данных".
База данных: - OLTP (процесс онлайн-транзакций)
Datawarehouse
Хранилище данных по сравнению с базой данных. Хранилище данных специально разработано для аналитики данных, которая включает в себя чтение больших объемов данных для понимания взаимосвязей и тенденций в данных. База данных используется для сбора и хранения данных, таких как запись деталей транзакции.
Хранилище данных: подходящие рабочие нагрузки - аналитика, отчетность, большие данные. Источник данных - данные, собранные и нормализованные из многих источников. Сбор данных - Операции с массовой записью, как правило, по заранее заданному расписанию. Нормализация данных - денормализованные схемы, такие как схема Star или схема Snowflake. Хранение данных - оптимизировано для простоты доступа и высокоскоростного запроса. производительность с использованием столбчатого хранилища. Доступ к данным - оптимизирован для минимизации ввода-вывода и максимизации пропускной способности.
База данных транзакций: Подходящие рабочие нагрузки - Обработка транзакций. Источник данных - данные, полученные как есть, из одного источника, такого как транзакционная система. Сбор данных - Оптимизирован для непрерывных операций записи, поскольку новые данные доступны для максимизации пропускной способности транзакций. Нормализация данных - Сильно нормализованные, статические схемы. Хранение данных - Оптимизировано для большого количества операций записи в один ориентированный на строки физический блок. Доступ к данным - большие объемы небольших операций чтения.
Любое хранилище данных для приложения обычно использует базу данных. Это может быть реляционная база данных или нет базы данных sql, которые в настоящее время находятся в тренде.
Хранилище данных также является базой данных. Мы можем назвать базу данных хранилища данных как специализированное хранилище данных для целей аналитической отчетности для компании. Эти данные используются для ключевых бизнес-решений.
Упорядоченные данные помогают эффективно составлять отчеты и принимать деловые решения.
Пример: дом стоит $100,000
, и он оценивается в $1000
в год.
Чтобы отслеживать текущую стоимость дома, вы должны использовать базу данных, поскольку значение будет меняться каждый год.
Через три года вы сможете увидеть стоимость дома, которая составляет $103,000.
Чтобы отслеживать историческую стоимость дома, вы должны использовать хранилище данных, так как стоимость дома должна быть
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.
Источником для Хранилища данных может быть кластер Базы данных, потому что базы данных используются для процесса онлайн-транзакций, например, для хранения текущих записей. Но в Хранилище данных хранятся исторические данные, которые предназначены для онлайн-аналитического процесса.
Хранилище данных - это тип структуры данных, обычно размещаемой в базе данных. Хранилище данных ссылается на модель данных и тип данных, которые там хранятся - данные, которые моделируются (модель данных) для аналитических целей сервера.
База данных может быть классифицирована как любая структура, которая содержит данные. Традиционно это будет СУБД, такая как Oracle, SQL Server или MySQL. Однако база данных также может быть базой данных NoSQL, такой как Apache Cassandra, или столбчатой MPP, такой как AWS RedShift.
Вы видите, что база данных - это просто место для хранения данных; Хранилище данных - это особый способ хранения данных, который служит определенной цели, которая заключается в обслуживании аналитических запросов.
OLTP против OLAP не говорит вам разницы между DW и базой данных, и OLTP и OLAP находятся в базах данных. Они просто хранят данные по-разному (разные методологии модели данных) и служат разным целям (OLTP - записи транзакций, оптимизированные для обновлений; OLAP - анализ информации, оптимизированные для чтения).
См. простыми словами: Dataware → Огромные данные, используемые для анализа/хранения/копирования и анализа. База данных → операция CRUD с часто используемыми данными.
Dataware house - это вид хранилища, которое вы не используете на ежедневной основе, а база данных - это то, что вы часто делаете.
Eg. Если мы спрашиваем выражение банка, то он дает нам последние 3/4/6/более месяцев bcoz, который находится в базе данных. Если вы хотите больше, чем он хранится в доме Dataware.
База данных и хранилище данных одинаковы, потому что мы найдем данные в организованном порядке в обоих этих. Но подождите...
OLTP (обработка онлайн-транзакций), или мы можем сказать, что операционная система, которая обеспечивает ежедневную транзакционную операцию в организации. Базы данных используются для такого типа работы (OLTP или операционная система).
Q. Что мы делаем в среде операционной системы?
** мы удаляем, обновляем, вставляем записи для клиентов из базы данных. Параллельно с этим на всех данных OLTP (операционная система) выполняется преобразование (Извлечение, агрегация, очистка), и данные собираются хранить на складе для менеджера и руководителей, чтобы поддерживать их при принятии решений, при определении целей и цели для предприятий.
Таким образом, хранилище данных заключений - это место, где данные должны быть в организованном виде, таком как база данных, но должны предоставлять стратегическую информацию (информацию для создания бизнес-стратегии, информацию для постановки целей.).
База данных:
Используется для оперативной обработки транзакций (OLTP).
Хранилище данных:
Используется для онлайн-аналитической обработки (OLAP).