Какво е езеро от данни в Hadoop?
Какво е езеро от данни в Hadoop?

Видео: Какво е езеро от данни в Hadoop?

Видео: Какво е езеро от данни в Hadoop?
Видео: ОЦЕЛЯВАМЕ 24 ЧАСА НА ИЗОСТАВЕНО ЕЗЕРО! 2024, Ноември
Anonim

А Езерото от данни на Hadoop е данни платформа за управление, включваща една или повече Hadoop клъстери. Използва се главно за обработка и съхранение на нерелационни данни , като регистрационни файлове, записи на поток от кликвания в интернет, сензор данни , JSON обекти, изображения и публикации в социалните мрежи.

В тази връзка, каква е разликата между склад за данни и езеро от данни?

Езера от данни и данни и двете складове са широко използвани за съхранение на големи данни , но те не са взаимозаменяеми термини. А езеро с данни е огромен басейн от суровини данни , чиято цел все още не е определена. А склад за данни е хранилище за структурирани, филтрирани данни които вече са обработени за конкретна цел.

Освен това, какво представлява архитектурата на езерото от данни? А Езерото на данните е хранилище за съхранение, което може да съхранява голямо количество структурирани, полуструктурирани и неструктурирани данни . За разлика от йерархична къща за данни, където данни се съхранява във файлове и папка, Езерото на данните има апартамент архитектура.

По отношение на това, какво се има предвид под езерото от данни?

А езеро с данни е хранилище за съхранение, което съдържа огромно количество сурови данни в родния си формат, докато не е необходимо. Докато йерархичен данни складови магазини данни във файлове или папки, a езеро с данни използва плоска архитектура за съхранение данни . Терминът езеро с данни често се свързва с Hadoop-ориентирано съхранение на обекти.

Elasticsearch езеро от данни ли е?

А езеро с данни е просто място за паркиране данни докато не ви потрябва и може да включва HDFS (най-често срещаните), обекти за съхранение, NAS кутии или нещо друго. по същество, Elasticsearch е инструмент за индексиране данни , не за съхранение на данни себе си.

Препоръчано: