Защо Hadoop е по-евтин?
Защо Hadoop е по-евтин?

Видео: Защо Hadoop е по-евтин?

Видео: Защо Hadoop е по-евтин?
Видео: На рубеже эры больших данных — Тим Смит 2024, Ноември
Anonim

Hadoop е относително евтино

Цената на терабайт за изпълнение a Hadoop клъстер е по-евтино отколкото цената на терабайт за създаване на система за архивиране на лента. Разрешено, а Hadoop системата струва повече за работа, тъй като дисковите устройства, съдържащи данните, са онлайн и захранвани, за разлика от лентови устройства.

По този начин рентабилен ли е Hadoop?

Hadoop предлага мащабируем, цена - ефективен и високодостъпно решение за съхранение и обработка на големи данни. Използването на непатентован физически слой значително намалява зависимостта от технологията. Той също така предлага еластични възможности за оразмеряване, когато се разполага на виртуални машини или дори в IAAS облак.

Освен това, защо Spark е по-добър от Hadoop? Apache Искра – Искра е светкавично бърз инструмент за клъстерни изчисления. Apache Искра изпълнява приложения до 100 пъти по-бързо в паметта и 10 пъти по-бързо на диска отколкото Hadoop . Поради намаляване на броя на цикъла на четене/запис на диск и съхраняване на междинни данни в паметта Искра прави възможно.

Имайки предвид това, колко струва Hadoop?

За корпоративен клас Hadoop клъстер, се препоръчва сървър на Intel от среден клас. Тези обикновено цена $4,000 до $6,000 на възел с капацитет на диска между 3TB и 6TB в зависимост от желаната производителност. Това означава възел цена е приблизително $1,000 до $2,000 за TB. HDFS няма физически ограничения за размерите на файловете.

Защо Hadoop е по-бърз?

Причината, поради която Spark е по-бързо отколкото Hadoop е, че Spark обработва всичко в паметта. Може също да използва диска за данни, които не се вписват всички в паметта.

Препоръчано: