Как се постига локализация на данни в Hadoop?
Как се постига локализация на данни в Hadoop?

Видео: Как се постига локализация на данни в Hadoop?

Видео: Как се постига локализация на данни в Hadoop?
Видео: Защита на данните - как EVS Translations защитава клиентските данни 2024, Ноември
Anonim

Локализация на данни в Hadoop . Вземете примерния пример за Wordcount, където повечето от думите са били повторени 5 или повече пъти. В този случай след фазата на Mapper всеки изход на Mapper ще има думи в диапазона от 5 Lacs. Този пълен процес на съхраняване на изхода на Mapper в LFS се нарича като Локализация на данни.

Имайки предвид това, какво е локализация на данни в Hadoop?

Концепцията на Данни местност в Hadoop данни местност в MapReduce се отнася до способността да се премести изчислението близо до мястото, където е действителното данни се намира на възела, вместо да се движи голям данни към изчисление. Това минимизира претоварването на мрежата и увеличава общата пропускателна способност на системата.

Освен това как се съхраняват големи данни? Повечето хора автоматично свързват HDFS или разпределената файлова система на Hadoop с Hadoop данни складове. HDFS съхранява информация в клъстери, които са съставени от по-малки блокове. Тези блокове са съхранени на място физически съхранение устройства, като вътрешни дискови устройства.

Точно така, как се съхраняват данните в Hadoop?

На Hadoop клъстер, на данни в HDFS и системата MapReduce се помещават на всяка машина в клъстера. Данни е съхранени в данни блокове на DataNodes. HDFS ги възпроизвежда данни блокове, обикновено с размер 128MB, и ги разпределя, така че да се репликират в множество възли в клъстера.

Как се съхраняват файловете в HDFS?

HDFS излага а файл системно пространство от имена и позволява да бъдат потребителски данни съхранени в файлове . Вътрешно, а файл се разделя на един или повече блокове и тези блокове са съхранени в набор от DataNodes. NameNode се изпълнява файл операции на системното пространство от имена като отваряне, затваряне и преименуване файлове и директории.

Препоръчано: