Какво е DistCp в Hadoop?
Какво е DistCp в Hadoop?

Видео: Какво е DistCp в Hadoop?

Видео: Какво е DistCp в Hadoop?
Видео: DJENA - DA VIDYA KAKVO E / Джена - Да видя какво е, 2012 2024, Ноември
Anonim

DistCp (разпределено копие) е инструмент, използван за голямо между/вътре-клъстерно копиране. То използва MapReduce за осъществяване на неговото разпространение, обработка и възстановяване на грешки и отчитане. Той разширява списък с файлове и директории във вход за картографиране на задачи, всяка от които ще копира дял от файловете, посочени в списъка с източници.

По подобен начин някой може да попита дали Distcp презаписва?

Трябва също да разясня някои неща и да обясня това distcp - презаписване ще презаписване файла, независимо дали размерът съвпада или не. Това ще актуализира всички файлове в hdfs-nn2, които не съвпадат по размер от hdfs-nn1, както и ще изтрие всички външни файлове.

По същия начин какво е командата Hadoop FS? Файловата система ( FS ) shell включва различни черупковидни команди които директно взаимодействат с Hadoop Разпределена файлова система ( HDFS ), както и други файлови системи, които Hadoop поддържа, като Local FS , HFTP FS , S3 FS , и други.

По този начин как да прехвърля данни от един Hdfs към друг Hdfs?

Hadoop fs cp – Най-лесният начин за копиране на данни от един изходна директория към друг . Използвай hadoop fs -cp [източник] [назначение]. Hadoop fs copyFromLocal – Трябва копиране на данни от локална файлова система в HDFS ? Използвай hadoop fs -copyFromLocal [източник] [назначение].

Как да копирам клъстер от един клъстер в друг?

Копиране на файлове между клъстери . Можеш копиране на файлове или директории между различни клъстери с помощта на командата hadoop distcp. Трябва да включите идентификационни данни файл във вашия копие искайте така източника клъстер може да потвърди, че сте удостоверени с източника клъстер и целта клъстер.

Препоръчано: