Spark използва ли zookeeper?
Spark използва ли zookeeper?

Видео: Spark използва ли zookeeper?

Видео: Spark използва ли zookeeper?
Видео: Thorny path to the Large Scale Graph Processing / Алексей Зиновьев (Тамтэк) 2024, Може
Anonim

Стартирайте Искра Овладейте множество възли и се уверете, че тези възли имат еднакви Зоопарк конфигурация за ZooKeeper URL и директория.

Информация.

Системно свойство смисъл
искра .разгръщане. пазач на зоопарка .реж Директорията в ZooKeeper за съхраняване на състоянието на възстановяване (по подразбиране: / искра ). Това може да е по избор

Следователно, можете ли да стартирате Spark локално?

Spark може бъда бягай използвайки вградения самостоятелен планировчик на клъстери в местен режим. Това означава, че всички Искра процеси са бягай в рамките на една и съща JVM - ефективно, единичен, многонишков екземпляр на Искра.

Второ, може ли Spark да се използва без Hadoop? Според Искра документация, Spark може бягай без Hadoop . Можете да го стартирате като самостоятелен режим без всеки мениджър на ресурси. Но ако искате да работите в настройка с множество възли, имате нужда от мениджър на ресурси като YARN или Mesos и разпределена файлова система като HDFS , S3 и др. Да, искра може бягай без hadoop.

Също така трябва да знаете защо ZooKeeper се използва в Hadoop?

Зоопарк в Hadoop може да се разглежда като централизирано хранилище, където разпределените приложения могат да поставят данни и да извличат данни от тях. то е използван да поддържа разпределената система да функционира заедно като едно цяло, използвайки нейните цели за синхронизация, сериализация и координация.

Как работи искрата самостоятелно?

Самостоятелен mode е прост клъстер мениджър, включен с Искра . Това улеснява настройването на клъстер, който Искра сам управлява и може да работи на Linux, Windows или Mac OSX. Често това е най-простият начин за бягане Искра приложение в клъстерирана среда. Научете как да инсталирате Apache Spark На Самостоятелен режим.

Препоръчано: