Какво е Spark излъчване?
Какво е Spark излъчване?

Видео: Какво е Spark излъчване?

Видео: Какво е Spark излъчване?
Видео: Тестер за запалителни свещи E-203 P 2024, Ноември
Anonim

Излъчване променливи в Apache Искра е механизъм за споделяне на променливи между изпълнители, които са предназначени да бъдат само за четене. Без излъчване променливи тези променливи ще бъдат изпратени на всеки изпълнител за всяка трансформация и действие и това може да доведе до режийни разходи в мрежата.

По същия начин хората питат, кога трябва да излъчвам Spark?

Излъчване променливите се използват най-вече, когато задачите на множество етапи изискват едни и същи данни или когато се изисква кеширане на данните в десериализирана форма. Излъчване променливите се създават с помощта на променлива v чрез извикване на SparkContext.

Също така, какво представляват акумулаторите и излъчваните променливи в Spark? Искра поддържа два вида споделени променливи : излъчвани променливи , който може да се използва за кеширане на стойност в паметта на всички възли, и акумулатори , които са променливи които се „добавят“само към, като броячи и суми.

Имайки предвид това, какво е искра акумулатор?

Акумулатори са променливи, които се „добавят“само чрез асоциативна операция и следователно могат да бъдат ефективно поддържани паралелно. Те могат да се използват за прилагане на броячи (както в MapReduce) или суми. Искра естествено поддържа акумулатори на числови типове и програмистите могат да добавят поддръжка за нови типове.

Как да актуализирам променливата си за излъчване в spark?

  1. Преместете търсенето на референтни данни в forEachPartition или forEachRdd, така че да се намира изцяло върху работниците.
  2. Рестартирайте контекста на Spark всеки път, когато refdata се промени, с нова променлива за излъчване.

Препоръчано: