Какво е намаляване по ключ?
Какво е намаляване по ключ?

Видео: Какво е намаляване по ключ?

Видео: Какво е намаляване по ключ?
Видео: Лок и ключ 1 сезон - краткий сюжет. "Locke & Key" - Netflix. Ключи Локков 2024, Април
Anonim

Функцията Spark RDD reduceByKey обединява стойностите за всяка ключ с помощта на асоциативно намаляват функция. Това интуитивно означава, че тази функция дава същия резултат, когато се прилага многократно върху същия набор от RDD данни с множество дялове, независимо от реда на елемента.

Тогава каква е разликата между groupByKey и reduceByKey?

groupByKey () е просто да групирате вашия набор от данни въз основа на ключ. smanjitiByKey () е нещо като групиране + агрегиране. smanjitiByKey може да се използва, когато работим с голям набор от данни. aggregateByKey() е логически същото като smanjitiByKey (), но ви позволява да върнете резултат в различен Тип.

Също така Знайте, защо намаляването е действието в искра? Намаляване на искрата операцията е действие вид операция и задейства пълно изпълнение на DAG за всички подредени мързеливи инструкции. Искра RDD намаляват функцията намалява елементите на този RDD, използвайки посочения комутативен и асоциативен двоичен оператор. Намаляване на искрата операцията е почти подобна на намаляват метод в Scala.

Освен по-горе, какво е Pairrdd?

Spark предоставя специални операции върху RDD, съдържащи двойки ключ/стойност. Тези RDD се наричат двойки RDD. Сдвоените RDD са полезен градивен елемент в много програми, тъй като те разкриват операции, които ви позволяват да действате паралелно върху всеки ключ или да прегрупирате данни в мрежата. Сдвоете RDD са двойки КЛЮЧ/СТОЙНОСТ.

ReductionByKey действие ли е?

reducira() извежда колекция, която не добавя към насочената ациклична графика (DAG), така че се изпълнява като действие . Въпреки това, smanjitiByKey () връща RDD, който е просто друго ниво/състояние в DAG, следователно е трансформация.

Препоръчано: