Какво представлява Impala в големите данни?
Какво представлява Impala в големите данни?

Видео: Какво представлява Impala в големите данни?

Видео: Какво представлява Impala в големите данни?
Видео: Какво е хомо сапиенс ? 2024, Може
Anonim

Импала е двигател за заявки с масова паралелна обработка с отворен код върху клъстерирани системи като Apache Hadoop. Създаден е на базата на хартията на Google Dremel. Това е интерактивна машина за заявки като SQL, която работи върху разпределената файлова система на Hadoop (HDFS). Импала използва HDFS като основно хранилище.

Относно това, какво е Impala и кошер?

Apache Кошер е ефективен стандарт за SQL-в-Hadoop. Импала е двигател за SQL заявки с отворен код, разработен след Google Dremel. Cloudera Импала е SQL машина за обработка на данните, съхранявани в HBase и HDFS. Импала използва Кошер megastore и може да запита Кошер таблици директно.

Освен това, кое е по-добро кошер или Impala? Apache Кошер може да не е идеален за интерактивни изчисления, докато Импала е предназначен за интерактивни изчисления. Кошер е пакетно базиран Hadoop MapReduce, докато Импала е Повече ▼ като база данни MPP. Кошер поддържа сложни типове, но Импала не. Apache Кошер е устойчив на грешки, докато Импала не поддържа отказоустойчивост.

Също така попитах защо използваме Impala?

Импала поддържа обработка на данни в паметта, т.е. осъществява достъп/анализира данни, които е съхранявани на възли с данни на Hadoop без движение на данни. Можеш данни за достъп използвайки Impala, използвайки SQL-подобни заявки. Импала осигурява по-бърз достъп до данните в HDFS в сравнение с други SQL машини.

Какво е кошер в големи данни?

Apache Кошер е данни складова система за данни обобщение и анализ и за запитване на големи данни системи в платформата Hadoop с отворен код. Той преобразува подобни на SQL заявки в MapReduce задачи за лесно изпълнение и обработка на изключително големи обеми данни.

Препоръчано: