Какво е AWS MapReduce?
Какво е AWS MapReduce?

Видео: Какво е AWS MapReduce?

Видео: Какво е AWS MapReduce?
Видео: DATALEARN | DE - 101 | МОДУЛЬ 4-2 Что такое ETL и ELT? 2024, Ноември
Anonim

Amazon Elastic MapReduce (EMR) е уеб услуги на Amazon ( AWS ) инструмент за обработка и анализ на големи данни. Amazon EMR обработва големи данни в клъстер Hadoop от виртуални сървъри на Amazon Elastic Compute Cloud (EC2) и Amazon Simple Storage Service (S3).

По този начин как работи AWS EMR?

Услугата стартира определен от клиента брой екземпляри на Amazon EC2, състоящи се от един главен и множество други възли. Amazon EMR стартира софтуер Hadoop на тези екземпляри. Главният възел разделя входните данни на блокове и разпределя обработката на блоковете към другите възли.

Освен по-горе, каква е разликата между ec2 и EMR? За разлика от EMR , EC2 не категоризира подчинените възли в основни и възли на задачи. Това увеличава риска от загуба на HDFS данни в случай, че възел бъде премахнат/загубен. EC2 използва Apache библиотеки (s3a) за достъп до данни на s3. От друга страна, EMR използва собствен код на AWS, за да има по-бърз достъп до s3.

Освен това, напълно ли се управлява AWS EMR?

Amazon Elastic MapReduce ( EMR ) е напълно управляван Платформата Hadoop и Spark от Amazon Уеб сервиз ( AWS ). С EMR , AWS клиентите могат бързо да развиват клъстери Hadoop с множество възли, за да обработват големи натоварвания с данни.

AWS използва ли Hadoop?

Amazon Уеб услуги използва Apache с отворен код Hadoop разпределена изчислителна технология, за да се улесни достъпът до големи количества изчислителна мощност за изпълнение на задачи с интензивни данни. Hadoop , версията с отворен код на MapReduce на Google, вече се използва от компании като Yahoo и Facebook.

Препоръчано: