Какъв е механизмът за обработка на данни зад Amazon Elastic MapReduce?
Какъв е механизмът за обработка на данни зад Amazon Elastic MapReduce?

Видео: Какъв е механизмът за обработка на данни зад Amazon Elastic MapReduce?

Видео: Какъв е механизмът за обработка на данни зад Amazon Elastic MapReduce?
Видео: Chia IPO Livestream - Price, XCH Shares, Outlook, Whitepaper Review 2024, Април
Anonim

Amazon EMR използва Apache Hadoop като свой разпределен машина за обработка на данни . Hadoop е софтуерна рамка на Java с отворен код, която поддържа данни -интензивни разпределени приложения, работещи на големи клъстери на стоков хардуер.

Освен това, какво е Amazon Elastic MapReduce?

Amazon Elastic MapReduce ( EMR ) е Уеб услуги на Amazon ( AWS ) инструмент за обработка и анализ на големи данни. Amazon EMR обработва големи данни в Hadoop клъстер от виртуални сървъри Amazon Elastic Изчислителен облак ( EC2 ) и Amazon Проста услуга за съхранение ( S3 ).

Освен това, напълно ли се управлява Amazon EMR? Това е напълно управляван услуга езеро от данни, която може да отдели съхранението на данни от изчислителните ресурси и вместо това прави изчислителните клъстери мащабируеми, достъпни за използване при поискване и включва възможността за множество клъстери да имат достъп до едни и същи набори от данни наведнъж.

Човек може също да попита как работи AWS EMR?

Като цяло, когато обработвате данни в Amazon EMR , входът е данни, съхранявани като файлове в избраната от вас основна файлова система, като напр Amazon S3 или HDFS. Тези данни преминават от една стъпка към следващата в последователността на обработка. Последната стъпка записва изходните данни на определено място, като например Amazon S3 кофа.

Каква е разликата между ec2 и EMR?

За разлика от EMR , EC2 не категоризира подчинените възли в основни и възли на задачи. Това увеличава риска от загуба на HDFS данни в случай, че възел бъде премахнат/загубен. EC2 използва Apache библиотеки (s3a) за достъп до данни на s3. От друга страна, EMR използва собствен код на AWS, за да има по-бърз достъп до s3.

Препоръчано: