Какво представлява клъстерирането, което обяснява ролята му в извличането на данни?
Какво представлява клъстерирането, което обяснява ролята му в извличането на данни?

Видео: Какво представлява клъстерирането, което обяснява ролята му в извличането на данни?

Видео: Какво представлява клъстерирането, което обяснява ролята му в извличането на данни?
Видео: Дъглас Хофстатър - Гьодел, Ешер, Бах - част 11/13 (Аудио книга) Философия 2024, Може
Anonim

Въведение. То е извличане на данни техника, използвана за поставяне на елементите от данни техен свързани групи. Групиране е процесът на разделяне на данните (или обекти) в един и същ клас, данните в един клас са по-подобни на всеки различни от тези в др клъстер.

Освен това, каква е ползата от клъстерирането?

Групиране се използва при сегментиране на пазара; където се опитваме да глобим клиенти, които са сходни помежду си, независимо дали по отношение на поведение или атрибути, сегментиране/компресия на изображение; където се опитваме да групираме подобни региони заедно, документ групиране въз основа на теми и др.

Човек може също да попита защо използваме клъстерен анализ? Клъстерен анализ може да бъде мощен инструмент за извличане на данни за всяка организация, която трябва да идентифицира отделни групи клиенти, транзакции за продажби или други видове поведение и неща. Например, застрахователните доставчици използват клъстерен анализ за откриване на измамни искове, а банките го използват за кредитен скоринг.

Освен това, какво представлява клъстерирането в извличането на данни с пример?

Групиране е процесът на превръщане на група от абстрактни обекти в класове от подобни обекти. А клъстер на данни обектите могат да се третират като една група. Докато прави клъстер анализ, първо разделяме множеството от данни в групи въз основа на данни сходство и след това присвоете етикетите на групите.

Защо K означава, че се използва групиране?

Бизнес употреби. В К - означава, че се използва алгоритъм за клъстериране за намиране на групи, които не са изрично обозначени в данните. Това може да бъде използван за потвърждаване на бизнес предположения за това какви видове групи съществуват или за идентифициране на неизвестни групи в сложни набори от данни.

Препоръчано: