Съдържание:

Какви са отклоненията в анализа на данните?
Какви са отклоненията в анализа на данните?

Видео: Какви са отклоненията в анализа на данните?

Видео: Какви са отклоненията в анализа на данните?
Видео: Scentroid's CTAir Continuous Urban Air Quality Monitor Seminar A 12.08.2020 (Subtitled) 2024, Ноември
Anonim

В статистиката ан извънредно е данни точка, която се различава значително от другите наблюдения. Ан извънредно може да се дължи на променливост в измерването или може да показва експериментална грешка; последните понякога са изключени от данни комплект. Ан извънредно може да причини сериозни проблеми в статистически анализи.

Имайки предвид това, как намирате отклонения в данните?

Точка, която попада извън данни вътрешностите на набора се класифицират като второстепенни извънредно , докато този, който попада извън външните огради, се класифицира като основен извънредно . За да намерите вътрешните огради за вашите данни задайте, първо, умножете интерквартилния диапазон по 1,5. След това добавете резултата към Q3 и го извадете от Q1.

Освен по-горе, трябва ли да премахна отклонения от данните си? За на по-голямата част, ако вашите данни сте засегнати от тези екстремни случаи, вие мога обвързани на принос към исторически представител на вашите данни това изключва отклонения . Определете за всеки отделен случай какво на ефект на извънредните беше. И от там решете дали искате Премахване , променете или запазете извънредният стойности.

Във връзка с това, как анализът на данните се справя с отклоненията?

Ето четири подхода:

  1. Изхвърлете извънредните записи. В случай на Бил Гейтс или друг истински отклонение, понякога е най-добре напълно да премахнете този запис от вашия набор от данни, за да предпазите този човек или събитие от изкривяване на анализа ви.
  2. Ограничете данните си за извънредни стойности.
  3. Задайте нова стойност.
  4. Опитайте с трансформация.

Какъв е примерът за отклонение?

Извънредно . повече Стойност, която "лежи извън" (това е много по-малка или по-голяма от) повечето от другите стойности в набор от данни. За пример в оценките 25, 29, 3, 32, 85, 33, 27, 28 и двете3 и 85 са " отклонения ".

Препоръчано: