Изучаване на статистика? Тогава вероятно сте чували израза „нормално разпределение“, когато описвате данни. Но какво да кажем за фразата „изкривено надясно“? Как изглежда изкривената надясно хистограма? И какво го причинява?
В тази статия ви даваме примери за хистограми, изкривени надясно, и обясняваме как те се различават от нормалните графики на разпределение.
Характерно изображение: Моника Плейс /Wikimedia Commons
Какво е нормално разпределение?
Преди да обясним какво означава, когато данните са изкривени надясно, нека прегледаме определението за нормално разпределение.
При нормално разпределение, две или повече променливи споделят пряка връзка, за да направят a симетричен набор от данни , на която лявата половина отразява дясната половина. Тези графики се наричат камбановидни извивки поради тяхната ясно изразена камбановидна форма:
На графика на нормално разпределение, средната (средната), медианата и модата са равни . Всички тези точки представляват центъра на данните или върха на графиката.
Какво означава изкривено дясно?
Докато нормалното разпределение е една от най-често срещаните форми на разпределение, не всички набори от данни следват тази основна крива. С други думи, някои хистограми са изкривени надясно или наляво .
При дясно изкривено разпределение (известно още като „положително изкривено“ разпределение) повечето данни попадат вдясно или положителната страна на пика на графиката. По този начин, хистограмата се изкривява по такъв начин, че дясната й страна (или „опашката“) е по-дълга от лявата й страна.
Пример за дясно изкривена хистограма.
На дясно изкривена хистограма средната стойност, медианата и модата са различни. В този случай модата е най-високата точка на хистограмата, докато медианата и средната стойност падат вдясно от нея (или, визуално, вдясно от пика). Забележи, че средната воля винаги да бъде вдясно от медианата .
Графика A е изкривена надясно, докато графика B е изкривена наляво. При дясно изкривени графики средната стойност винаги идва вдясно от режима (т.е. пикът). ( Asitgoes /Wikimedia Commons) )
Тези функции в крайна сметка го правят трудно да се определи типична стойност тъй като няма ясна централна точка на изкривена надясно графика. Обратно, при нормално разпределение, тъй като средната стойност, медианата и модата са равни и са в центъра на набора от данни, можете лесно да използвате тази стойност за по-точно обобщаване на данните.
Какво причинява изкривена надясно хистограма?
Данните, изкривени надясно, обикновено са резултат от долна граница в набор от данни (докато данните, изкривени наляво, са резултат от по-висока граница). Така че, ако долните граници на набора от данни са изключително ниски спрямо останалите данни, това ще доведе до изкривяване на данните надясно.
Друга причина за изкривяване е стартови ефекти . Например, ако дадена процедура първоначално има много успехи по време на дълъг период на стартиране, това може да създаде положително изкривяване на данните. (От друга страна, начален период с няколко първоначални повреди може да изкриви данните отрицателно.)