Өгөгдлийн багц дээрх хэт давчуу утгын хамгийн түгээмэл шалтгаанууд: Хэмжилтийн алдаа (хэрэгслийн алдаа) Туршилтын алдаа (өгөгдөл гарган авах эсвэл туршилтын төлөвлөлт/гүйцэтгэх алдаа) Санаатай (шалгах зорилгоор хийсэн хуурамч хэтийн үзүүлэлтүүд) илрүүлэх аргууд) Өгөгдөл боловсруулах алдаа (өгөгдлийн боловсруулалт эсвэл өгөгдлийн багцын төлөвлөөгүй мутаци)
Хэрэв хэтэрсэн үзүүлэлт гарах шалтгаан юу вэ?
Зөрчлийн гурван шалтгаан бий - өгөгдлийн оруулга/туршилтын хэмжилтийн алдаа, түүврийн асуудал, байгалийн өөрчлөлт. Туршилт хийх/өгөгдөл оруулах явцад алдаа гарч болно. Өгөгдөл оруулах явцад үсгийн алдаа нь буруу утгыг буруу бичиж болно.
Алинд нь хэт давсан үзүүлэлт хамгийн их нөлөөлдөг вэ?
Дунд, медиан болон горим нь төв хандлагын хэмжүүр юм. Дундаж нь төвлөрсөн чиг хандлагын цорын ганц хэмжүүр бөгөөд үргэлж давсан үзүүлэлтэд нөлөөлдөг. Дундаж, дундаж нь төв хандлагын хамгийн түгээмэл хэмжүүр юм.
Хүрээнд хэт давсан үзүүлэлт хамгийн их нөлөөлдөг үү?
Тиймээс хэрэв бидэнд {52, 54, 56, 58, 60} олонлог байвал бид r=60−52=8 гэсэн утгыг авна, тэгэхээр муж нь 8 байна. Бидний одоо мэдэж байгаа зүйлийг харгалзан үзэх нь зөв юм. хэт их үзүүлэлт нь гүйлтийн үзүүлэлтэд хамгийн их нөлөөлнө гэж хэлээрэй.
Өгөгдлөөс хэт давсан утгыг хасах ёстой юу?
Зөвхөн тодорхой шалтгааны улмаас хэт давсан үзүүлэлтийг хасах нь хууль ёсных юм Хэт хэтийн үзүүлэлтүүд нь тухайн сэдэв болон мэдээлэл цуглуулах үйл явцын талаар маш их мэдээлэлтэй байж болно. … Хэт өндөр үзүүлэлтүүд нь таны өгөгдлийн хэлбэлзлийг нэмэгдүүлж, статистикийн хүчийг бууруулдаг. Иймээс хэт давсан үзүүлэлтүүдийг хассанаар таны үр дүн статистикийн хувьд ач холбогдолтой болно.