Дундаж тооцох хувьсагчдын хоорондын хамаарлыг гажуудуулдаг Гэхдээ дундаж тооцоолол нь олон хувьсагчийн хамаарлыг алдагдуулж, хамаарал зэрэг статистикт нөлөөлдөг. Жишээлбэл, PROC CORR руу залгах дараах дуудлага нь Orig_Height хувьсагч болон Жин ба Насны хувьсагчдын хоорондын хамаарлыг тооцоолдог.
Яагаад дутуу өгөгдөлд дундаж утга хэрэглэх нь муу санаа вэ?
Дундаж нь өгөгдлийн хэлбэлзлийг багасгадаг Математик руу гүнзгий ороход бага хэлбэлзэл нь магадлалын тархалтын итгэлийн интервалыг нарийсгахад хүргэдэг[3]. Энэ нь манай загварт өрөөсгөл ойлголт өгөхөөс өөр зүйлд хүргэхгүй.
Яагаад утга дутагдаж байна вэ?
Дутуу өгөгдөл нь янз бүрийн асуудал үүсгэдэг. Нэгдүгээрт, өгөгдөл байхгүй байгаа нь статистикийн хүчийг бууруулдаг бөгөөд энэ нь тест нь худал үед тэг таамаглалыг үгүйсгэх магадлалыг илэрхийлдэг. Хоёрдугаарт, алдагдсан өгөгдөл нь параметрийн үнэлгээнд гажуудал үүсгэдэг. Гуравдугаарт, энэ нь дээжийн төлөөллийг бууруулж чадна.
Яагаад муу үнэлгээ муу байдаг вэ?
Асуудал №1: Дундаж тооцоо нь хувьсагчдын хоорондын хамаарлыг хадгалахгүй. Үнэн, дундажийг тооцох нь ажиглагдсан өгөгдлийн дундажийг хадгалдаг. Тиймээс хэрэв өгөгдөл санамсаргүй байдлаар бүрэн дутуу байвал дундаж утгын тооцооллыг нэг талыг барьсан хэвээр байна.
Та дутуу өгөгдлийг дундажаар солих уу?
Өгөгдлийн хэтийн цэгүүд нь дундаж үзүүлэлтэд чухал нөлөө үзүүлэх тул ийм тохиолдолд дутуу утгыг орлуулахын тулд дундаж утгыг ашиглахыг зөвлөдөггүй. Алга болсон утгыг орлуулахын тулд дундаж утгыг ашиглах нь гайхалтай загвар үүсгэхгүй байж болзошгүй тул үүнийг үгүйсгэх болно.