Ангилал өгөгдөл нь хүйс, хүйс, боловсролын түвшин зэрэг тоон форматтай биш харин зүгээр л бүлэг болгон нэгтгэсэн мэдээлэл юм. Эдгээр нь бараг бүх бодит өгөгдлийн багцад байдаг боловч одоогийн алгоритмууд тэдгээрийг шийдвэрлэхэд бэрхшээлтэй хэвээр байна. Жишээлбэл, XGBoost эсвэл ихэнх SKlearn загваруудыг ав.
Ангилал өгөгдлийг юу тодорхойлдог вэ?
Категорийн өгөгдөл нь ангилсан хувьсагчид эсвэл тухайн хэлбэрт хөрвүүлсэн өгөгдлөөс бүрдэх статистик өгөгдлийн төрөл юм, жишээ нь бүлэглэсэн өгөгдөл.
Ангилал болон тоон өгөгдөл гэж юу вэ?
Тоон өгөгдлийг тоогоор илэрхийлсэн аливаа зүйлийг (хөвөгч цэг эсвэл бүхэл тоо) илэрхийлэхэд ашигладаг. Ангилал өгөгдөл нь ерөнхийдөө бусад бүх зүйлийг хэлдэг ба ялангуяа салангид гэсэн шошготой бүлгүүдийг ихэвчлэн дууддаг.
Категорийн өгөгдөл ба тасралтгүй өгөгдөл гэж юу вэ?
Категорийн хувьсагчид хязгаарлагдмал тооны категори эсвэл ялгаатай бүлгүүдийг агуулна … Үргэлжилсэн хувьсагчид нь дурын хоёр утгын хооронд хязгааргүй тооны утгатай тоон хувьсагчдыг хэлнэ. Тасралтгүй хувьсагч нь тоон эсвэл огноо/цаг байж болно. Жишээлбэл, нэг хэсгийн урт эсвэл төлбөр хүлээн авсан огноо, цаг.
Ангилал өгөгдлийн жишээ юу вэ?
Категорийн хувьсагч нь бүлэгт хуваагдаж болох өгөгдлийн төрлийг илэрхийлдэг. Ангилал хувьсагчийн жишээ бол арьсны өнгө, хүйс, насны бүлэг, боловсролын түвшин юм. … Үйл явдлын 8 өөр ангилал байдаг бөгөөд жинг тоон өгөгдөл болгон өгсөн.