Машин сурах загвар нь бүх оролт, гаралтын хувьсагчдыг тоон шинж чанартай байхыг шаарддаг. Энэ нь хэрэв таны өгөгдөлд ангилсан өгөгдөл байгаа бол загварт тааруулж, үнэлэхийн өмнө үүнийг тоогоор кодлох ёстой … Машинд зориулсан категори өгөгдөлтэй ажиллахдаа кодчилол хийх шаардлагатай урьдчилсан боловсруулалтын алхам юм. сурах алгоритм.
Бид яагаад категори хувьсагчдыг кодлодог вэ?
Категорийн хувьсагч нь утгууд нь шошгоны утгыг авдаг хувьсагч юм. … Машин сургалтын алгоритмууд болон гүнзгий суралцах мэдрэлийн сүлжээнүүд нь оролт, гаралтын хувьсагчдыг тоо гэж шаарддаг. Энэ нь бид загварт тохирох, үнэлэхийн тулд ашиглахаас өмнө ангилсан өгөгдлийгтоогоор кодлох ёстой гэсэн үг юм.
Ангилал өгөгдөл яагаад хэрэгтэй вэ?
Ангилал болон тоон өгөгдөл нь өгөгдлийн үндсэн төрөл юм. Эдгээр өгөгдлийн төрлүүд нь ижил тооны дэд ангилалтай, тус бүр хоёртой байж болох ч олон ялгаатай байдаг. Эдгээр ялгаа нь тэдэнд өвөрмөц шинж чанаруудыг өгдөг бөгөөд энэ нь статистикийн шинжилгээнд адилхан хэрэгтэй. … Харьцуулбал ангилсан өгөгдөл нь чанарын өгөгдлийн төрөл юм.
Өгөгдлийн кодчилол яагаад хэрэгтэй вэ?
Та кодчлоход ашигласан алгоритмд хандах эрхгүй бол файлуудыг унших боломжгүй тул кодчилол нь таны өгөгдлийг аюулгүй байлгадаг. … Кодлогдсон өгөгдөл нь жижиг хэмжээтэй тул та хадгалах төхөөрөмждөө зай хэмнэх боломжтой байх ёстой. Хэрэв танд архивлах шаардлагатай их хэмжээний өгөгдөл байгаа бол энэ нь тохиромжтой.
Кодчлолын жишээ юу вэ?
Кодчилол нь бодлыг харилцаа холбоо болгон хувиргах үйл явц юм Кодлогч нь мессеж илгээхийн тулд утасны дуудлага, имэйл, мессеж, нүүр тулсан "дунд"-ыг ашигладаг. уулзалт эсвэл бусад харилцааны хэрэгсэл.… Жишээлбэл, та өлсөж байгаагаа мэдээд өрөөнийхөө найз руу илгээхийн тулд дараах мессежийг кодлож магадгүй: “Би өлсөж байна.