การจัดกลุ่มตามลำดับชั้นเป็นวิธีที่ได้รับความนิยมและใช้กันอย่างแพร่หลาย เพื่อวิเคราะห์ข้อมูลเครือข่ายโซเชียล ในวิธีนี้ โหนดจะถูกเปรียบเทียบโดยพิจารณาจากความคล้ายคลึงกัน กลุ่มที่ใหญ่ขึ้นถูกสร้างขึ้นโดยการรวมกลุ่มของโหนดตามความคล้ายคลึงกัน
เมื่อใดควรใช้การจัดกลุ่มแบบลำดับชั้นกับ K หมายถึง
การจัดกลุ่มแบบลำดับชั้นคือชุดของคลัสเตอร์ที่ซ้อนกันซึ่งจัดเรียงเป็นต้นไม้ พบว่าการจัดกลุ่ม K หมายถึงทำงานได้ดี เมื่อโครงสร้างของกระจุกเป็นไฮเปอร์ทรงกลม (เช่น วงกลมใน 2 มิติ ทรงกลมใน 3 มิติ) การจัดกลุ่มแบบลำดับชั้นไม่ทำงานเช่นกัน k หมายถึงเมื่อรูปร่างของกลุ่มเป็นแบบไฮเปอร์ทรงกลม
ฉันควรใช้การจัดกลุ่มแบบลำดับชั้นเมื่อใด
การจัดกลุ่มตามลำดับชั้นเป็นเทคนิคที่มีประสิทธิภาพที่ ช่วยให้คุณสร้างโครงสร้างต้นไม้จากความคล้ายคลึงของข้อมูล ตอนนี้คุณสามารถดูว่าคลัสเตอร์ย่อยต่างๆ เกี่ยวข้องกันอย่างไร และจุดข้อมูลห่างกันเพียงใด
เมื่อไรคุณจะไม่ใช้การจัดกลุ่มแบบลำดับชั้น
จุดอ่อนคือมันไม่ค่อยให้วิธีแก้ปัญหาที่ดีที่สุด มันเกี่ยวข้องกับการตัดสินใจโดยอำเภอใจมากมาย มันทำ ไม่ทำงานกับข้อมูลที่ขาดหายไป มันทำงานได้ไม่ดีกับประเภทข้อมูลแบบผสม มัน ใช้งานไม่ได้กับชุดข้อมูลขนาดใหญ่มาก และมักจะตีความผลลัพธ์หลักคือ dendrogram
ประโยชน์ของการจัดกลุ่มตามลำดับชั้นคืออะไร
จุดแข็งของการจัดกลุ่มแบบลำดับชั้น
- มันคือเพื่อทำความเข้าใจและนำไปปฏิบัติ
- เราไม่ต้องระบุจำนวนคลัสเตอร์ล่วงหน้า …
- อาจสอดคล้องกับการจำแนกประเภทที่มีความหมาย
- เลือกจำนวนคลัสเตอร์ได้ง่ายเพียงแค่ดูที่ Dendrogram