ควรใช้การถือครองเมื่อใด

ควรใช้การถือครองเมื่อใด
ควรใช้การถือครองเมื่อใด
Anonim

ชุดโฮลด์คืออะไร? บางครั้งเรียกว่าข้อมูล "การทดสอบ" ชุดย่อยที่ระงับจะมี ประมาณประสิทธิภาพของโมเดลแมชชีนเลิร์นนิงขั้นสุดท้ายหลังจากที่ได้รับการฝึกอบรมและตรวจสอบแล้ว ไม่ควรใช้ชุด Holdout เพื่อตัดสินใจว่าจะใช้อัลกอริธึมใด หรือเพื่อปรับปรุงหรือปรับแต่งอัลกอริธึม

การตรวจสอบความถูกต้องดีกว่าการถือครองหรือไม่

การตรวจสอบแบบไขว้มักจะเป็นวิธีที่แนะนำ เพราะจะทำให้โมเดลของคุณมีโอกาสฝึกฝนในการทดสอบหลาย ๆ ทางแยก สิ่งนี้ช่วยให้คุณบ่งชี้ได้ดีขึ้นว่าแบบจำลองของคุณจะทำงานได้ดีเพียงใดกับข้อมูลที่มองไม่เห็น ในทางกลับกัน การพักรถขึ้นอยู่กับการแยกการทดสอบรถไฟเพียงครั้งเดียว

วิธีระงับคืออะไร

วิธีการพักสายคือ วิธีที่ง่ายที่สุดในการประเมินตัวแยกประเภท ในวิธีนี้ ชุดข้อมูล (ชุดของรายการข้อมูลหรือตัวอย่าง) จะถูกแยกออกเป็นสองชุด เรียกว่า ชุดการฝึก และ ชุดทดสอบ ตัวแยกประเภททำหน้าที่กำหนดรายการข้อมูลในคอลเล็กชันที่กำหนดให้กับหมวดหมู่เป้าหมายหรือคลาส

ฉันควรตรวจสอบความถูกต้องเสมอหรือไม่

โดยทั่วไปการตรวจสอบข้ามคือ จำเป็นเสมอเมื่อคุณต้องการกำหนดพารามิเตอร์ที่เหมาะสมที่สุดของโมเดล สำหรับการถดถอยโลจิสติก ค่านี้คือพารามิเตอร์ C

ประโยชน์ของการตรวจสอบไขว้ K-fold คืออะไร

ถ้าคุณเปรียบเทียบการทดสอบ MSE จะดีกว่าในกรณีของ k-fold CV มากกว่า LOOCV ประวัติย่อ k-fold หรือ CV หรือวิธีการสุ่มตัวอย่างใด ๆ ไม่ได้ปรับปรุงข้อผิดพลาดในการทดสอบ พวกเขาประเมินข้อผิดพลาดในการทดสอบ ในกรณี k-fold มัน การประเมินข้อผิดพลาดได้ดีกว่า LOOCV.