การทำให้เป็นมาตรฐานมีประโยชน์ เมื่อข้อมูลของคุณมีขนาดแตกต่างกันและอัลกอริทึมที่คุณใช้ไม่ได้ตั้งสมมติฐานเกี่ยวกับการกระจายข้อมูลของคุณ เช่น k-เพื่อนบ้านที่ใกล้ที่สุดและประสาทเทียม เครือข่าย การกำหนดมาตรฐานจะถือว่าข้อมูลของคุณมีการกระจายแบบเกาส์เซียน (เส้นโค้งกระดิ่ง)
เราควรปรับข้อมูลให้เป็นมาตรฐานเมื่อใด
ข้อมูลควรถูกทำให้เป็นมาตรฐานหรือทำให้เป็นมาตรฐาน เพื่อนำตัวแปรทั้งหมดมารวมกันเป็นสัดส่วน ตัวอย่างเช่น หากตัวแปรหนึ่งมีขนาดใหญ่กว่าตัวแปรอื่น 100 เท่า (โดยเฉลี่ย) โมเดลของคุณอาจทำงานได้ดีขึ้นหากคุณทำให้เป็นมาตรฐาน/ทำให้ตัวแปรทั้งสองมีค่าเท่ากันโดยประมาณ
การทำให้เป็นมาตรฐานและการทำให้เป็นมาตรฐานต่างกันอย่างไร
Normalization โดยทั่วไปหมายถึงการปรับขนาดค่าใหม่ในช่วง [0, 1] การทำให้เป็นมาตรฐานมักจะหมายถึงการปรับขนาดข้อมูลใหม่ให้มี mean เป็น 0 และค่าเบี่ยงเบนมาตรฐานเป็น 1 (ความแปรปรวนของหน่วย)
เมื่อใดและเพราะเหตุใดเราจึงต้องการการปรับข้อมูลให้เป็นมาตรฐาน
ในแง่ที่ง่ายกว่า การทำให้เป็นมาตรฐานช่วยให้มั่นใจว่าข้อมูลทั้งหมดของคุณมีลักษณะและอ่านในลักษณะเดียวกันในระเบียนทั้งหมด Normalization จะสร้างมาตรฐานให้กับฟิลด์ต่างๆ รวมถึงชื่อบริษัท ชื่อผู้ติดต่อ URL ข้อมูลที่อยู่ (ถนน รัฐ และเมือง) หมายเลขโทรศัพท์ และตำแหน่งงาน
คุณเลือกการทำให้เป็นมาตรฐานและมาตรฐานอย่างไร
ในโลกธุรกิจ "การทำให้เป็นมาตรฐาน" โดยทั่วไปหมายความว่าช่วงของค่าคือ"ทำให้เป็นมาตรฐานจาก 0.0 to 1.0". "การทำให้เป็นมาตรฐาน" โดยทั่วไปหมายความว่าช่วงของค่าต่างๆ เป็น "ค่ามาตรฐาน" เพื่อวัดว่าค่าเบี่ยงเบนมาตรฐานมาจากค่าเฉลี่ยจำนวนเท่าใด