ภาพกราฟิกแสดงลักษณะคำพูดของแต่ละบุคคลที่พิมพ์บนกระดาษ เรียกว่าเสียง เรียกอีกอย่างว่าสเปกโตรแกรมของเสียง ซึ่งใช้เพื่อระบุผู้พูด เนื่องจากรูปแบบคำพูดมีเอกลักษณ์เฉพาะตัว
ข้อมูลอะไรอยู่ในวอยซ์พริ้นท์
กำหนดเป็นลายเซ็นไบโอเมตริกซ์ เสียงพิมพ์สามารถใช้เพื่อ ระบุผู้พูดในเชิงบวกตามลักษณะทางกายภาพ คือการกำหนดค่าเฉพาะของช่องเสียง (คอ, กองทัพเรือ ฟันผุ และปาก) และข้อต่อ (ริมฝีปาก ฟัน ลิ้น และเพดานอ่อน)
พิมพ์เสียงในศาลได้ไหม
สเปกโตรแกรมของผู้พูดที่ไม่ระบุชื่อถูกเปรียบเทียบกับของผู้พูดที่ระบุเพื่อค้นหารูปแบบที่คล้ายกัน ศาลส่วนใหญ่ที่พิจารณาคำถามนั้นได้วินิจฉัยแล้วว่า หลักฐานการสั่งพิมพ์ด้วยเสียงเป็นที่ยอมรับ ดู United States v. … ปฏิเสธ 439 U. S. 1117 (1979).
เสียงพูดถูกสร้างขึ้นมาอย่างไร
ในการสร้างเสียงเฉพาะบุคคล ผู้ใช้ให้ตัวอย่างคำพูดสำหรับการลงทะเบียนอย่างน้อยหนึ่งตัวอย่างกับโมเดล DNN จากนั้น DNN จะได้รับการปรับแต่งอย่างละเอียดเพื่อเรียนรู้ลักษณะคำพูดที่เป็นเอกลักษณ์ของแต่ละคน กระบวนการสร้างแบบจำลอง DNN เกิดขึ้นโดยตรงกับตัวอย่างคำพูด (เช่น ไฟล์ WAV ดิบ) – ไม่จำเป็นต้องแยกคุณลักษณะ
การระบุด้วยเสียงทำงานอย่างไร
การจดจำเสียงทำงาน โดยการวิเคราะห์กว่า 100 ร่างกายและพฤติกรรมปัจจัยในการผลิตเสียงที่ไม่ซ้ำกันสำหรับแต่ละบุคคล. ปัจจัยเหล่านี้รวมถึงการออกเสียง การเน้น ความเร็วในการพูดและการเน้นเสียง ตลอดจนลักษณะทางกายภาพ เช่น ทางเดินเสียง ปาก และจมูก