โดยการรับรู้ชื่อนิติบุคคล?

สารบัญ:

โดยการรับรู้ชื่อนิติบุคคล?
โดยการรับรู้ชื่อนิติบุคคล?
Anonim

การจดจำชื่อเอนทิตีเป็นงานย่อยของการดึงข้อมูลที่พยายามค้นหาและจัดประเภทเอนทิตีที่มีชื่อที่กล่าวถึงในข้อความที่ไม่มีโครงสร้างเป็นหมวดหมู่ที่กำหนดไว้ล่วงหน้า เช่น ชื่อบุคคล องค์กร สถานที่ รหัสทางการแพทย์ การแสดงเวลา ปริมาณ การเงิน ค่า เปอร์เซ็นต์ ฯลฯ

การรู้จำชื่อนิติบุคคลทำอะไร

การรู้จำชื่อเอนทิตีคือ เทคนิคการประมวลผลภาษาธรรมชาติ ที่สามารถสแกนบทความทั้งหมดโดยอัตโนมัติและดึงเอนทิตีพื้นฐานบางอย่างในข้อความและจัดประเภทเป็นหมวดหมู่ที่กำหนดไว้ล่วงหน้า.

การรู้จำเอนทิตีชื่ออะไร อธิบายด้วยความช่วยเหลือของตัวอย่าง

การจดจำชื่อนิติบุคคล (NER) ช่วยให้คุณระบุองค์ประกอบหลักในข้อความได้อย่างง่ายดาย เช่น ชื่อบุคคล สถานที่ แบรนด์ มูลค่าทางการเงิน และอื่นๆ การแยกเอนทิตีหลักในข้อความช่วยจัดเรียงข้อมูลที่ไม่มีโครงสร้างและตรวจจับข้อมูลสำคัญ ซึ่งเป็นสิ่งสำคัญหากคุณต้องจัดการกับชุดข้อมูลขนาดใหญ่

การรู้จำชื่อที่ใช้อยู่ที่ไหน

การจดจำชื่อนิติบุคคลสามารถ สแกนบทความทั้งหมดโดยอัตโนมัติและเปิดเผยว่าคน องค์กร และสถานที่ใดที่พูดคุยกันในนั้น การรู้จักแท็กที่เกี่ยวข้องสำหรับแต่ละบทความช่วยในการจัดหมวดหมู่บทความโดยอัตโนมัติในลำดับชั้นที่กำหนดไว้และช่วยให้ค้นพบเนื้อหาได้อย่างราบรื่น

คุณสร้างการจดจำเอนทิตีที่มีชื่อได้อย่างไร

  1. เพิ่มป้ายกำกับเอนทิตีใหม่ให้กับเอนทิตีตัวจำแนกลายมือโดยใช้วิธี add_label
  2. วนซ้ำตัวอย่างแล้วโทร nlp update ซึ่งทำตามขั้นตอนของคำที่ป้อน ในแต่ละคำก็จะทำการทำนาย …
  3. บันทึกโมเดลที่ฝึกโดยใช้ nlp to_disk.
  4. ทดสอบโมเดลเพื่อให้แน่ใจว่ารู้จักเอนทิตีใหม่อย่างถูกต้อง