Natural Language Processing (NLP) Techniques for Extracting Information 2018-07-04T18:08:43+00:00

Project Description

Natural Language Processing (NLP) Techniques for Extracting Information

อธิบายการสกัดสารสนเทศ (Information Extraction) โดยใช้เทคนิคการประมวลผลภาษาธรรมชาติ (Natural Language Processing or NLP)
ซึ่งประกอบด้วย 2 หลักการที่สำคัญ ดังนี้

1. การเตรียมข้อความ ซึ่งถือเป็นขั้นตอนแรกและสำคัญที่สุดสำหรับงาน NLP โดยนำข้อความมาผ่านกระบวนการต่างๆ
เช่น การตัดคำ การจัดกลุ่มวลี การกำกับโครงสร้างไวยากรณ์ การระบุชนิดของคำ (Part-Of-Speech Tagging) เป็นต้น
ซึ่งมีเป้าหมาย คือ ต้องการเปลี่ยนข้อความให้อยู่ในรูปแบบที่สามารถนำไปใช้ในการวิเคราะห์ เพื่อหาความหมายของคำหรือกลุ่มคำที่จะทำให้เกิดความเข้าใจในข้อความมากขึ้น

2. การกำหนดเป้าหมายของการสกัดสารสนเทศ ซึ่งมี 2 ประเภท ได้แก่

  2.1 Macro Understanding คือ เพื่อเข้าใจข้อความโดยรวม ซึ่งจะใช้เทคนิคทางสถิติ เช่น การจัดกลุ่มข้อความ การวิเคราะห์ประเด็นสำคัญ การสรุปความ เป็นต้น

  2.2 Micro Understanding คือ เพื่อสกัดหาความหมายหรือความสัมพันธ์จากข้อความ ซึ่งจะใช้เทคนิคทาง NLP เช่น การสกัดหาความสัมพันธ์ (Relation Extraction)

และสามารถเข้าไปอ่านบทความ “Natural Language Processing (NLP) Techniques for Extracting Information” โดย Paul Nelson Manning
เพิ่มเติม ได้ที่ Link