Performing Sequence Labelling using CRF in Python 2018-06-29T16:52:08+00:00

Project Description

Performing Sequence Labelling using CRF in Python

Sequence Labelling คือ การกำกับชื่อหรือชนิดให้กับคำในข้อความ ซึ่งในบทความนี้จะอธิบายถึงขั้นตอนในการทำ Sequence Labelling โดยใช้แบบจำลอง Conditional Random Fields (CRF) ด้วยภาษา Python ดังนี้

1. อธิบายการทำ Sequence Labelling โดยยกตัวอย่างด้วยการระบุชื่อเฉพาะ (Named Entity Recognition) ซึ่งประกอบด้วย 3 ขั้นตอนสำคัญ ได้แก่ การสร้าง Feature การสร้างโมเดล (Training model) และ การวัดผลประสิทธิภาพ

2. Library สำหรับแบบจำลอง Conditional Random Fields (CRF) ที่ใช้ในบทความนี้ คือ pycrfsuite ใน nltk library ซึ่งเป็นการนำ CRFSuite (ref. http://www.chokkan.org/software/crfsuite/) มาเขียนด้วยภาษา Python

และสามารถเข้าไปอ่านบทความ “Performing Sequence Labelling using CRF in Python”
เพิ่มเติม ได้ที่ Link