บทความ 2017-12-22T12:40:13+00:00

บทความ

ความยากของการพัฒนา TEXT ANALYTICS ภาษาไทย #1

พฤศจิกายน 23rd, 2017|Articles|

ความยากของการพัฒนา Text Analytics ภาษาไทย #1 อะไรคือความท้าทายในการวิเคราะห์ข้อความภาษาไทย ทำไมเราไม่สามารถตามทันนวัตกรรมต่างชาติได้ ?

การรู้จำชื่อเฉพาะภาษาไทย (Thai Named Entity Recognition) #1

พฤศจิกายน 23rd, 2017|Articles|

การรู้จำชื่อเฉพาะภาษาไทย (Thai Named Entity Recognition) #1 Named Entity Recognition หรือ NER คืออะไร ทำไมเทคนิคนี้ถึงมีความสำคัญในการวิเคราะห์ข้อความภาษาไทย และจะนำมาประยุกต์ใช้ในงานลักษณะใดได้บ้าง

ทำไมต้อง WORD2VEC?

พฤศจิกายน 23rd, 2017|Articles|

ทำไมต้อง WORD2VEC? ข้อความตัวอักษร (Text) นั้นไม่สามารถวิเคราะห์ได้เหมือนข้อมูล (data) ทั่วไป (เช่น Numerical data, Classical data เป็นต้น) ทั้งที่ตัวอักษรเหล่านี้คือแหล่งข้อมูลชั้นดีที่สามารถจะนำมาวิเคราะห์ได้หลายมุมมอง ดังนั้น จะดีแค่ไหนถ้าเราสามารถก้าวผ่านข้อจำกัดเดิมๆแล้วสามารถนำตัวอักษรมาวิเคราะห์ร่วมกับ typical data ได้โดยที่ความหมายหรือนัยสำคัญที่แฝงอยู่ในตัวอักษรนั้นไม่หายไประหว่างถูกกลั่นกรองหรือแปรรูปไปให้เป็นข้อมูลชนิดเดียวกับ typical data เพียงเท่านี้เราก็สามารถวิเคราะห์ข้อมูลที่แฝงอยู่ในรูปของตัวอักษรที่ประกอบกันเป็นคำหลายๆ คำ จนกลายเป็นข้อความประโยค หรือแม้กระทั่งเรียงความได้แล้ว (ในบทความนี้ขอกล่าวถึงการวิเคราะห์คำเท่านั้น) คำถามต่อมาคือ “เราสามารถแปรรูปคำให้กลายเป็นตัวเลขได้อย่างไร? ผู้ที่คิด Word2Vec ขึ้นมานั้นอาศัยแนวคิดเรื่อง neural [...]