Knowledge: ธันวาคม 2019

"แล้ว ASR คืออะไร"

ASR ย่อมาจาก Automatic Speech Recognition หรือเรียกภาษาไทยว่า เทคโนโลยีรู้จำด้วยเสียง
เพื่อให้คอมพิวเตอร์เข้าใจว่าที่เราพูดไปนั้นคือคำว่าอะไรนั่นเอง ตัวอย่างตามวีดีโอด้านล่างครับ

จากวีดีโอจะเห็นว่าจะเป็นการทำ ASR เพื่อให้คอมพิวเตอร์เข้าใจว่าถ้าพูดว่า "โดด" คอมจะเข้าใจว่าโอเคให้ ไดโนเสาร์กระโดด แต่ถ้าพูดว่า "หมอบ" คอมจะเข้าใจว่าให้ไดโนเสาร์หมอบ ซึ่งจะเห็นว่าในขั้นตอนการทำนั้นจำเป็นทีจะต้อง Train คอมให้เข้าใจคำว่าโดด กับหมอบก่อน โดยในตัวอย่างวีดีโอจะทำการนำไฟล์เสียงหมอบและไฟล์เสียงโดดทำการ Train ด้วย Model ที่ชื่อว่า Hidden Markov Model
เพื่อทำการรู้จำเสียง ซึ่งหากใครสนใจโคดหรือหลักการทำงานสามารถโหลดได้ดังนี้ครับ

Source code link: https://github.com/CakeNuthep/ASR-COMMAND

หลักการทำงาน
จะเป็นวีดีโอการสอนของอาจารย์ที่จุฬาลงกรณ์มหาวิทยาลัย ดังนี้ครับ

2110432 ASR L1 Introduction