การรู้จําเสียงไม่ใช่โซลูชันเดียวที่เหมาะกับทุกคน การรู้จําเสียงมีความแตกต่าง และประเภทของมันแตกต่างกันไปตามฟังก์ชันการทํางานที่หลากหลาย ฟังก์ชันต่างๆ ได้แก่ การระบุเสียงพูดและระบบจดจําผู้พูด ซอฟต์แวร์รู้จําเสียงที่หลากหลายตอบสนองความต้องการและการใช้งานที่แตกต่างกัน
การรู้จําเสียง 12 ประเภทแสดงอยู่ด้านล่าง
- การรู้จําเสียงที่ขึ้นอยู่กับผู้พูด:ระบบการรู้จําเสียงที่ขึ้นอยู่กับผู้พูดจะเรียนรู้และปรับให้เข้ากับลักษณะเสียงที่เป็นเอกลักษณ์ของผู้ใช้แต่ละคน
- การรู้จําเสียงที่ไม่ขึ้นกับผู้พูด:ระบบการรู้จําเสียงที่ไม่ขึ้นกับผู้พูดเข้าใจและประมวลผลคําพูดจากผู้ใช้ทุกคนโดยไม่ต้องได้รับการฝึกอบรมล่วงหน้า
- การรู้จําเสียงอย่างต่อเนื่อง: ระบบการรู้จําเสียงอย่างต่อเนื่องประมวลผลและถอดเสียงคําพูดที่เป็นธรรมชาติและลื่นไหลได้อย่างแม่นยํา
- การรู้จําเสียงแบบแยกส่วน:ระบบการรู้จําเสียงแบบแยกส่วนต้องการให้ผู้ใช้พูดคําแยกกันโดยมีการหยุดชั่วคราวระหว่างนั้นเพื่อการจดจําที่แม่นยํา
- คําศัพท์ขนาดใหญ่ การรู้จําเสียงอย่างต่อเนื่อง (LVCSR):คําศัพท์ขนาดใหญ่ ระบบการรู้จําเสียงอย่างต่อเนื่อง (LVCSR) ประมวลผลและทําความเข้าใจคําพูดด้วยคําศัพท์ที่หลากหลายในการไหลเวียนตามธรรมชาติ
- การรู้จําเสียงคําสั่งและควบคุม: ระบบการรู้จําเสียงคําสั่งและควบคุมจะจดจําคําสั่งเสียงเฉพาะและดําเนินการหรือการควบคุมที่เกี่ยวข้อง
- Natural Language Processing (NLP)-Enhanced Speech Recognition:Natural Language Processing (NLP)-Enhanced Speech Recognition systems ตีความและวิเคราะห์ภาษาพูดโดยใช้เทคนิค NLP ขั้นสูง
- การรู้จําเสียงในระยะไกล:ระบบการรู้จําเสียงในระยะไกลจะจับและประมวลผลคําพูดได้อย่างแม่นยําจากระยะไกล
- การรู้จําเสียงใกล้: ระบบการรู้จําเสียงใกล้มีความเชี่ยวชาญในการประมวลผลคําพูดอย่างแม่นยําจากระยะใกล้
- การรู้จําเสียงแบบฝังตัวและบนคลาวด์:ระบบการรู้จําเสียงแบบฝังตัวทํางานในเครื่องบนอุปกรณ์ประมวลผลคําสั่งเสียงโดยไม่ต้องใช้การเชื่อมต่ออินเทอร์เน็ต
- การรู้จําเสียงโดยใช้การเรียนรู้เชิงลึก: ระบบการรู้จําเสียงโดยใช้การเรียนรู้เชิงลึกใช้โครงข่ายประสาทเทียมขั้นสูงเพื่อวิเคราะห์และตีความคําพูดของมนุษย์ด้วยความแม่นยําสูง
- ระบบไฮบริด:ระบบไฮบริดผสมผสานจุดแข็งของเทคโนโลยีการรู้จําเสียงต่างๆ เพื่อเพิ่มความแม่นยําและประสิทธิภาพ
1. การรู้จําเสียงที่ขึ้นอยู่กับผู้พูด
การรู้จําเสียงพูดที่ขึ้นอยู่กับผู้พูดปรับให้เหมาะกับเสียงของผู้ใช้โดยเฉพาะ ทําให้สามารถถอดเสียงแบบเรียลไทม์ได้อย่างแม่นยํา คุณสมบัติหลักของการรู้จําเสียงที่ขึ้นอยู่กับผู้พูด ได้แก่ อัตราความแม่นยําสูงและโปรไฟล์เสียงที่กําหนดเอง ข้อเสียที่อาจเกิดขึ้นคือการลงทุนเวลาเริ่มต้นสําหรับการฝึกอบรมระบบแม้จะมีความแม่นยําที่น่าประทับใจก็ตาม
ประเภทที่ขึ้นอยู่กับลําโพงให้ความแม่นยําที่เหนือกว่า แต่มีความยืดหยุ่นน้อยกว่าเมื่อเทียบกับการรู้จําเสียงพูดที่ไม่ขึ้นกับผู้พูด เหมาะอย่างยิ่งสําหรับมืออาชีพที่ต้องการการถอดเสียงที่แม่นยําการรู้จําเสียงที่ขึ้นอยู่กับผู้พูดไม่เหมาะสําหรับการใช้งานทั่วไป
2. การรู้จําเสียงที่ไม่ขึ้นกับผู้พูด
การรู้จําเสียงที่ไม่ขึ้นกับผู้พูดจะเข้าใจเสียงใดๆ โดยไม่ต้องปรับแต่งเฉพาะผู้ใช้ คุณสมบัติหลักของการรู้จําเสียงพูดที่ไม่ขึ้นกับผู้พูด ได้แก่ การใช้งานและการปรับตัวที่หลากหลาย การรู้จําเสียงพูดที่ไม่ขึ้นกับผู้พูดประนีประนอมกับความแม่นยําเมื่อเทียบกับระบบที่ขึ้นอยู่กับผู้พูด
ผู้ใช้แนะนําการรู้จําเสียงที่ไม่ขึ้นกับผู้พูดสําหรับแอปพลิเคชันที่ต้องการการจดจําเสียงขนาดใหญ่ เช่น บอทบริการลูกค้าหรืออุปกรณ์ในครัวเรือนที่สั่งงานด้วยเสียง
3. การรู้จําเสียงอย่างต่อเนื่อง
การรู้จําเสียงอย่างต่อเนื่องซึ่งแตกต่างจากระบบอื่น ๆ ช่วยให้ผู้ใช้สามารถพูดได้อย่างเป็นธรรมชาติและคล่องแคล่วโดยจดจําประโยคแทนที่จะเป็นคําที่แยกจากกัน คุณสมบัติที่โดดเด่นคือความสามารถในการถอดรหัสคําพูดที่เชื่อมต่อ ส่งเสริมประสบการณ์ที่ใช้งานง่ายและเป็นมิตรกับผู้ใช้ ความแม่นยําของการรู้จําเสียงอย่างต่อเนื่องจะสะดุดเมื่อคําพูดที่ทับซ้อนกัน แม้ว่าจะสะท้อนการสนทนาของมนุษย์ได้ดีกว่า
การรู้จําเสียงอย่างต่อเนื่องให้การโต้ตอบแบบออร์แกนิกมากขึ้นซึ่งตรงกันข้ามกับการรู้จําเสียงพูดที่ไม่ขึ้นกับผู้พูด แต่อาจประสบปัญหากับความแม่นยําในสภาพแวดล้อมที่มีเสียงดัง การรู้จําเสียงอย่างต่อเนื่องเหมาะอย่างยิ่งสําหรับบริการถอดเสียง และยอดเยี่ยมในสถานการณ์ที่การสนทนาที่เป็นธรรมชาติและลื่นไหลเป็นกุญแจสําคัญ เช่น การเขียนตามคําบอกหรือการถอดเสียงการประชุม
4. การรู้จําเสียงแบบไม่ต่อเนื่อง
การรู้จําเสียงแบบแยกส่วนกําหนดให้ผู้ใช้หยุดชั่วคราวระหว่างคํา ซึ่งจะช่วยเพิ่มความแม่นยําในการจดจํา เทคโนโลยีที่มีคุณสมบัติหลากหลายนี้มีความเป็นเลิศในงานต่างๆ เช่น ระบบสั่งการด้วยเสียง แม้ว่าจะต้องแลกกับการไหลเวียนของการสนทนาตามธรรมชาติก็ตาม การรู้จําเสียงแบบแยกส่วนให้ความรู้สึกใช้งานง่ายน้อยกว่าซึ่งแตกต่างจากการรู้จําเสียงต่อเนื่อง แต่ความแม่นยําในการตีความคําสั่งนั้นเหนือกว่า ผู้ใช้แนะนําประเภทการจดจําสําหรับงานที่ให้ความสําคัญกับความแม่นยํามากกว่าความลื่นไหล เช่น แอปพลิเคชันคําสั่งเสียง
5. คําศัพท์ขนาดใหญ่การรู้จําเสียงต่อเนื่อง (LVCSR)
การรู้จําเสียงต่อเนื่องคําศัพท์ขนาดใหญ่ (LVCSR) เป็นเทคโนโลยีที่ทรงพลังที่โดดเด่นในด้านขอบเขตคําศัพท์ที่กว้างขวาง LVCSR มีความเป็นเลิศในการตีความภาษาธรรมชาติที่ซับซ้อน ทําให้เป็นตัวเลือกที่เหนือกว่าสําหรับการใช้งาน LVCSR ต่อสู้กับความแม่นยําท่ามกลางเสียงรบกวนรอบข้าง เช่น การรู้จําเสียงอย่างต่อเนื่อง
LVCSR เหนือการรู้จําเสียงแบบแยกส่วนโดยอํานวยความสะดวกในประสบการณ์การสนทนาที่ราบรื่น ซึ่งเหมาะสําหรับบริการถอดความ ผู้ใช้มักแนะนํา LVCSR สําหรับการวิจัยทางวิชาการ สื่อ และบริการด้านกฎหมาย เนื่องจากความสามารถที่เหนือกว่าในการตีความภาษาที่ซับซ้อน
6. สั่งการและควบคุมการรู้จําเสียง
การรู้จําเสียงด้วยคําสั่งและการควบคุม (C&C) มีความเป็นเลิศในการดําเนินการที่แม่นยําผ่านคําสั่งเสียง ทําให้เป็นเครื่องมือในแอปพลิเคชันแบบแฮนด์ฟรีและการเข้าถึง ข้อได้เปรียบที่สําคัญของ C&CSR คือความสามารถในการใช้งานอุปกรณ์โดยไม่ต้องมีการแทรกแซงด้วยตนเอง อาจสะดุดในการทําความเข้าใจภาษาที่ซับซ้อนเมื่อเทียบกับคําศัพท์ขนาดใหญ่การรู้จําเสียงอย่างต่อเนื่อง (LVCSR) การรู้จําเสียง C&C เหมาะที่สุดสําหรับอุตสาหกรรมต่างๆ เช่น ยานยนต์ ระบบ SMART บ้าน และเทคโนโลยีช่วยเหลือ
7. Natural Language Processing (NLP)-Enhanced Speech Recognition
การรู้จําเสียงที่ได้รับการปรับปรุง Natural Language Processing (NLP) ช่วยยกระดับประสบการณ์ของผู้ใช้โดยการทําความเข้าใจและตีความภาษามนุษย์ในลักษณะตามบริบท การรู้จําเสียงที่ได้รับการปรับปรุง NLPเจริญรุ่งเรืองในการทําความเข้าใจความแตกต่างของการสนทนาของมนุษย์ซึ่งแตกต่างจากการรู้จําเสียงสั่งการและควบคุม (C&C)
จุดแข็งหลักของการรู้จําเสียงที่ได้รับการปรับปรุง Natural Language Processing (NLP) อยู่ที่ความเข้าใจตามบริบทที่เหนือกว่า ซึ่งช่วยเพิ่มการโต้ตอบของผู้ใช้ ข้อเสียคือความต้องการพลังการคํานวณสูงที่เพิ่มขึ้น อุตสาหกรรมที่การตีความการสนทนาแบบมนุษย์เป็นสิ่งสําคัญได้รับประโยชน์จาก NLP-Enhanced Speech Recognition
8. การรู้จําเสียงในระยะไกล
Far-Field Speech Recognition (FFSR) ประมวลผลคําพูดจากระยะไกล จึงเหมาะอย่างยิ่งสําหรับระบบในบ้านและห้องประชุมSMART ข้อได้เปรียบที่สําคัญของ Far-Field Speech Recognition คือความสามารถในการตรวจจับคําพูดท่ามกลางเสียงรบกวนรอบข้าง ซึ่งเป็นคุณสมบัติที่ทําให้แตกต่างจากการรู้จําเสียงพูดของ Command and Control (C&C)
FFSR มีปัญหากับความแม่นยําในการตีความเมื่อผู้พูดอยู่ห่างไกล FFSR มีแอพพลิเคชั่นที่กว้างขึ้นโดยที่อุปกรณ์ไม่อยู่ใกล้กับผู้ใช้ในขณะที่ C&C เป็นเลิศในการรันคําสั่งโดยตรง ผู้ใช้แนะนําเทคโนโลยีนี้สําหรับสถานการณ์ที่ต้องการคําสั่งเสียงจากระยะไกล
9. การรู้จําเสียงใกล้สนาม
Near-Field Speech Recognition (NFSR) ปรับแต่งสําหรับการโต้ตอบในระยะใกล้ ซึ่งยอดเยี่ยมในการใช้งานที่ผู้พูดอยู่ห่างจากอุปกรณ์เพียงไม่กี่ฟุต จุดแข็งของ NFSR อยู่ที่การให้ความแม่นยําในการถอดความสูงเนื่องจากอยู่ใกล้กัน ประสิทธิภาพของ NFSR ลดลงในสถานการณ์ระยะไกล ซึ่งแตกต่างจากการรู้จําเสียงในระยะไกล NFSR มีประสิทธิภาพโดยเฉพาะอย่างยิ่งสําหรับผู้ใช้อุปกรณ์ส่วนบุคคล ซึ่งโดยทั่วไปแล้วผู้ใช้จะอยู่ใกล้กับอุปกรณ์
10. การรู้จําเสียงแบบฝังตัวและบนคลาวด์
ระบบรู้จําเสียงแบบฝังตัวและบนคลาวด์นําเสนอแอพพลิเคชั่นที่หลากหลายในอุปกรณ์และสภาพแวดล้อมต่างๆ ระบบฝังตัว Excel ในการดําเนินการแบบออฟไลน์ เพื่อให้มั่นใจถึงความเป็นส่วนตัวและความเร็ว พวกเขาอาจขาดความสามารถทางภาษามากมายจากระบบคลาวด์ ระบบคลาวด์ในขณะที่ต้องการการเชื่อมต่ออินเทอร์เน็ตมีความแม่นยําที่เหนือกว่าจากฐานข้อมูลภาษาที่กว้างขวาง
ระบบการรู้จําเสียงบนคลาวด์เฟื่องฟูทั้งในสถานการณ์ใกล้และไกลซึ่งตรงกันข้ามกับ NFSR เทคโนโลยีทั้งสองนี้เหมาะสําหรับผู้ใช้ที่จัดลําดับความสําคัญของการดําเนินการแบบออฟไลน์หรือการสนับสนุนภาษาที่กว้างขึ้น
11. การรู้จําเสียงตามการเรียนรู้เชิงลึก
การรู้จําเสียงที่ใช้การเรียนรู้เชิงลึกใช้พลังของปัญญาประดิษฐ์เพื่อปรับปรุงความแม่นยําในการถอดเสียง การรู้จําเสียงที่ใช้การเรียนรู้เชิงลึกใช้ประโยชน์จากฐานข้อมูลภาษาที่กว้างขวาง เทคโนโลยีการรู้จําเสียงนี้ เฟื่องฟูในสภาพแวดล้อมที่มีภาษาถิ่นและสําเนียงที่หลากหลาย จึงเหมาะอย่างยิ่งสําหรับองค์กรที่เกี่ยวข้องกับลูกค้าที่หลากหลายทางวัฒนธรรม
12. ระบบไฮบริด
ระบบไฮบริดใช้วิธีการโครงข่ายประสาทเทียม (NN) เพื่อให้การถอดความที่แม่นยําและมีคุณภาพสูง ระบบเหล่านี้รวมข้อดีของการรู้จําเสียงทั้งแบบฝังตัวและการเรียนรู้เชิงลึกส่งผลให้เกิดความสมดุลที่ราบรื่นระหว่างการทํางานแบบออฟไลน์และความสามารถทางภาษา ความซับซ้อนของระบบไฮบริดนําไปสู่ความต้องการในการคํานวณที่สูงขึ้นเมื่อเทียบกับประเภทอื่นๆ ระบบไฮบริดเจริญรุ่งเรืองในด้านความหลากหลายทางภาษา ทําให้เหมาะสําหรับอุตสาหกรรมที่มีฐานผู้ใช้ที่หลากหลายทางวัฒนธรรม
การรู้จําเสียงคืออะไร?
การรู้จําเสียงเป็นความก้าวหน้าพื้นฐานที่ยังคงกําหนดภูมิทัศน์ของการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ การรู้จําเสียงทํางานโดยการแปลภาษาพูดเป็นข้อความที่เป็นลายลักษณ์อักษร เทคโนโลยีนี้มีความสําคัญในหลายด้าน ช่วยเพิ่มประสิทธิภาพและประสิทธิผล ตัวอย่างเช่น การรู้จําเสียงช่วยแพลตฟอร์มการถอดความออนไลน์ เช่น Transkriptorโดยอนุญาตให้แปลงคําพูดเป็นข้อความแบบเรียลไทม์
การรู้จําเสียงช่วยให้สามารถโทรออกและค้นหาด้วยเสียงในโดเมนการบริการลูกค้า การ รู้จําเสียงทําหน้าที่เป็น เครื่องมือที่มีคุณค่าสําหรับการเข้าถึง โดยนําเสนอวิธีการสื่อสารทางเลือกสําหรับผู้ที่มีความพิการ ผู้ใช้สามารถมีส่วนร่วมกับเทคโนโลยีแบบแฮนด์ฟรีโดยใช้ระบบการรู้จําเสียง
การรู้จําเสียงประเภทใดที่มักใช้ในชีวิตประจําวัน
การรู้จําเสียงพูดสองประเภทมักใช้เป็นประจําทุกวัน ประเภทรวมถึงแบบฝังตัวและบนคลาวด์ การรู้จําเสียงแบบฝังรวมอยู่ในอุปกรณ์ต่างๆ เช่น สมาร์ทโฟนและแล็ปท็อป ทําให้สามารถประมวลผลอินพุตเสียงในเครื่องได้
การรู้จําเสียงบนคลาวด์อาศัยการเชื่อมต่ออินเทอร์เน็ตและเซิร์ฟเวอร์ระยะไกลสําหรับการประมวลผล ผู้คนใช้การรู้จําเสียงทั้งสองรูปแบบในงานประจําวัน เช่น การออกคําสั่งเสียงบนอุปกรณ์และการโต้ตอบกับฝ่ายบริการลูกค้า
50% ของผู้คนใช้การค้นหาด้วยเสียงผ่านอุปกรณ์ส่วนตัวในเดือนที่แล้ว ซึ่งเน้นย้ําถึงความแพร่หลายและผลกระทบของเทคโนโลยีการรู้จําเสียงในชีวิตประจําวัน เทคโนโลยีนี้มักเกี่ยวข้องกับการผสมผสานระหว่างการจดจําเสียงอย่างต่อเนื่องของคําศัพท์ขนาดใหญ่ (LVCSR) การรู้จําเสียงที่ปรับปรุง Natural Language Processing (NLP) และการรู้จําเสียงตามการเรียนรู้เชิงลึกเพื่ออํานวยความสะดวกในการค้นหาเสียงที่แม่นยํา
การรู้จําเสียงประเภทใดที่ไม่ค่อยได้ใช้?
การรู้จําเสียงประเภทหนึ่งที่ไม่ค่อยได้ใช้คือการรู้จําเสียงแบบแยกส่วน ซึ่งเกี่ยวข้องกับการป้อนคําหรือวลีที่แยกจากกัน แอปพลิเคชันเฉพาะ เช่น ซอฟต์แวร์ถอดความทางการแพทย์หรือระบบควบคุมคําสั่ง มักใช้การรู้จําเสียงประเภทนี้
ซอฟต์แวร์การรู้จําเสียงใดดีที่สุดสําหรับนักเขียน
ซอฟต์แวร์รู้จําเสียงที่ดีที่สุด สําหรับนักเขียนคือ Transkriptor. Transkriptor ปรับปรุงกระบวนการถอดความด้วยความแม่นยําที่น่าประหลาดใจ เวลาตอบสนองที่รวดเร็ว และการผสานรวม AI ที่ราบรื่นTranskriptor ไม่มีใครเทียบได้ไม่ว่าผู้ใช้จะจดความคิดที่เกิดขึ้นเองหรือถอดเสียงบทสัมภาษณ์ที่ยาวเหยียด อัลกอริทึมขั้นสูงของ Transkriptor ช่วยให้มั่นใจได้ถึงความแม่นยําสูง ซึ่งช่วยลดความจําเป็นในการแก้ไขที่ใช้เวลานาน
การใช้งานของการรู้จําเสียงประเภทต่างๆ มีอะไรบ้าง?
ต่อไปนี้เป็นแอปพลิเคชั่นทั่วไปบางส่วนของการรู้จําเสียง
- การดูแลสุขภาพ:ผู้เชี่ยวชาญทางการแพทย์ใช้เทคโนโลยีการจดจําเสียงสําหรับการถอดความทางการแพทย์และการรวบรวมข้อมูลผู้ป่วย
- โทรคมนาคม: การรู้จําเสียงช่วยให้สามารถโทรออกด้วยเสียงและบริการลูกค้าอัตโนมัติเพิ่มความสะดวกสบายและปรับปรุงประสบการณ์ของลูกค้า
- อุตสาหกรรมยานยนต์:การรู้จําเสียงขับเคลื่อนระบบควบคุมแบบแฮนด์ฟรีสําหรับการนําทางและความบันเทิง ช่วยให้ผู้ขับขี่มีสมาธิในขณะที่เข้าถึงคุณสมบัติต่างๆ
- ระบบอัตโนมัติภายในบ้าน: การรู้จําเสียงช่วยให้สามารถควบคุมด้วยเสียง SMART อุปกรณ์ในบ้านทําให้ควบคุมไฟเทอร์โมสตัทได้อย่างง่ายดาย
- การเขียน:บริการรู้จําเสียงเช่น Transkriptor ช่วยนักเขียนด้วยการถอดเสียงที่ถูกต้องและมีประสิทธิภาพประหยัดเวลาและเพิ่มประสิทธิภาพการทํางาน
- กฎหมาย: เทคโนโลยีการรู้จําเสียงช่วยในการถอดเสียงประจักษ์พยาน การสัมภาษณ์ และคดีในศาล เพื่อให้มั่นใจว่ามีบันทึกที่แม่นยําตลอดกระบวนการทางกฎหมาย
- การศึกษา:การรู้จําเสียงช่วยให้นักเรียนสามารถแปลงการบรรยายเป็นข้อความเพื่อความเข้าใจและแก้ไขที่ดีขึ้น
- คําบรรยาย:การรู้จําเสียงช่วยในการเขียนคําบรรยายแบบเรียลไทม์และคําบรรยายภาพช่วยเพิ่มการเข้าถึงสําหรับผู้ชมและเพิ่มการเพิ่มประสิทธิภาพกลไกค้นหา (SEO)
- การเงิน:การรู้จําเสียงช่วยเร่งกระบวนการจัดทําเอกสารธุรกรรมและการโต้ตอบกับลูกค้า
- การค้าปลีก:การรู้จําเสียงช่วยเพิ่มความคล่องตัวในการจัดการสินค้าคงคลังผ่านคลังสินค้าที่กํากับด้วยเสียง
อะไรคือความแตกต่างระหว่างการรู้จําเสียงและการป้อนตามคําบอก?
ความแตกต่างระหว่างการรู้จําเสียงและการป้อนตามคําบอกคือการรู้จําเสียงเข้าใจและดําเนินการตามคําสั่งที่พูดในขณะที่การเขียนตามคําบอกมุ่งเน้นไปที่การแปลงภาษาพูดเป็นข้อความที่เป็นลายลักษณ์อักษร ทั้งการรู้จําเสียงและการป้อนตามคําบอกเป็นเครื่องมือที่มีประสิทธิภาพในการถอดเสียงคําพูดเป็นข้อความ ซึ่งตอบสนองวัตถุประสงค์ที่แตกต่างกันโดยพื้นฐาน
เทคโนโลยีแบบโต้ตอบ เช่น ผู้ช่วยเสียงและการบริการลูกค้าอัตโนมัติมักใช้การรู้จําเสียงเพื่อทําความเข้าใจและตอบสนองต่อคําพูด การเขียนตามคําบอกเป็นสิ่งที่ล้ําค่าสําหรับทุกคนที่ต้องการบริการถอดความ เนื่องจากจะแปลงภาษาพูดเป็นข้อความที่เป็นลายลักษณ์อักษรเป็นหลัก การรู้จําเสียงจะตีความและตอบสนองต่อคําพูด ในขณะที่การเขียนตามคําบอกจะถอดเสียง