اكتشاف النشاط الصوتي: الفرق بين النسختين
المظهر
[نسخة منشورة] | [نسخة منشورة] |
تم حذف المحتوى تمت إضافة المحتوى
Sara Señorita (نقاش | مساهمات) إضافة مصادر ومراجع مع بوابات متصلة بالموضوع... |
|||
سطر 1: | سطر 1: | ||
{{يتيمة|تاريخ=مايو_2010}} |
{{يتيمة|تاريخ=مايو_2010}} |
||
⚫ | |||
{{مصدر|تاريخ=مايو_2010}} |
|||
| url = https://www.ciscopress.com/articles/article.asp?p=606583&seqNum=7 |
|||
⚫ | |||
| title = VoIP: An In-Depth Analysis - Voice Activity Detection |
|||
| date = 20 October 2006 |
|||
| website = Cisco |
|||
| author2 = Jonathan Davidson |
|||
| author3 = Satish Kalidindi |
|||
| author4 = Sudipto Mukherjee |
|||
| author5 = James Peters |
|||
| author1 = Manoj Bhatia |
|||
}}</ref> الاستخدام الأساسي لـ (VAD) هو في ترميز الحديث (speech coding) و[[تعرف على الكلام|التعرف على الكلام]]. |
|||
تساعد هذه التقنية على إيقاف بعض العمليات أثناء فترات الصمت في المكالمات الهاتفية عبر تطبيقات "الصوت عبر بروتكول الانترنت" ([[الصوت عبر الإنترنت]]) مما يوفر في عرض النطاق |
تساعد هذه التقنية على إيقاف بعض العمليات أثناء فترات الصمت في المكالمات الهاتفية عبر تطبيقات "الصوت عبر بروتكول الانترنت" ([[الصوت عبر الإنترنت]]) مما يوفر في عرض النطاق الترددي (bandwidth) للشبكة ويمنع إرسال الحزم (packets) الفارغة. |
||
هناك خوارزميات متعددة تم تطويرها لتوفير مميزات تأخذ في الاعتبار الدقة والحساسية وتأخر البيانات المتغير ( |
هناك خوارزميات متعددة تم تطويرها لتوفير مميزات تأخذ في الاعتبار الدقة والحساسية وتأخر البيانات المتغير (latency) ولا يعتمد (VAD) على لغة الحديث بأي شكل من الأشكال.<ref name="RamachandranMammone2012">{{cite book|author1=Ravi Ramachandran|author2=Richard Mammone|title=Modern Methods of Speech Processing|url=https://books.google.com/books?id=JwD3BwAAQBAJ&pg=PA102|date=6 December 2012|publisher=Springer Science & Business Media|isbn=978-1-4615-2281-2|pages=102–}}</ref> |
||
== المراجع == |
|||
{{شريط بوابات| فيزياء}} |
|||
{{مراجع}} |
|||
== مصادر == |
|||
* DMA minimum performance standards for discontinuous transmission operation of mobile stations TIA doc. and database IS-727, June 1998. |
|||
* M. Y. Appiah, M. Sasikath, R. Makrickaite, M. Gusaite, "[https://web.archive.org/web/20110719120643/http://www.kom.auc.dk/~myap04/pjts/final_report_8th.pdf Robust Voice Activity Detection and Noise Reduction Mechanism] ([[:en:Portable_Document_Format|PDF]])", Institute of Electronics Systems, Aalborg University |
|||
* X. L. Liu, Y. Liang, Y. H. Lou, H. Li, B. S. Shan, [https://web.archive.org/web/20130502134419/http://www.icpr2010.org/pdfs/icpr2010_MoAT5.1.pdf Noise-Robust Voice Activity Detector Based on Hidden Semi-Markov Models], ''Proc. ICPR'10'', 81–84. |
|||
{{شريط بوابات| فيزياء|اتصال عن بعد|تقانة|تقنية المعلومات|موسيقى}} |
|||
{{بذرة فيزياء}} |
{{بذرة فيزياء}} |
||
نسخة 08:53، 4 أغسطس 2020
خاصية اكتشاف النشاط الصوتى (بالإنجليزية: Voice activity detection)، اختصارًا (VAD)، أو ما يعرف بـ "اكتشاف الحديث" هو تقنية مستخدمة في معالجة الحديث (معالجة الكلام) حيث يتم اكتشاف وجود أو غياب الصوت البشرى.[1] الاستخدام الأساسي لـ (VAD) هو في ترميز الحديث (speech coding) والتعرف على الكلام.
تساعد هذه التقنية على إيقاف بعض العمليات أثناء فترات الصمت في المكالمات الهاتفية عبر تطبيقات "الصوت عبر بروتكول الانترنت" (الصوت عبر الإنترنت) مما يوفر في عرض النطاق الترددي (bandwidth) للشبكة ويمنع إرسال الحزم (packets) الفارغة.
هناك خوارزميات متعددة تم تطويرها لتوفير مميزات تأخذ في الاعتبار الدقة والحساسية وتأخر البيانات المتغير (latency) ولا يعتمد (VAD) على لغة الحديث بأي شكل من الأشكال.[2]
المراجع
- ^ Manoj Bhatia؛ Jonathan Davidson؛ Satish Kalidindi؛ Sudipto Mukherjee؛ James Peters (20 أكتوبر 2006). "VoIP: An In-Depth Analysis - Voice Activity Detection". Cisco.
- ^ Ravi Ramachandran؛ Richard Mammone (6 ديسمبر 2012). Modern Methods of Speech Processing. Springer Science & Business Media. ص. 102–. ISBN:978-1-4615-2281-2.
مصادر
- DMA minimum performance standards for discontinuous transmission operation of mobile stations TIA doc. and database IS-727, June 1998.
- M. Y. Appiah, M. Sasikath, R. Makrickaite, M. Gusaite, "Robust Voice Activity Detection and Noise Reduction Mechanism (PDF)", Institute of Electronics Systems, Aalborg University
- X. L. Liu, Y. Liang, Y. H. Lou, H. Li, B. S. Shan, Noise-Robust Voice Activity Detector Based on Hidden Semi-Markov Models, Proc. ICPR'10, 81–84.