اكتشاف النشاط الصوتي: الفرق بين النسختين

[نسخة منشورة]

تم حذف المحتوى تمت إضافة المحتوى

مضمن

نسخة 08:53، 4 أغسطس 2020

خاصية اكتشاف النشاط الصوتى (بالإنجليزية: Voice activity detection)‏، اختصارًا (VAD)، أو ما يعرف بـ "اكتشاف الحديث" هو تقنية مستخدمة في معالجة الحديث (معالجة الكلام) حيث يتم اكتشاف وجود أو غياب الصوت البشرى.^[1] الاستخدام الأساسي لـ (VAD) هو في ترميز الحديث (speech coding) والتعرف على الكلام.

تساعد هذه التقنية على إيقاف بعض العمليات أثناء فترات الصمت في المكالمات الهاتفية عبر تطبيقات "الصوت عبر بروتكول الانترنت" (الصوت عبر الإنترنت) مما يوفر في عرض النطاق الترددي (bandwidth) للشبكة ويمنع إرسال الحزم (packets) الفارغة.

هناك خوارزميات متعددة تم تطويرها لتوفير مميزات تأخذ في الاعتبار الدقة والحساسية وتأخر البيانات المتغير (latency) ولا يعتمد (VAD) على لغة الحديث بأي شكل من الأشكال.^[2]

المراجع

^ Manoj Bhatia؛ Jonathan Davidson؛ Satish Kalidindi؛ Sudipto Mukherjee؛ James Peters (20 أكتوبر 2006). "VoIP: An In-Depth Analysis - Voice Activity Detection". Cisco.
^ Ravi Ramachandran؛ Richard Mammone (6 ديسمبر 2012). Modern Methods of Speech Processing. Springer Science & Business Media. ص. 102–. ISBN:978-1-4615-2281-2.

مصادر

DMA minimum performance standards for discontinuous transmission operation of mobile stations TIA doc. and database IS-727, June 1998.
M. Y. Appiah, M. Sasikath, R. Makrickaite, M. Gusaite, "Robust Voice Activity Detection and Noise Reduction Mechanism (PDF)", Institute of Electronics Systems, Aalborg University
X. L. Liu, Y. Liang, Y. H. Lou, H. Li, B. S. Shan, Noise-Robust Voice Activity Detector Based on Hidden Semi-Markov Models, Proc. ICPR'10, 81–84.

هذه بذرة مقالة عن الفيزياء أو موضوع فيزيائي بحاجة للتوسيع. فضلًا شارك في تحريرها.

[1] Manoj Bhatia؛ Jonathan Davidson؛ Satish Kalidindi؛ Sudipto Mukherjee؛ James Peters (20 أكتوبر 2006). "VoIP: An In-Depth Analysis - Voice Activity Detection". Cisco.

[RamachandranMammone2012-2] Ravi Ramachandran؛ Richard Mammone (6 ديسمبر 2012). Modern Methods of Speech Processing. Springer Science & Business Media. ص. 102–. ISBN:978-1-4615-2281-2.

[1]

[2]

@@ سطر 1: / سطر 1: @@
 {{يتيمة|تاريخ=مايو_2010}}
+خاصية '''اكتشاف النشاط الصوتى''' {{إنج|Voice activity detection}}، اختصارًا (VAD)، أو ما يعرف بـ "'''اكتشاف الحديث'''" هو تقنية مستخدمة في معالجة الحديث ([[معالجة الكلام]]) حيث يتم اكتشاف وجود أو غياب الصوت البشرى.<ref>{{cite web
-{{مصدر|تاريخ=مايو_2010}}
+| url = https://www.ciscopress.com/articles/article.asp?p=606583&seqNum=7
-خاصية '''اكتشاف النشاط الصوتى''' {{إنج|Voice activity detection}}(VAD) أو ما يعرف بـ "اكتشاف الحديث" هو تقنية مستخدمة في معالجة الحديث ([[معالجة الكلام]]) حيث يتم اكتشاف وجود أو غياب الصوت البشرى. الاستخدام الأساسي ل (VAD) هو في ترميز الحديث (speech coding) و[[تعرف على الكلام|التعرف على الكلام]].
+| title = VoIP: An In-Depth Analysis - Voice Activity Detection
+| date = 20 October 2006
+| website = Cisco
+| author2 = Jonathan Davidson
+| author3 = Satish Kalidindi
+| author4 = Sudipto Mukherjee
+| author5 = James Peters
+| author1 = Manoj Bhatia
+}}</ref> الاستخدام الأساسي لـ (VAD) هو في ترميز الحديث (speech coding) و[[تعرف على الكلام|التعرف على الكلام]].
-تساعد هذه التقنية على إيقاف بعض العمليات أثناء فترات الصمت في المكالمات الهاتفية عبر تطبيقات "الصوت عبر بروتكول الانترنت" ([[الصوت عبر الإنترنت]]) مما يوفر في عرض النطاق الترددى (bandwidth) للشبكة ويمنع إرسال الحزم (packets) الفارغة.
+تساعد هذه التقنية على إيقاف بعض العمليات أثناء فترات الصمت في المكالمات الهاتفية عبر تطبيقات "الصوت عبر بروتكول الانترنت" ([[الصوت عبر الإنترنت]]) مما يوفر في عرض النطاق الترددي (bandwidth) للشبكة ويمنع إرسال الحزم (packets) الفارغة.
-هناك خوارزميات متعددة تم تطويرها لتوفير مميزات تأخذ في الاعتبار الدقة والحساسية وتأخر البيانات المتغير ([[latency]]) ولا يعتمد (VAD) على لغة الحديث بأي شكل من الأشكال.
+هناك خوارزميات متعددة تم تطويرها لتوفير مميزات تأخذ في الاعتبار الدقة والحساسية وتأخر البيانات المتغير (latency) ولا يعتمد (VAD) على لغة الحديث بأي شكل من الأشكال.<ref name="RamachandranMammone2012">{{cite book|author1=Ravi Ramachandran|author2=Richard Mammone|title=Modern Methods of Speech Processing|url=https://books.google.com/books?id=JwD3BwAAQBAJ&pg=PA102|date=6 December 2012|publisher=Springer Science & Business Media|isbn=978-1-4615-2281-2|pages=102–}}</ref>
+== المراجع ==
-{{شريط بوابات| فيزياء}}
+{{مراجع}}
+== مصادر ==
+* DMA minimum performance standards for discontinuous transmission operation of mobile stations TIA doc. and database IS-727, June 1998.
+* M. Y. Appiah, M. Sasikath, R. Makrickaite, M. Gusaite, "[https://web.archive.org/web/20110719120643/http://www.kom.auc.dk/~myap04/pjts/final_report_8th.pdf Robust Voice Activity Detection and Noise Reduction Mechanism] ([[:en:Portable_Document_Format|PDF]])", Institute of Electronics Systems, Aalborg University
+* X. L. Liu, Y. Liang, Y. H. Lou, H. Li, B. S. Shan, [https://web.archive.org/web/20130502134419/http://www.icpr2010.org/pdfs/icpr2010_MoAT5.1.pdf Noise-Robust Voice Activity Detector Based on Hidden Semi-Markov Models], ''Proc. ICPR'10'', 81–84.
+{{شريط بوابات| فيزياء|اتصال عن بعد|تقانة|تقنية المعلومات|موسيقى}}
 {{بذرة فيزياء}}