Gonsin Conference Equipment Co., LTD.
Gonsin Conference Equipment Co., LTD.

المنتجات

نظام التعرف التلقائي على الكلام ASR

نظام التعرف التلقائي على الكلام من GONSIN يناسب سيناريوهات التطبيق المختلفة ، بما في ذلك دقائق الاجتماعات ، وسجلات التدريب ، وترجمات الكلام في الوقت الفعلي ، ونسخ سجلات المقابلات ، وسجلات المحاكمات في الوقت الفعلي ، وما إلى ذلك. يمكنه دمج النص والتسجيل الصوتي لكل دور ، ودمج وإنشاء دقائق اجتماع ، ودعم تصدير النص. الـنظام مؤتمرات الصينيدعم نشر تأجير الخادم السحابي ، ونشر الشبكة المحلية للخادم ، وتعلم الذكاء الاصطناعي ، والتحسين المستمر للنظام.

Speech To Text Software
Asr Automatic Speech Recognition
Speech To Text Software
Asr Automatic Speech Recognition

كتطور جديد لحلول المؤتمرات الحديثة ، يجلب نظام التعرف التلقائي على الكلام (ASR) تجربة تفاعل أكثر ذكاءً بين الإنسان والحاسوب. بالنسبة للمؤتمرات التقليدية ، لا يمكن أن يلبي الاتصال بالصوت والفيديو احتياجات المؤتمر الحديث بعد الآن. بالإضافة إلى ذلك ، بعد الاجتماع ، يجب أيضًا تقديم معالجة المستندات ومحاضر الاجتماعات والإجراءات القانونية لمستخدمين محددين في شكل كلمات. يمكن لنظام التعرف التلقائي على الكلام من Gonsin أن يحقق النسخ النصي في الوقت الفعلي والكامل والمنظم من الصوت ، ويضمن توافق النص مع خطاب كل مندوب. يمكن عرض النص المنسوخ على شاشة كبيرة ، بالإضافة إلى نظام مؤتمرات بدون ورق في الوقت الفعلي.


نظام ASR يناسب سيناريوهات التطبيقات المختلفة ، بما في ذلك دقائق الاجتماعات ، وسجلات التدريب ، وترجمات الكلام في الوقت الفعلي ، ونسخ سجلات المقابلات ، وسجلات المحاكمة في الوقت الفعلي ، وما إلى ذلك.


image.png


حلول نظام التعرف الصوتي الأوتوماتيكي من Gonsin

يوفر نظام GONSIN ASR ثلاثة حلول: حل التعرف على الكلام والترجمة عبر الإنترنت ، وحل النشر الخاص الخفيف الوزن ، وحل النشر الخاص في غرف المؤتمرات.


  • حل التعرف على الكلام والترجمة عبر الإنترنت

  • حل النشر الخاص خفيف الوزن

  • مجموعة غرف المؤتمرات حل النشر الخاص


مزايا نظام التعرف على الكلام التلقائي

تم تطوير نظام برنامج التعرف التلقائي على الكلام من GONSIN على منصة GONSIN تكنولوجيا التعرف التلقائي على الكلام للمؤتمرات الرقمية الكاملة. من خلال توصيل بيانات صوت الشبكة وخلفية ASR ، وفي دعم برنامج تطبيق ASR و GONSIN ، فإنه يحقق تحويل الصوت في الوقت الفعلي إلى نص.

Automatic Speech Recognition System

برنامج التعرف التلقائي على الكلام Gonsin V7.1.0

الوظائف الأساسية

  • دعم السحابة العامة والملكية اختيار خادم الصوت السحابي ، والتي يمكن أن تلبي أساليب نشر الخادم المختلفة. يدعم التثبيت على الكمبيوتر الشخصي أو خادم التعرف على الكلام ، والذي يمكن تطبيقه بمرونة على مجموعة متنوعة من سيناريوهات التطبيق.

  • دعم وظيفة إدارة إغلاق خادم ASR ، خادم ASR ، اتصال نظام المناقشة ، البحث ، وظيفة تخصيص دور الميكروفون ، ودعم الرسالة العامة لكل سلسلة من نظام المناقشة السلس ، إدارة المؤتمرات ، فصل الأدوار ، والتعرف التلقائي.

  • دعم الموظفين وإدارة المعدات ، بما في ذلك البحث عن المعدات ، وعرض معلومات رقم الوحدة ، ومعلومات عنوان IP ، وإعدادات اسم الموظفين ؛ دعم تحرير معلومات الاجتماع ، بما في ذلك اسم الاجتماع الجديد ، وتحديد وقت الاجتماع ، والموقع ، وتحرير محتوى الاجتماع.

  • دعم التعرف المتزامن على أدوار الميكروفون المتعددة ووظيفة مكافحة التعقب ، والتي يمكن أن تتجنب بشكل فعال الحديث المتبادل عند التعرف على الميكروفونات المتعددة في نفس الوقت ؛ دعم حالة الميكروفون يطالب ، التي يمكن عرض حالة الميكروفون وإيقافها في الوقت الحقيقي.

  • دعم وظيفة تعلم نموذج اللغة. يدعم استيراد الكلمات الشائعة مثل أسماء الأشخاص والأماكن لتعلم نموذج اللغة.

  • دعم التحديد التلقائي لأدوار المشاركين ، والتعرف التلقائي على صوت المشاركين ، ونسخ النص. ترجمة دعم البرنامج إلى الكلام المطلوب الآخر (تختلف وظائف البرنامج وفقًا لقدرات المحرك)

  • دعم الفهم الدلالي الذكي ، والذي يمكنه فهم دلالات المشاركين تلقائيًا وكسر الجمل والشرائح تلقائيًا وفقًا للدلالات. يدعم التحويل التلقائي للأرقام المتتالية إلى تنسيق عربي ، ويدعم التعرف التلقائي على أرقام الهواتف المحمولة وبطاقات الهوية والأرقام المتتالية الأخرى التي يتم تحويلها إلى تنسيق عربي.

  • يدعم وظائف تحرير نص الاجتماع وتصحيحه. إنشاء ملفات تسجيل منفصلة لأدوار مختلفة ، أو دمج السجلات النصية والتسجيلات لكل دور. يمكن مزامنة تشغيل السجلات الصوتية والنصية وعرضها مقابل تصحيح المستند.

  • دعم وظيفة إخراج سجل الاجتماع. دعم دمج النص وإنشاء دقائق الاجتماع وتصدير النص.

  • دعم وظيفة البحث عن المحتوى ، ودعم البحث عن محتوى النص. يمكن البحث عن الكلمات الرئيسية ، وتحديد موقع المحتوى المطابق بسرعة ، مما يحسن بشكل كبير من كفاءة استرجاع المحتوى.

  • دعم وظيفة إخراج النص المنقسم الشاشة. التثبيت على الكمبيوتر الشخصي ، يمكنك تحقيق عرض نص النسخ في الوقت الفعلي في الشاشة الرئيسية للكمبيوتر التشغيلي ، ودعم التوسع في إخراج الشاشة المنقسمة ، عرض المحتوى النصي للتعرف على الصوت في الوقت الفعلي. دعم وظيفة تخصيص الشاشة ، دقة الشاشة التكيف ، دعم الخط النصي ، إعدادات الحجم ، لتوفير خدمة عرض النص تقسيم الشاشة عالية الجودة.

  • يدعم التعرف على ملف التسجيل ، من خلال استيراد ملف التسجيل ، تحويل محتوى ملف التسجيل تلقائيًا إلى محتوى نصي ؛ دعم mp3 ، wav وغيرها من تنسيقات الملفات.

  • دعم اختيار أجهزة إدخال الصوت ، يمكنك توصيل أجهزة إدخال الصوت للكمبيوتر ، نص نسخ إدخال الصوت في الوقت الفعلي

  • دعم الكمبيوتر للتعرف على محتوى صوت التشغيل الحالي ، وتحويله تلقائيًا إلى نص.

  • دعم المزيد من الميزات المخصصة: يدعم البرنامج التبديل الصيني والإنجليزية ، بالإضافة إلى اللغات المخصصة الأخرى ؛ دعم التطوير الثانوي ، وفقًا لمتطلبات المشروع الخاصة ببروتوكول الواجهة المفتوحة أو التطوير المخصص.


المعايير الفنية

نظامنظام تشغيل Win7 / win8 / win10 32 / 64 بت
وحدة معالجة مركزيةI7 أو أعلى
سعة القرص الصلبأو أعلى GB
سعة الذاكرة16 جيجابايت أو أعلى
بطاقة رسوماتتدعم بطاقة الرسومات المستقلة واجهة VGA / HDMI / DVI وتدعم شاشة تقسيم الشاشة
واجهة الكمبيوتر1 * واجهة و 2 * RJ45 واجهات
القرارالتكيف الذاتي
اتصال الكمبيوترإيثرنت/مكعب


الوظائف الأساسية

  • توافق نظام جيد ، دعم عرض العنوان الفرعي للنوافذ وأجهزة أندرويد.

  • دعم إعدادات وضع عرض العنوان الفرعي المتعددة. دعم وضع ملء الشاشة ووضع المنبثقة

  • وضع ملء الشاشة: عرض محتوى النسخ في شاشة كاملة في شكل مربع حوار. دعم إعداد الخلفية وإعداد الخط.

  • وضع الوابل: يعرض محتوى النسخ بأسلوب الوابل العائم. إعداد خط الدعم وإعداد الخط

  • دعم وظيفة الترجمة المتراكبة للفيديو: دعم وظيفة الترجمة في الوقت الفعلي المتراكب على شاشة الفيديو ، ومتكاملة مع مؤتمرات الفيديو وتطبيقات تتبع الكاميرا.

  • دعم وظيفة الترجمة بدون ورق: تمكين تراكب الترجمة في الوقت الحقيقي على شاشات بدون ورق ، ودمج مع أنظمة بدون ورق ، وعرض النص المنقول في الوقت الحقيقي على أجهزة طرفية بدون ورق.

خادم التعرف التلقائي الذكي خفيف الوزن

الوظائف الأساسية

  • مع برنامج التعرف على الصوت الذكي ، يمكنه تحقيق إدارة الوصول إلى الويب

  • دعم التعرف التلقائي على أدوار المشاركين والتعرف التلقائي على صوت المشارك ونسخ النص

  • مع محرك ASR المدمج ، اعتماد تقنية التعرف على الكلام عبر الإنترنت الرائدة في الصناعة ، يتم نشرها عبر السحابة لتوفير خدمات التعرف على الكلام للكلام المحلي. زمن استجابة منخفض ودقة تمييز عالية ومعدل دقة يمكن أن يصل إلى أكثر من ،

  • يمكن لخادم التعرف على الكلام تحقيق نسخ الكلام لقنوات مختلفة:

  • 3.0: يدعم القدرة على التعرف على الكلام في اتجاه واحد

  • رباعي: يدعم القدرة على التعرف على الكلام في اتجاهين

  • 1.2: يدعم القدرة على التعرف على الكلام بـ 5 طرق

  • رباعي: يدعم القدرة على التعرف على الكلام بـ 8 طرق

  • دعم التعرف على اللغة المخصصة ، مثل الصينية والإنجليزية والإسبانية والعربية والروسية والفرنسية.

  • دعم الاعتراف في سيناريوهات التطبيقات المتعددة: التعليم ، والقضاء ، والطبية ، وخطابات المؤتمرات ، ووسائل الإعلام الإخبارية ، والفيديو الترفيهي ، والمنزل الذكي ، والاجتماعي ، والسيارات ، وما إلى ذلك

  • دعم غرف مؤتمرات متعددة لمشاركة الخادم. دعم قاعات مؤتمرات متعددة في مركز المؤتمرات لتشكيل شبكة محلية ونشر الخادم مركزيًا لتلبية التعرف على الكلام المتوازي والنسخ في غرف مؤتمرات متعددة.

  • مع برنامج عرض الترجمة الذكي للتعرف على الكلام ، توفر خدمة عرض العنوان الفرعي للمؤتمرات.

المعايير الفنية

نموذجGX-AS201GX-AS202GX-AS205GX-AS208
إصدار النظامCentos7.4 +
وحدة معالجة مركزيةI3I7
سعة الذاكرة16 غ32 جرام
قرص صلبايشن G SSD"SD" G
واجهة اللوحة الأمامية4 × usbtype-A ، 1 × 0.2 خط خارج الخط ، 1 × our Micin ، 1 × 1.2 زر طاقة LED ، 1
واجهة اللوحة الخلفية4 × USB3.0 نوع-A ، 1 RJ4510 ×//M ، 1 من من من من من الخارج ، 1 من من من الخارج ، 1 × بخط ، 1 × بالدقيقة ، 1 × 1 ، واي فاي/BT نملة
مدخل الطاقةتيار مستمر 19 فولت
درجة حرارة التشغيل-5 درجة مئوية ~ 45 درجة مئوية
درجة حرارة التخزين-20 درجة مئوية ~ 60 درجة مئوية
الصوت"W" × (L)× (W)× 56 (H) mm


خادم ASR التلقائي للتعرف على الكلام ،

الوظائف الأساسية

  • خادم مثبت على حامل قياسي 2U مع أداء مستقر وموثوق به ، يعتمد لوحة فولاذية مجلفنة SGCC ، طلاء خارجي صديق للبيئة ، مقاومة بصمات الأصابع ، ومقاومة التلامس تشويش مغناطيسي قوي 4 كيلو فولت

  • اعتماد خادم لينوكس بتكوين عالي الأداء ، وتثبيت برنامج ASR Engine V3.0 لتحقيق التعرف التلقائي على أدوار المشاركين ، والتعرف التلقائي على أصوات المشاركين والنسخ إلى نص.

  • دعم غرف مؤتمرات متعددة لمشاركة الخادم. دعم غرف مؤتمرات متعددة في مركز المؤتمرات لتشكيل شبكة محلية ونشر الخادم مركزيًا لتلبية احتياجات غرف المؤتمرات المتعددة للتعرف على الكلام المتوازي والنسخ.

  • شارك في العمل مع برنامج عرض العنوان الفرعي الذكي للتعرف على الكلام لتوفير خدمة عرض العنوان الفرعي للاجتماعات

  • نموذج CTC عالي الكفاءة ، من خلال التفويض الاختياري ، يدعم خادم واحد بحد أقصى 50 اعترافًا متزامنًا.

  • يعتمد الخادم آلية تشفير SSL لضمان أمان تخزين ونقل المعلومات الحساسة بشكل فعال. تُستخدم خوارزميات تشفير RC4 و MD5 و RSA لضمان أمان بيانات المنصة وتجنب تسرب المعلومات المهمة.

  • برنامج مدمج لإدارة الطاقة. يمكنه مراقبة حالة الجهد لتجنب تعطل المعدات الناجم عن تذبذب الجهد وتحقيق الحماية في جميع الأحوال الجوية.


محرك التعرف على الكلام التلقائي GONSIN V3.1/V3.2

  • مع تقنية التعرف على الكلام عبر الإنترنت الرائدة في الصناعة ، يتم نشرها عبر السحابة لتوفير خدمات التعرف على الكلام للكلام المحلي. زمن استجابة منخفض ودقة تمييز عالية ومعدل دقة يمكن أن يصل إلى أكثر من ،

  • يعتمد المحرك نموذج دفع الطرد ، مما يقلل بشكل فعال من تكلفة المدخلات وعتبة البناء للتعرف على الكلام. يمكن للمستخدمين شراء برنامج الباقة بطول مناسب وفقًا للطلب الفعلي لطول التعرف على الكلام (يرجى شراء خدمة الباقة في الوقت المناسب لضمان الاستخدام العادي للمحرك)

  • دعم التعرف على الأدوار المفصولة: يمكن اختيار لغات أصلية ولغات ترجمة مختلفة وفقًا لأدوار مختلفة ، وذلك لتحقيق التعرف المتزامن على لغات متعددة ، والنسخ إلى النص المطابق ، والترجمة.

  • دعم لغات رئيسية متعددة ، مثل الصينية والإنجليزية والفرنسية والروسية والعربية والإسبانية.

  • مع برنامج عرض العنوان الفرعي للتعرف الذكي على الكلام ، يمكنه عرض النص الأصلي والنص المترجم في نفس الوقت ، أو تعيين عرض النص الأصلي/المترجم بشكل منفصل ، توفير خدمة الترجمة للتفاوض التجاري والمؤتمرات المرئية بلغات مختلفة.


محرك التعرف على الكلام التلقائي GONSIN V3.0

  • اعتماد تقنية ذكية للتعرف على اللغة ، تعتمد على تقنية AI لتحقيق التعرف على الكلام

  • دعم التعرف على اللغة المخصصة ، مثل الصينية والإنجليزية والإسبانية والعربية والروسية والفرنسية

  • دعم الاعتراف في سيناريوهات التطبيقات المتعددة: التعليم ، والقضاء ، والطبية ، وخطابات المؤتمرات ، ووسائل الإعلام الإخبارية ، والفيديو الترفيهي ، والمنزل الذكي ، والاجتماعي ، والسيارات ، وما إلى ذلك

يمكن لأي برنامج آلي للتعرف على الكلام ، بغض النظر عن تعقيده ، استخلاص الكلمات وفكيكها للتحليل والاستجابة ، ويتم سرد تسلسل الأحداث الأساسي على النحو التالي:

1. تحدث إلى البرنامج عبر إدخال الصوت.

2. سيؤدي التعرف الصوتي التلقائي الذي تتحدث إليه إلى إنشاء ملف موجة من كلماتك.

3. تم تنظيف الملفات الموجية عن طريق إزالة الضوضاء في الخلفية وحجم طبيعي.

4. تتحلل الموجات المفلترة إلى ما يسمى الفونيمات. (الفونيمات هي المكونات الأساسية للغة ونطق الكلمات. هناك 44 كلمة من هذا القبيل باللغة الإنجليزية ، تتكون من كتل صوتية مثل "wh" و "th" و "ka" و "t".

5. كل فونيم يعمل مثل سلسلة ، بدءا من الصوت الأول وتحليلها في تسلسل ، ويستخدم التعرف على الكلام ASR التحليل الاحتمالي الإحصائي لاستنتاج الكلمة بأكملها ، ثم نستنتج جمل كاملة من هناك.

6. يمكن لبرنامج التعرف التلقائي على الكلام ، الذي "يفهم" كلماتك الآن ، أن يستجيب لك بطريقة ذات معنى.



كيف يعمل برنامج التعرف التلقائي على الكلام ؟

يمكن لأي برنامج آلي للتعرف على الكلام ، بغض النظر عن تعقيده ، استخلاص الكلمات وفكيكها للتحليل والاستجابة ، ويتم سرد تسلسل الأحداث الأساسي على النحو التالي:

1. تحدث إلى البرنامج عبر إدخال الصوت.

2. سيؤدي التعرف الصوتي التلقائي الذي تتحدث إليه إلى إنشاء ملف موجة من كلماتك.

3. تم تنظيف الملفات الموجية عن طريق إزالة الضوضاء في الخلفية وحجم طبيعي.

4. تتحلل الموجات المفلترة إلى ما يسمى الفونيمات. (الفونيمات هي المكونات الأساسية للغة ونطق الكلمات. هناك 44 كلمة من هذا القبيل باللغة الإنجليزية ، تتكون من كتل صوتية مثل "wh" و "th" و "ka" و "t".

5. كل فونيم يعمل مثل سلسلة ، بدءا من الصوت الأول وتحليلها في تسلسل ، ويستخدم التعرف على الكلام ASR التحليل الاحتمالي الإحصائي لاستنتاج الكلمة بأكملها ، ثم نستنتج جمل كاملة من هناك.

6. يمكن لبرنامج التعرف التلقائي على الكلام ، الذي "يفهم" كلماتك الآن ، أن يستجيب لك بطريقة ذات معنى.


البرنامج التعليمي التلقائي للتعرف على الكلام


منتجات تكوين النظام نظام التعرف التلقائي على الكلام ASR




اتصل بنا

Gonsin هنا لنقدم لك الحلول المخصصة لنظام الصوت والفيديو للمؤتمرات.

يرجى ملء المعلومات بصدق حتى نتمكن من الاتصال بك وتقديم الخدمات في أقرب وقت ممكن.



المنتجات ذات الصلة من نظام التعرف التلقائي على الكلام ASR
تقديم الثقة والقيمة
يمكنك ذلك
الثقة.
حقوق الطبع© Gonsin Conference Equipment Co., LTD. جميع الحقوق محفوظة. br> تخضع المعلومات و المواصفات المدرجة للتغيير دون إشعار مسبق.