أطلقت شركة جوجل أداة ذكاء اصطناعي جديدة قادرة على الترجمة بسرعة تحاكي المحادثات الواقعية، مما يتيح للمستخدمين التحدث بشكل طبيعي وتلقائي مع أشخاص يتحدثون لغات أخرى.
وكشفت جوجل مؤخرًا عن نموذجها الصوتي الجديد “Gemini 3.5 Live Translate”، المصمم خصيصًا لجعل المحادثات الحية متعددة اللغات تبدأ وتتدفق بسلاسة أكبر. وخلافًا لأنظمة الترجمة التقليدية التي تعتمد على معالجة الحديث بالدور (انتظار كل طرف حتى ينهي كلامه)، يعمل النظام الجديد على الاستماع والترجمة والتحدث بشكل مستمر ومتزامن؛ مما يسمح بتدفق الحوار بفارق زمني لا يتعدى ثوانٍ معدودة، وهو ما يحاكي نمط الحديث البشري الطبيعي.
ويتميز النموذج بقدرته على التعرّف التلقائي على اللغات المتحدثة، حيث يدعم أكثر من 70 لغة، مما يسمح بالترجمة بين آلاف الأزواج اللغوية المختلفة ضمن المحادثة الواحدة. وأوضحت جوجل أن التقنية باتت متاحة الآن للمطورين والشركاء، لدمجها في الاجتماعات، ومنصات التواصل، وتطبيقات الهواتف الذكية.
ويكمن التحول الأبرز هنا في آلية الترجمة ذاتها؛ فبدلًا من الانتظار حتى يتوقف المتحدث تمامًا لإنتاج الترجمة، يعتمد النموذج على “الترجمة الفورية المتدفقة”. وتمنح هذه الآلية تجربة حوارية أكثر مرونة، وتتغلب على مشكلات التوقف الطويل والمقاطعات المربكة التي كانت تعيب الأنظمة السابقة.
كما تم تطوير النموذج ليتناسب مع تحديات التواصل اليومي؛ حيث أكدت جوجل قدرته على العمل بكفاءة في البيئات الصاخبة، والتعامل مع الأصوات الخلفية، وتداخل المتحدثين، والعبارات العامية غير الرسمية. هذا الأمر يجعله مثاليًا لمجموعة واسعة من الاستخدامات، مثل: مكالمات خدمة العملاء، الجولات السياحية، الفصول الدراسية، خدمات نقل الركاب، والبث المباشر.
ولم تغفل جوجل جودة الصوت؛ فبدلًا من توليد صوت آلي جامد، يركز النظام على الحفاظ على نبرة المتحدث الأصلي، بما في ذلك إيقاع الكلام، والتنغيم الصوتي، والطابع العاطفي، مما يساعد على خروج الترجمة بشكل طبيعي ويسهل متابعة الحوار.

