دراسة صادمة.. من يهلوس أكثر بين روبوتات الذكاء الاصطناعي؟

كشفت دراسة حديثة أجرتها مؤسسة “Legal Guardian Digital” عن تفاوتات هائلة في دقة روبوتات الدردشة الشهيرة، محذرة من ظاهرة “الهلوسة” التي قد تؤدي إلى تضليل المستخدمين ببيانات خاطئة تمامًا.

وبعيدًا عن التعقيدات التقنية، تعتمد النماذج اللغوية الكبيرة (LLMs) على أنماط إحصائية لتوقع الكلمة التالية. وعندما يفشل النموذج في العثور على نمط دقيق للإجابة، فإنه يقوم بتركيب كلمات تبدو منطقية من الناحية الإحصائية لكنها تفتقر إلى الصحة الواقعية. هذا يعني أن الروبوت لا يتعمد الكذب، بل ينفذ برمجته في محاولة تقديم إجابة حتى لو كانت المعلومات غير متوفرة لديه.

وفجرت الدراسة مفاجأة بشأن Google Gemini، حيث تصدر قائمة الروبوتات الأكثر “هلوسة” بمعدل خطأ وصل إلى 32% من إجاباته. هذه الأرقام قد تثير قلق شركة “أبل”، التي تفيد التقارير بأنها تدفع لجوجل مليار دولار سنويًا لاستخدام نسخة مخصصة من “جميني” لتعزيز محرك “سيري” في نظام iOS 27 المنتظر هذا العام.

وجاء ChatGPT في المرتبة الثانية من حيث نسبة الخطأ، حيث قدم معلومات غير دقيقة في 30% من ردوده، وهو ضعف معدل خطأ منافسه الصيني DeepSeek.

على الجانب الآخر، أثبت Perplexity AI أنه الأكثر جدارة بالثقة، بمعدل هلوسة لم يتجاوز 13%، يليه المحرك الصيني DeepSeek بنسبة 14%، ثم Grok المملوك لإيلون ماسك بنسبة 15%.

وأشارت الدراسة إلى أن الدقة ليست المعيار الوحيد، بل “التوفر” أيضًا؛ حيث كان Perplexity و Grok هما الوحيدين اللذين لم يتعرضا لأي توقف (Uptime 100%) خلال فترة الدراسة. بينما حقق ChatGPT نسبة توفر بلغت 99.98%، وحل Claude في المركز الأخير بنسبة 99.68%، وهي لا تزال نسبة موثوقة جدًا.

لا يفوتك ايضا

“جوو ورورو” لـ”Meenda”: هذا أغرب سؤال نتلقاه.. وفيديو واحد غيّر حياتنا

بعد عودة نادر نور.. “جيتلك” لـ عمرو دياب تقترب من تحقيق 4 ملايين مشاهدة

بمشاركة ابنته.. أحمد سعد يعلن موعد طرح ديو “كدا كدا”

أزمة في عالم الألعاب.. شلل يصيب خدمات “إكس بوكس” ومتاجرها الرقمية

سامسونج تكشف أسرار نظارتها الذكية الجديدة.. وهذا ما يميزها عن ميتا

نايكي تدخل عصر الأحذية الذكية.. نعال جديدة تمنح قدميك جلسة استرخاء

دراسة صادمة.. من يهلوس أكثر بين روبوتات الذكاء الاصطناعي؟

بعد عودة نادر نور.. “جيتلك” لـ عمرو دياب تقترب من تحقيق 4 ملايين مشاهدة

بعد انتهاء التصوير.. “مطلوب عائليًا” يستعد للعرض في دور السينما

لا داعي للذعر.. طرق معالجة ظهور رمز “SOS” على الآيفون

عيد ميلاد هبة مجدي.. قصة حب على المسرح ومعركة مع المرض

بعد عودة نادر نور.. “جيتلك” لـ عمرو دياب تقترب من تحقيق 4 ملايين مشاهدة

بعد انتهاء التصوير.. “مطلوب عائليًا” يستعد للعرض في دور السينما

أزمة في عالم الألعاب.. شلل يصيب خدمات “إكس بوكس” ومتاجرها الرقمية

بعد 26 عامًا.. مصطفى قمر يكشف سبب اعتذار كريم عبد العزيز عن “الحب الأول”

من “تابوت الأرجنتين” إلى “حكايات الليل”.. رحلة “تيا” لأكثر القضايا رعبًا

أحمد كريم.. رحلة يوتيوبر المقالب من الأفكار البسيطة إلى الانتشار الواسع

جودي تكسر الغموض.. ابنة أحمد سعد شريكته في “كدا كدا” بالإسبانية

اختياراتنا

بعد عودة نادر نور.. “جيتلك” لـ عمرو دياب تقترب من تحقيق 4 ملايين مشاهدة

بعد انتهاء التصوير.. “مطلوب عائليًا” يستعد للعرض في دور السينما

أزمة في عالم الألعاب.. شلل يصيب خدمات “إكس بوكس” ومتاجرها الرقمية

اشترك للحصول على التحديثات

لا يفوتك ايضا

دراسة صادمة.. من يهلوس أكثر بين روبوتات الذكاء الاصطناعي؟

المقالات ذات الصلة

اشترك للحصول على التحديثات