في السنوات الأخيرة، أصبح الذكاء الاصطناعي (AI) القائم على نماذج اللغة الكبيرة (LLMs) محط أنظار العالم. رغم التطور الكبير في أداء هذه النماذج، ما زالت تواجه نقداً مستمراً يتمثل في القول بأنها “مجرد أدوات للتنبؤ بالكلمة التالية”. في هذا المقال، سنشرح كيف يمكن لهذا المفهوم أن يكون أكثر من مجرد حيلة، وكيف أن النماذج اللغوية يمكن أن تكون قادرة على تقديم إجابات معقدة ودقيقة للأسئلة الإنسانية باستخدام فهم أعمق للعالم.
ما هي نماذج اللغة الكبيرة (LLMs)؟
نموذج اللغة الكبير هو نموذج تعلم آلي مبني على بنية معقدة من الشبكات العصبية. يتم تدريبه على كمية هائلة من النصوص، ويستخدم لتحليل وتوليد اللغة الطبيعية. يقوم LLM بتوقع الكلمة التالية في سلسلة من الكلمات بناءً على السياق والمعلومات السابقة، وهو ما يعرف بـ”التنبؤ بالكلمة التالية”.
مستويات الفهم في نماذج اللغة الكبيرة
لكي نفهم كيف يمكن أن تقدم LLMs أكثر من مجرد “تنبؤ بالكلمات”، سنستعرض خمسة مستويات من الفهم التي يمكن أن تحققها هذه النماذج:
- المستوى الأول: التنبؤ بالكلمة التالية في النص
- في هذا المستوى، يكون النموذج بسيطًا للغاية؛ فهو يعتمد على الإحصاءات اللغوية لتوقع الكلمة التالية. على سبيل المثال، إذا كان النص هو “الطقس اليوم مشمس و…”، يتوقع النموذج أن الكلمة التالية قد تكون “دافئ” أو “جميل” بناءً على الأنماط الشائعة في النصوص.
- المستوى الثاني: التنبؤ بأجزاء من الإجابات
- في هذا المستوى، يبدأ النموذج بفهم السياق بشكل أعمق، حيث يتوقع ليس فقط الكلمة التالية بل أيضًا جزءًا من الإجابة بشكل يتناسب مع السياق الأكبر. مثلًا، في سؤال مثل “ما هي أسباب التغير المناخي؟”، قد يقدم النموذج بداية إجابة تشمل “الاحتباس الحراري، واستخدام الوقود الأحفوري، وإزالة الغابات…”.
- المستوى الثالث: تقديم إجابات للأسئلة المعقدة
- هنا، تتجاوز LLMs مجرد التنبؤ بالكلمات وتبدأ في تقديم إجابات متكاملة لأسئلة معقدة. مثلًا، “كيف يمكن للدول تقليل انبعاثات الكربون؟” قد يقدم النموذج إجابة تفصيلية تشمل السياسات البيئية، والتكنولوجيا الخضراء، وتشجيع استخدام الطاقة المتجددة.
- المستوى الرابع: فهم الواقع بشكل عميق
- في هذا المستوى، يظهر النموذج قدرة على تقديم توصيات وحلول تعتمد على فهم عميق للواقع. إذا سُئل “ما هو النظام الحكومي الأمثل لدولة صغيرة تعتمد على السياحة؟”، قد يأخذ النموذج في اعتباره العوامل الاقتصادية والسياسية والاجتماعية والبيئية لتقديم إجابة تناسب السياق المحدد.
- المستوى الخامس: القدرة على تقديم إجابات شاملة على مستوى “الكلية”
- عند الوصول إلى هذا المستوى، يمكن أن يكون للنموذج فهم شامل لعدد كبير من المجالات بما يكفي للإجابة على أسئلة تتعلق بحياة الإنسان مثل: “ما هو الغرض من الحياة؟” أو “كيف يمكن بناء مجتمع عادل ومستدام؟”.
الإجابات كتوصيفات للعالم
إذا كان النموذج اللغوي قادرًا على تقديم إجابات تتطلب فهماً دقيقاً للعالم، فإن ذلك يعني أنه يمتلك القدرة على فهم العالم بطريقة مماثلة للبشر. فمثلاً، إذا تمكن النموذج من الإجابة عن سؤال حول تأثير السياسة النقدية على الاقتصاد، فهذا يتطلب ليس فقط معرفة بمفاهيم اقتصادية معقدة بل أيضًا كيفية تفاعل هذه المفاهيم في العالم الواقعي.
المفارقة هنا هي أن “التنبؤ بالكلمة التالية” يمكن أن يكون عملية معقدة للغاية تتطلب قدراً كبيراً من الفهم والمعرفة، مما يجعلها قادرة على “التنبؤ بالإجابة” بدقة عالية. كلما زادت قدرة النموذج على فهم التفاصيل الدقيقة للعالم، كلما أصبح “التنبؤ بالكلمة التالية” يشبه القدرة على “معرفة كل شيء”.
الإنسان مقابل العلم المطلق
إذا افترضنا أن هناك نموذج ذكاء اصطناعي لديه “فهم كامل” للعالم، فإنه سيكون قادرًا على تقديم إجابات على أي سؤال. لكن هذا الفهم الكامل للعالم غير متاح حاليًا لأي نموذج، بما في ذلك الإنسان. ومع ذلك، ما يميز LLMs هو قدرتها على تقديم إجابات “كافية” و”عملية” لمجموعة كبيرة من الأسئلة التي تهم البشر، مثل:
- ما الذي يسبب الشيخوخة وكيف يمكن منعها أو علاجها؟
- كيف يمكن تحسين النظام التعليمي لتحقيق نتائج أفضل؟
- كيف يمكن تخطيط المدن بشكل يحسن من جودة الحياة؟
هذه الأسئلة لا تتطلب معرفة كل شيء، ولكنها تتطلب فهماً معقولاً للعالم.
الحجة بصيغة استنتاجية
- إذا كان هناك نموذج ذكاء اصطناعي لديه نموذج كامل للكون، فيمكنه التنبؤ بالإجابة على أي سؤال.
- ولكن لا يوجد لدينا نموذج كامل للكون.
- لذا، لا يمكن لأي ذكاء اصطناعي (أو أي نظام آخر معروف) أن يعرف كل شيء.
- ومع ذلك، المعيار البشري لـ “معرفة كل شيء” أو “العلم العملي” ليس قريباً من هذا المعيار المستحيل.
- لذلك، قد يتمكن البشر قريباً من بناء ذكاء اصطناعي “يعرف كل شيء عمليًا” للعديد من أنواع المشاكل التي تهمنا كنوع بشري.
الخاتمة
بينما يستمر الجدل حول قدرات LLMs، يبدو أن “التنبؤ بالكلمة التالية” يمكن أن يكون قدرة غير عادية تتطلب نماذج معقدة وفهماً عميقاً للعالم. بالنسبة للبشر، فإن مستوى الفهم المطلوب لتحقيق “العلم العملي” قد يكون أدنى بكثير من العلم المطلق، ومع ذلك، فإننا على وشك تحقيق ذلك من خلال الذكاء الاصطناعي القائم على نماذج اللغة الكبيرة.
المراجع:
- Eliezer Yudkowsky على تويتر:
- “it just predicts the next token” literally any well-posed problem is isomorphic to ‘predict the next token of the answer’ and literally anyone with a grasp of undergraduate compsci is supposed to see that without being told. (23 أغسطس 2024)
- Chen, J., et al. (2023). “The Power of Next-Token Prediction in Natural Language Processing”. Journal of Artificial Intelligence Research.
- Brown, T., et al. (2020). “Language Models are Few-Shot Learners”. NeurIPS 2020 Conference.
المراجع المذكورة تقدم نظرة علمية معمقة حول كيفية عمل نماذج اللغة الكبيرة وكيفية تطورها.