فرضية التمثيل الأفلاطوني: نحو الانعكاس الشامل للتشفير والتواصل مع الحيتان

2025-07-18
فرضية التمثيل الأفلاطوني: نحو الانعكاس الشامل للتشفير والتواصل مع الحيتان

اكتشف الباحثون أن نماذج اللغة الكبيرة تتقارب نحو مساحة تمثيلية أساسية مشتركة مع نموها، وهي ظاهرة تُسمى "فرضية التمثيل الأفلاطوني". ويشير هذا إلى أن النماذج المختلفة تتعلم نفس الميزات، بغض النظر عن البنية. تستخدم الورقة لعبة "موسوليني أو الخبز" كتشبيه لشرح هذا التمثيل المشترك، وتدعمه كذلك بنظرية الضغط وقدرة النموذج على التعميم. والأهم من ذلك، واستنادًا إلى هذه الفرضية، طور الباحثون طريقة تُسمى vec2vec، وهي طريقة للتحويل غير الخاضع للإشراف بين مساحات التشفير المختلفة، لتحقيق انعكاس دقيق للغاية لتشفير النصوص. قد تشمل التطبيقات المستقبلية فك رموز النصوص القديمة (مثل الخطي A) أو ترجمة لغة الحيتان، مما يفتح آفاقًا جديدة لفهم اللغات وتقدم الذكاء الاصطناعي.

اقرأ المزيد

توسيع نطاق التعلم المعزز: التنبؤ بالرمز التالي على الويب

2025-07-13
توسيع نطاق التعلم المعزز: التنبؤ بالرمز التالي على الويب

يُجادل الكاتب بأن التعلم المعزز (RL) هو الحدود التالية لتدريب نماذج الذكاء الاصطناعي. إن النهج الحالية لتوسيع نطاق العديد من البيئات في وقت واحد فوضوية. وبدلاً من ذلك، يقترح الكاتب تدريب النماذج على التفكير باستخدام RL للتنبؤ بالرمز التالي على مجموعات بيانات على نطاق الويب. هذا يستغل كمية البيانات الضخمة المتاحة بسهولة على الويب، متجاوزًا قيود مجموعات بيانات تدريب RL الحالية التي تركز على مشاكل الرياضيات والترميز. من خلال توحيد RL مع التنبؤ بالرمز التالي، يعد النهج بإنشاء نماذج استنتاج أكثر قوة بكثير.

اقرأ المزيد
الذكاء الاصطناعي

عنق الزجاجة في الذكاء الاصطناعي: البيانات وليس الخوارزميات؟

2025-06-30
عنق الزجاجة في الذكاء الاصطناعي: البيانات وليس الخوارزميات؟

لقد حقق الذكاء الاصطناعي تقدمًا مذهلاً، لكن يبدو أن وتيرة التقدم تتباطأ. تجادل هذه المقالة بأن أهم إنجازات الذكاء الاصطناعي (الشبكات العصبية العميقة، والمحولات، وRLHF، ونماذج الاستدلال) لم تنبع من خوارزميات جديدة، بل من فتح مصادر بيانات جديدة (ImageNet، ونصوص الويب، والردود البشرية، والمدققون). يقترح الكاتب أن الإنجازات المستقبلية لن تأتي على الأرجح من الابتكار الخوارزمي، بل من الاستخدام الفعال لمصادر بيانات جديدة مثل الفيديو وأجهزة استشعار الروبوتات، لأن مجموعات البيانات الحالية قد تقترب من حدود معرفتها.

اقرأ المزيد
الذكاء الاصطناعي قيادة البيانات قيود النموذج