Category: الذكاء الاصطناعي

TAO من داتابريكس: تجاوز الضبط الدقيق باستخدام بيانات غير مُعلّمة

2025-03-26
TAO من داتابريكس: تجاوز الضبط الدقيق باستخدام بيانات غير مُعلّمة

تُقدّم داتابريكس TAO (Test-time Adaptive Optimization)، وهي طريقة جديدة لضبط نماذج اللغات الكبيرة تتطلب فقط بيانات استخدام غير مُعلّمة. على عكس الضبط الدقيق التقليدي، يستخدم TAO الحوسبة في وقت الاختبار وتعلم التعزيز لتحسين أداء النموذج بناءً على أمثلة الإدخال السابقة. والمثير للدهشة أن TAO يتجاوز الضبط الدقيق التقليدي، ليُقارب نماذج المصدر المفتوح مثل Llama جودة النماذج الخاصة باهظة الثمن مثل GPT-4. هذه التقنية متاحة حاليًا في إصدار تجريبي مُسبق لعملاء داتابريكس، وستُدعم المنتجات المستقبلية.

الذكاء الاصطناعي ضبط النماذج

بروتوكول سياق النموذج (MCP): منفذ USB-C للذكاء الاصطناعي

2025-03-26

بروتوكول سياق النموذج (MCP) هو بروتوكول مفتوح يُوَحِّد كيفية توفير التطبيقات للسياق لأنظمة معالجة اللغة الكبيرة (LLM). فكر فيه كمنفذ USB-C للذكاء الاصطناعي: فهو يربط نماذج الذكاء الاصطناعي بمختلف مصادر البيانات والأدوات. يدعم مجموعة أدوات الوكلاء (Agents SDK) بروتوكول MCP، مما يسمح باستخدام خوادم MCP متنوعة لتزويد الوكلاء بالأدوات. تتوفر خوادم MCP بنوعين: خوادم stdio (محلية) وخوادم HTTP عبر SSE (بعيدة). تعمل ذاكرة التخزين المؤقت لقائمة الأدوات على تقليل زمن الوصول. تتوفر أمثلة كاملة في دليل examples/mcp.

الذكاء الاصطناعي

StarVector: نموذج تحويل الصور إلى متجهات SVG القائم على Transformer

2025-03-26

StarVector هو نموذج قائم على Transformer لتحويل الصور إلى متجهات SVG، مع وجود نماذج 8B و 1B من المعلمات المنشورة على Hugging Face. حقق نتائج متقدمة في معيار SVG-Bench، ويتفوق بشكل خاص في تحويل الأيقونات والشعارات والرسوم البيانية الفنية إلى متجهات، حيث يظهر أداءً متفوقًا في التعامل مع التفاصيل الرسومية المعقدة. يستخدم النموذج مجموعات بيانات واسعة النطاق للتدريب، وتشمل مجموعة واسعة من أنماط الرسومات المتجهة، من الأيقونات البسيطة إلى الرسوم التوضيحية الملونة المعقدة. بالمقارنة مع طرق التحويل إلى متجهات التقليدية، ينتج StarVector رمز SVG أنظف وأكثر دقة، مع الحفاظ بشكل أفضل على تفاصيل الصورة ومعلوماتها الهيكلية.

ثورة الذكاء الاصطناعي غير المتوقعة: الإيجاز ينتصر على الثرثرة

2025-03-26
ثورة الذكاء الاصطناعي غير المتوقعة: الإيجاز ينتصر على الثرثرة

أدى انتشار نماذج اللغات الكبيرة (LLMs) في البداية إلى حالة من الذعر في المدارس والشركات، خوفًا من استبدالها للواجبات المكتوبة والاتصالات المهنية. ومع ذلك، يجادل الكاتب بأن التأثير الحقيقي لنماذج اللغات الكبيرة يكمن في إمكاناتها في إحداث ثورة في طريقة تواصلنا وبرمجتنا. تكشف نماذج اللغات الكبيرة عن البساطة الكامنة وراء رسائل البريد الإلكتروني التجارية المفصلة والرموز المعقدة، مما يدفعنا نحو التواصل المختصر. وقد يؤدي هذا إلى تقادم نماذج اللغات الكبيرة نفسها، مما يمهد الطريق لاتصالات تجارية ولغات برمجة أكثر كفاءة وبساطة. هذا التحول نحو الإيجاز يعد بتغيير العالم.

الذكاء الاصطناعي ثورة الاتصالات

وكلاء Dapr: إطار عمل لأنظمة وكلاء الذكاء الاصطناعي القابلة للتطوير والمرنة

2025-03-26
وكلاء Dapr: إطار عمل لأنظمة وكلاء الذكاء الاصطناعي القابلة للتطوير والمرنة

Dapr Agents هو إطار عمل للمطورين مصمم لبناء أنظمة وكلاء ذكاء اصطناعي مرنة ومستوى إنتاج تعمل على نطاق واسع. تم بناؤه على مشروع Dapr المجرب، فهو يسمح للمطورين بإنشاء وكلاء ذكاء اصطناعي قادرين على التفكير والتصرف والتعاون باستخدام نماذج اللغات الكبيرة (LLMs). تضمن قابلية المراقبة المدمجة وتنفيذ سير العمل ذي الحالة اكتمال سير العمل الوكيل بنجاح، بغض النظر عن تعقيده. تشمل الميزات الرئيسية التنفيذ الفعال لوكلاء متعددين، وآليات إعادة المحاولة التلقائية، والتشغيل الأصلي لـ Kubernetes، وتكامل مصادر البيانات المتنوعة، والتعاون الآمن بين وكلاء متعددين، وجاهزية النظام الأساسي، والكفاءة من حيث التكلفة، والحياد تجاه الموردين.

الذكاء الاصطناعي

Gemini 2.5 Pro: ذكاء اصطناعي يدرك حدوده

2025-03-26
Gemini 2.5 Pro: ذكاء اصطناعي يدرك حدوده

حاول الكاتب جعل Gemini 2.5 Pro يعيد إنشاء جهاز توليف ReBirth RB-338 الشهير من التسعينيات. والمثير للدهشة أنه بدلاً من محاولة القيام بالمستحيل، قام Gemini 2.5 Pro بتقييم صعوبة المهمة وشرح عدم إمكانية تنفيذها، مما يدل على قدراته القوية في التفكير المنطقي. وتفاوض الكاتب على جهاز توليف مبسط ولكنه عملي. وهذا يوضح تقدم الذكاء الاصطناعي نحو فهم حدوده واتخاذ قرارات عقلانية.

الذكاء الاصطناعي

التعلم المعزز: من ألفاجو إلى ألفاجو زيرو

2025-03-26

يوفر هذا المقال لمحة عامة شاملة حول التعلم المعزز (RL)، بدءًا من قصة ألفاجو الآسرة التي هزمت أبطال لعبة جو البشريين. يشرح المقال المفاهيم الأساسية للـ RL، مثل عمليات صنع القرار ماركوف (MDPs)، ومعادلات بلمان، والبرمجة الديناميكية، وطرق مونت كارلو، والتعلم TD (SARSA، Q-learning، DQN)، وطرق تدرج السياسات (REINFORCE، Actor-Critic، A3C)، والاستراتيجيات التطورية. ويتعمق المقال في تفاصيل كل خوارزمية، مستخدماً ألفاجو زيرو كدراسة حالة مقنعة لتوضيح التطبيقات العملية لـ RL وقوته في حل المشكلات المعقدة.

الذكاء الاصطناعي ألفاجو

مُطابقات Whisper مُدهشة مع نشاط الدماغ البشري أثناء الكلام

2025-03-26
مُطابقات Whisper مُدهشة مع نشاط الدماغ البشري أثناء الكلام

تكشف دراسة عن تطابق مُدهش بين نموذج التعرف على الكلام Whisper من OpenAI والنشاط العصبي في الدماغ البشري أثناء المحادثات الطبيعية. من خلال مُقارنة مُطابقات Whisper مع النشاط الدماغي في مناطق مثل الجيروس الأمامي السفلي (IFG) والجيروس الصدغي العلوي (STG) ، وجد الباحثون أن مُطابقات اللغة بلغت ذروتها قبل مُطابقات الكلام أثناء إنتاج الكلام ، والعكس صحيح أثناء الفهم. هذا يُشير إلى أن Whisper ، على الرغم من عدم تصميمه مع وضع آليات الدماغ في الاعتبار ، يُمسك بجوانب أساسية من معالجة اللغة. كما تُبرز النتائج "هيكلية ناعمة" في معالجة اللغة في الدماغ: المناطق ذات الرتبة الأعلى مثل IFG تُعطي الأولوية للمعلومات الدلالية والنحوية ، لكنها تُعالج أيضًا ميزات سمعية منخفضة المستوى ، بينما تُعطي المناطق ذات الرتبة الأدنى مثل STG الأولوية للمعالجة الصوتية والسمعية ، لكنها تُمسك أيضًا بمعلومات على مستوى الكلمات.

الذكاء الاصطناعي

بروتوكول سياق النموذج (MCP): لحظة USB-C للذكاء الاصطناعي؟

2025-03-26
بروتوكول سياق النموذج (MCP): لحظة USB-C للذكاء الاصطناعي؟

يُحدث بروتوكول سياق النموذج (MCP) من أنثروبيك، الذي تم إصداره في أواخر عام 2024، ثورة في عالم الذكاء الاصطناعي. فكّر فيه على أنه منفذ USB-C لتكاملات الذكاء الاصطناعي: فهو يسمح لنماذج اللغات الكبيرة (LLMs) مثل كلود أو تشات جي بي تي بالتواصل بسلاسة مع مصادر البيانات الخارجية والأدوات (أوبسيديان، جيميل، التقويمات، إلخ) دون الحاجة إلى ملايين عمليات التكامل المخصصة. يستخدم MCP بنية ثلاثية الطبقات - مضيفين، وعملاء، وخوادم - للسماح بالوصول الآمن والموثوق إلى البيانات وتشغيل الإجراءات، مما يبسط عملية التطوير بشكل كبير ويولد تطبيقات مبتكرة. تتضمن الأمثلة توصيل LLMs بقواعد بيانات شخصية، ومستودعات رمزية، وحتى بيانات سوق الأسهم في الوقت الفعلي. لقد جعلت طبيعة MCP مفتوحة المصدر منه موضوعًا ساخنًا في مجتمع المطورين، مدمجًا في العديد من تطبيقات الذكاء الاصطناعي، وهو يبشر بتغيير ثوري في كيفية تفاعلنا مع تطبيقات الذكاء الاصطناعي.

الذكاء الاصطناعي

Gemini 2.5 من جوجل: نموذج ذكاء اصطناعي يفكر يتصدر

2025-03-25
Gemini 2.5 من جوجل: نموذج ذكاء اصطناعي يفكر يتصدر

كشفت جوجل النقاب عن Gemini 2.5، وهو نموذج الذكاء الاصطناعي الأكثر ذكاءً حتى الآن. حققت نسخة تجريبية، وهي 2.5 Pro، المرتبة الأولى في LMArena، متفوقة بشكل كبير على المنافسين. تكمن الابتكار الرئيسي في Gemini 2.5 في قدرته على "التفكير": فهو يستنتج قبل الرد، مما يؤدي إلى دقة وأداء محسنين. يتجاوز هذا الاستنتاج التصنيف والتوقع البسيط؛ فهو يتضمن تحليل المعلومات، واستخلاص استنتاجات منطقية، وفهم السياق والفروق الدقيقة، واتخاذ قرارات مستنيرة. بناءً على أعمال سابقة مع التعلم المعزز ورسائل سلسلة الفكر، يجمع Gemini 2.5 بين نموذج أساسي محسّن وتدريب لاحق متقدم. تخطط جوجل لإدماج هذه القدرات على التفكير في جميع النماذج المستقبلية، مما يسمح لها بمواجهة مهام أكثر تعقيدًا وتشغيل وكلاء أكثر تطوراً ووعيًا بالسياق.

الذكاء الاصطناعي

أبل ستستخدم صور خرائط أبل لتدريب نماذج الذكاء الاصطناعي

2025-03-25
أبل ستستخدم صور خرائط أبل لتدريب نماذج الذكاء الاصطناعي

قامت أبل مؤخرًا بتحديث موقعها الإلكتروني، وكشفت عن أنها ستبدأ من مارس 2025 في استخدام الصور والبيانات التي تم جمعها من خلال ميزة "نظرة عامة" في خرائط أبل لتدريب نماذج الذكاء الاصطناعي الخاصة بالتعرف على الصور وإنشائها وتحسينها. تم طمس الوجوه وأرقام لوحات السيارات في هذه البيانات التي تم جمعها بواسطة المركبات وحقائب الظهر المجهزة بكاميرات وأجهزة استشعار وأجهزة آيفون/آيباد. وتؤكد أبل أنها ستستخدم فقط الصور التي تم طمسها، وهي تقبل طلبات طمس المنازل. سوف يعزز هذا من قدرات الذكاء الاصطناعي في منتجات وخدمات أبل، مثل أداة التنظيف ووظيفة البحث في تطبيق الصور.

الذكاء الاصطناعي

جوجل تكشف النقاب عن Gemini 2.5: قفزة هائلة في استنتاج الذكاء الاصطناعي

2025-03-25
جوجل تكشف النقاب عن Gemini 2.5: قفزة هائلة في استنتاج الذكاء الاصطناعي

أطلقت جوجل Gemini 2.5، وهو نموذج الذكاء الاصطناعي الأكثر ذكاءً حتى الآن. يتميز الإصدار التجريبي 2.5 Pro بأداء متفوق في مجموعة واسعة من المعايير، محققًا المرتبة الأولى في LMArena بفارق كبير. تعتبر نماذج Gemini 2.5 نماذج "تفكر"، قادرة على استنتاج استجاباتها، مما يؤدي إلى تحسين الدقة والأداء. يمتد هذا الاستنتاج إلى ما هو أبعد من التصنيف والتنبؤ البسيط، ليشمل تحليل المعلومات، واستخلاص الاستنتاجات المنطقية، وفهم السياق والفروق الدقيقة، واتخاذ القرارات المدروسة. بالبناء على أعمال سابقة مع التعلم المعزز ومطالبات سلسلة الأفكار، يمثل Gemini 2.5 قفزة كبيرة إلى الأمام، حيث يجمع بين نموذج أساسي محسّن بشكل كبير مع تدريب لاحق معزز. تخطط جوجل لإدماج هذه القدرات على التفكير في جميع النماذج المستقبلية، مما يسمح لها بمعالجة مشكلات أكثر تعقيدًا ودعم وكلاء أكثر تطوراً.

الذكاء الاصطناعي

سام ألتمان من OpenAI: عملاق تقنية المستهلك العَرَضيّ

2025-03-25
سام ألتمان من OpenAI: عملاق تقنية المستهلك العَرَضيّ

تُجرِي هذه المقابلة من ستراتيجري مع الرئيس التنفيذي لشركة OpenAI، سام ألتمان، حيث يُفصّل رحلة OpenAI من مختبر أبحاث إلى عملاق تقنية المستهلك، والنجاح غير المتوقع لـ ChatGPT. يتحدث ألتمان بصراحة عن تحول نموذج أعمال OpenAI، وعلاقته مع مايكروسوفت، وآرائه حول سلامة الذكاء الاصطناعي وتنظيمه، ومستقبل الذكاء الاصطناعي العام. تتناول المقابلة أيضًا استراتيجية OpenAI مفتوحة المصدر، وتطوير GPT-5، وتأثيرات الذكاء الاصطناعي في العديد من القطاعات. يعتقد ألتمان أن منصة الذكاء الاصطناعي التي تضم مليارات المستخدمين ستكون أكثر قيمة من النماذج المتطورة، مُلمحًا إلى استراتيجيات بديلة محتملة لتحقيق الدخل تتجاوز الإعلانات.

الذكاء الاصطناعي

VGGT: إعادة بناء مشهد ثلاثي الأبعاد بسرعة البرق

2025-03-25
VGGT: إعادة بناء مشهد ثلاثي الأبعاد بسرعة البرق

يقدم Facebook Research نموذج VGGT (Visual Geometry Grounded Transformer) ، وهي شبكة عصبية تغذية أمامية قادرة على استنتاج جميع سمات المشهد ثلاثية الأبعاد الرئيسية - المعلمات الكاميرا الجوهرية والخارجية ، وخرائط النقاط ، وخرائط العمق ، وتتبع النقاط ثلاثية الأبعاد - من عرض واحد أو عدد قليل أو مئات العروض في ثوانٍ معدودة. هذا النموذج سهل الاستخدام ، والذي يستفيد من قوة المحولات ، يوفر أداة عرض ثلاثية الأبعاد تفاعلية. بشكل مدهش ، يُظهر VGGT قدرات رائعة لإعادة البناء من عرض واحد ، محققًا نتائج تنافسية مقارنةً بالطرق أحادية العين المتطورة ، على الرغم من أنه لم يتم تدريبه بشكل صريح لهذه المهمة.

الذكاء الاصطناعي محول

راحة التفاؤل الخادعة في مجال الذكاء الاصطناعي: نقد لكيسي نيوتن وكيفن روس

2025-03-25
راحة التفاؤل الخادعة في مجال الذكاء الاصطناعي: نقد لكيسي نيوتن وكيفن روس

تنقد هذه المقالة وجهات النظر المتفائلة بشكل أعمى للصحفيين التكنولوجيين كيسي نيوتن وكيفن روس حول الذكاء الاصطناعي التوليدي. ويجادل الكاتب بأن تنبؤاتهم الإيجابية تفتقر إلى أساس واقعي، بل إنها تلبي احتياجات السوق ومصالحهم الذاتية. وتفتقر ادعاءات روس حول اقتراب ظهور الذكاء الاصطناعي العام، والثناء المفرط من نيوتن على نماذج OpenAI، إلى حجج قوية. ويشير الكاتب إلى أن هذا الموقف من "التفاؤل الحذر" هو في الواقع تجنب جبان للواقع، متجاهلاً العديد من المشكلات والمخاطر المحتملة لتكنولوجيا الذكاء الاصطناعي، مثل هلوسات النماذج، والتلاعب بمعايير القياس، وأثرها على الصناعات الإبداعية. وتستخدم المقالة شركة CoreWeave كمثال للكشف عن ارتفاع درجة حرارة الاستثمار وعدم وجود نماذج أعمال مستدامة في مجال الذكاء الاصطناعي، مما يحث الناس على الحفاظ على التفكير النقدي ومواجهة تحديات تطوير تكنولوجيا الذكاء الاصطناعي.

الكود المصدري لـ AlexNet مُتاح الآن: فجر ثورة التعلم العميق

2025-03-25
الكود المصدري لـ AlexNet مُتاح الآن: فجر ثورة التعلم العميق

في عام 2012، أظهر AlexNet، الذي طوره أليكس كرزيفسكي وإيليا سوتسكفر وجيفري هينتون، لأول مرة الإمكانات الهائلة للشبكات العصبية العميقة في التعرف على الصور، مما مهد الطريق لعصر التعلم العميق. وقد تم مؤخرًا نشر الكود المصدري لـ AlexNet كمصدر مفتوح، وذلك بفضل التعاون بين متحف تاريخ الحاسوب وجوجل. كان نجاح AlexNet نابعًا من حجمه - شبكة عصبية ثنائية الأبعاد ضخمة تم تدريبها باستخدام قوة حوسبة هائلة ومجموعة بيانات ImageNet، متغلبة على قيود التعلم العميق السابقة. وقد أدى هذا الاختراق إلى عقود من الابتكار في مجال الذكاء الاصطناعي، مما أدى إلى ظهور شركات مثل OpenAI وتطبيقات مثل ChatGPT، والتي غيرت العالم.

الذكاء الاصطناعي

حل لغز فقدان الذاكرة في مرحلة الطفولة المبكرة: منطقة الحُصين لدى طفل عمره عام واحد تضيء

2025-03-25
حل لغز فقدان الذاكرة في مرحلة الطفولة المبكرة: منطقة الحُصين لدى طفل عمره عام واحد تضيء

أجرت دراسة جديدة استخدمت التصوير بالرنين المغناطيسي الوظيفي (fMRI) مسحًا لأدمغة 26 رضيعًا تتراوح أعمارهم بين 4 و 25 شهرًا، في محاولة لحل لغز فقدان الذاكرة في مرحلة الطفولة المبكرة الذي دام قرونًا. وقد كشفت الدراسة أنه في عمر سنة تقريبًا، يبدأ الحُصين، المسؤول عن تكوين الذاكرة، في العمل، مولّدًا إشارات عصبية مرتبطة بالأشياء التي تذكرها الرضع من الاختبارات. ويشير هذا إلى أن الأطفال يبدأون في ترميز الذكريات في عمر سنة تقريبًا، حتى عندما لا يزال الحُصين لديهم قيد التطور. توفر هذه الدراسة أدلة قيّمة على فهم التطور المبكر للدماغ وتكوين الذاكرة، وتلمح إلى إمكانية استعادة الذكريات المفقودة من مرحلة الطفولة في يوم من الأيام.

روبوتات الدردشة بالذكاء الاصطناعي والوحدة: سلاح ذو حدين

2025-03-25
روبوتات الدردشة بالذكاء الاصطناعي والوحدة: سلاح ذو حدين

تكشف دراستان جديدتان عن جانب مظلم محتمل لاستخدام روبوتات الدردشة بالذكاء الاصطناعي بشكل مكثف: زيادة الشعور بالوحدة والاعتماد العاطفي، خاصة بين المستخدمين المتكررين. وقد وجد الباحثون أن الأفراد الذين يعانون من الوحدة أكثر عرضة للبحث عن روابط عاطفية مع الذكاء الاصطناعي، وهو ما يعكس بحوثًا سابقة حول وسائل التواصل الاجتماعي. وعلى الرغم من أن روبوتات الدردشة بالذكاء الاصطناعي يمكن أن تقدم الدعم العاطفي، إلا أنه يجب على المنصات إعطاء الأولوية لرفاهية المستخدم، ومنع الاستخدام المفرط والاستغلال العاطفي، وتنفيذ تدابير للكشف عن أنماط الاستخدام غير الصحية والتدخل فيها. كما ينبغي للتشريعات معالجة هذه المسألة الناشئة، من خلال وضع لوائح مناسبة.

الذكاء الاصطناعي

ترقية حديثة لطريقة نيوتن: خوارزمية تحسين أسرع وأوسع نطاقًا

2025-03-25
ترقية حديثة لطريقة نيوتن: خوارزمية تحسين أسرع وأوسع نطاقًا

قبل أكثر من 300 عام، طور إسحاق نيوتن خوارزمية لإيجاد القيم الدنيا للوظائف. والآن، قام أمير علي أحمدي من جامعة برينستون وطلابه بتحسين هذه الخوارزمية للتعامل بكفاءة مع فئة أوسع من الوظائف. هذا الاختراق يستخدم المشتقات ذات الرتب الأعلى، ويحول ببراعة توسع تايلور إلى شكل محدب مجموع المربعات، مما يحقق تقاربًا أسرع من طريقة الانحدار المتدرج التقليدية. على الرغم من أنها مكلفة حسابيًا في الوقت الحالي، إلا أن التطورات المستقبلية في الحوسبة قد تسمح لهذه الخوارزمية بتجاوز طريقة الانحدار المتدرج في مجالات مثل تعلم الآلة، لتصبح أداة قوية لمشاكل التحسين.

الذكاء الاصطناعي خوارزمية التحسين طريقة نيوتن

مجموعة Ant تقلل تكاليف تدريب الذكاء الاصطناعي بنسبة 20٪ باستخدام الرقائق الصينية

2025-03-25
مجموعة Ant تقلل تكاليف تدريب الذكاء الاصطناعي بنسبة 20٪ باستخدام الرقائق الصينية

طورت مجموعة Ant، المدعومة من جاك ما، تقنيات تدريب نماذج الذكاء الاصطناعي باستخدام أشباه الموصلات المصنوعة محليًا من شركات مثل علي بابا وهواوي، مما حقق تخفيضات في التكاليف بنسبة 20٪. على الرغم من أنها لا تزال تستخدم رقائق Nvidia، إلا أن Ant تعتمد بشكل أساسي على بدائل من AMD والرقائق الصينية لأحدث نماذجها، مع نتائج مماثلة لرقاقة H800 من Nvidia. يبرز هذا جهود الصين للحد من الاعتماد على رقائق Nvidia المتطورة. كما تجاوزت نماذج اللغة الجديدة من Ant، Ling-Plus و Ling-Lite، نموذج Llama من Meta في بعض المعايير. هذه النماذج، المخصصة لتطبيقات الرعاية الصحية والتمويل، تمثل تقدمًا كبيرًا في تطوير الذكاء الاصطناعي منخفض التكلفة في الصين.

الذكاء الاصطناعي الرقائق الصينية

ARC-AGI-2: مقياس AGI أسهل للبشر، وأصعب للذكاء الاصطناعي

2025-03-24
ARC-AGI-2: مقياس AGI أسهل للبشر، وأصعب للذكاء الاصطناعي

تعود مسابقة ARC Prize 2025 مع ARC-AGI-2، وهو مقياس AGI أصعب بكثير للذكاء الاصطناعي ولكنه يبقى سهلاً نسبياً للبشر. من خلال التركيز على المهام السهلة للبشر ولكنها صعبة للذكاء الاصطناعي، يسلط ARC-AGI-2 الضوء على الفجوات في القدرات التي لا يتم سدها بمجرد توسيع نطاق النماذج الحالية. مع جائزة قدرها مليون دولار، تشجع المسابقة الابتكار مفتوح المصدر لأنظمة ذكاء اصطناعي فعالة وعامة، بهدف سد الفجوة بين البشر والذكاء الاصطناعي وتحقيق AGI الحقيقي.

الذكاء الاصطناعي

Qwen2.5-VL-32B: نموذج لغوي بصريّ بـ 32 مليار معلمة، أكثر مواءمةً مع تفضيلات البشر

2025-03-24
Qwen2.5-VL-32B: نموذج لغوي بصريّ بـ 32 مليار معلمة، أكثر مواءمةً مع تفضيلات البشر

بعد النجاح الكبير لسلسلة نماذج Qwen2.5-VL، أطلقنا نموذجًا لغويًا بصريًا جديدًا مفتوح المصدر، يضم 32 مليار معلمة، وهو Qwen2.5-VL-32B-Instruct. يتميز هذا النموذج بتحسينات كبيرة في الاستدلال الرياضي، وفهم الصور بدقة عالية، والمواءمة مع تفضيلات البشر. تُظهر اختبارات المقارنة تفوقه على النماذج المماثلة في المهام متعددة الوسائط (مثل MMMU وMMMU-Pro وMathVista)، متجاوزًا حتى نموذج Qwen2-VL-72B-Instruct الأكبر الذي يضم 72 مليار معلمة. كما يحقق أداءً متميزًا في قدرات النصوص البحتة على نفس النطاق.

الذكاء الاصطناعي نموذج لغوي بصري

AMD تكشف النقاب عن Instella: عائلة من نماذج اللغات المفتوحة بالكامل مع 3 مليارات معلمة

2025-03-24

أعلنت AMD عن Instella، وهي عائلة من نماذج اللغات المتطورة مفتوحة المصدر بالكامل، مع 3 مليارات معلمة، تم تدريبها من الصفر على وحدات معالجة الرسومات AMD Instinct™ MI300X. تتفوق نماذج Instella على النماذج المفتوحة المصدر بالكامل الموجودة من نفس الحجم، وتحقيق أداء تنافسي مقارنة بنماذج الوزن المفتوح المتطورة مثل Llama-3.2-3B. تعمل AMD على جعل جميع مكونات النموذج مفتوحة المصدر، بما في ذلك الأوزان، وتكوينات التدريب، ومجموعات البيانات، والرمز، لتعزيز التعاون والابتكار داخل مجتمع الذكاء الاصطناعي. تستخدم النماذج تقنيات تدريب فعالة وخط أنابيب تدريب متعدد المراحل.

الذكاء الاصطناعي

GPT-4o mini TTS: تحويل النص إلى كلام بسهولة

2025-03-24
GPT-4o mini TTS: تحويل النص إلى كلام بسهولة

تستخدم هذه الأداة واجهة برمجة التطبيقات GPT-4o mini TTS من OpenAI لتحويل النص إلى كلام طبيعي. تتكون العملية من ثلاث خطوات بسيطة: أدخل النص الخاص بك، وقم بتخصيص الإعدادات (ستة أصوات وسرعة قابلة للتعديل)، وقم بإنشاء صوت عالي الجودة. يتم بث الصوت مباشرة إلى متصفحك، دون تخزينه على خوادمنا. جرب أصواتًا وسرعات مختلفة للعثور على المزيج المثالي لمحتواك!

CUDA في عمر 18 عامًا: سر نيفيديا وهيمنة الذكاء الاصطناعي

2025-03-24
CUDA في عمر 18 عامًا: سر نيفيديا وهيمنة الذكاء الاصطناعي

تحتفل منصة CUDA من NVIDIA بعيدها الثامن عشر. إنها أكثر من مجرد لغة برمجة أو واجهة برمجة التطبيقات، فهي جوهر النظام البيئي للبرامج من NVIDIA، وتدعم العديد من مهام الحوسبة "التي يسهل موازاتها"، من الذكاء الاصطناعي إلى تعدين العملات المشفرة. ينبع نجاح CUDA من الاستثمار الطويل الأمد والمتواصل من NVIDIA والتحديثات المستمرة، وهو ما يمثل تباينًا صارخًا مع المنافسين مثل AMD. أبرز نجاح AlexNet تأثير CUDA المبكر في التعلم العميق، واليوم، أصبحت المعيار الفعلي في مجال الذكاء الاصطناعي، مما يشكل حماية تنافسية قوية لـ NVIDIA.

الذكاء الاصطناعي

beeFormer: سد الفجوة بين التشابه الدلالي والتفاعل في أنظمة التوصية

2025-03-24
beeFormer: سد الفجوة بين التشابه الدلالي والتفاعل في أنظمة التوصية

يقدم مشروع beeFormer نهجًا جديدًا لأنظمة التوصية المصمم لمعالجة مشكلة البدء البارد. يستخدم نماذج اللغة لتعلم أنماط سلوك المستخدم من بيانات التفاعل ونقل هذه المعرفة إلى عناصر غير مرئية. على عكس الترشيح القائم على المحتوى التقليدي، والذي يعتمد على سمات العنصر، يتعلم beeFormer أنماط تفاعل المستخدم لتوصية العناصر المتوافقة مع اهتمامات المستخدم بشكل أفضل، حتى بدون بيانات تفاعل سابقة. تُظهر التجارب تحسينات كبيرة في الأداء. يوفر المشروع خطوات تدريب مفصلة ونماذج مدربة مسبقًا، ويدعم مجموعات بيانات مثل MovieLens وGoodBooks وAmazon Books.

الذكاء الاصطناعي البدء البارد

LangManus: إطار عمل أتمتة الذكاء الاصطناعي مفتوح المصدر للتعاون متعدد الوكلاء

2025-03-23
LangManus: إطار عمل أتمتة الذكاء الاصطناعي مفتوح المصدر للتعاون متعدد الوكلاء

LangManus هو إطار عمل أتمتة للذكاء الاصطناعي مدفوع من المجتمع ومفتوح المصدر، يدمج نماذج اللغات مع أدوات للبحث على الويب والزحف وتنفيذ أكواد Python. تم تطوير هذا المشروع من قبل زملاء سابقين في أوقات فراغهم، ويهدف إلى استكشاف مجالات متعددة الوكلاء والبحث المتعمق، والمشاركة في لوحة المتصدرين GAIA. يستخدم LangManus نظامًا هرميًا متعدد الوكلاء مع أدوار مثل المنسق، والمخطط، والمشرف، والباحث، والمشفر، والمتصفح، والراوي، ويدعم تكاملات متعددة من نماذج اللغات الكبيرة، بما في ذلك نماذج Qwen والنماذج المتوافقة مع OpenAI. المشروع مفتوح المصدر بموجب ترخيص MIT ويرحب بمساهمات المجتمع.

مُحسِّن مُشفّر متقاطع يكشف أسرار ضبط نماذج اللغات الكبيرة بدقة

2025-03-23
مُحسِّن مُشفّر متقاطع يكشف أسرار ضبط نماذج اللغات الكبيرة بدقة

يُقدّم الباحثون طريقة جديدة تسمى "المُشفّر المتقاطع المُرتبط" لمقارنة النماذج الأساسية ونماذج الدردشة المُحسّنة بدقة من نماذج اللغات الكبيرة (LLMs). على عكس المُشفرات المتقاطعة التقليدية، يسمح المُشفّر المتقاطع المُرتبط لنفس العوامل الكامنة بالتشغيل في أوقات مختلفة لكل من النماذج الأساسية ونماذج الدردشة، مما يؤدي إلى تحديد أكثر فاعلية للميزات الجديدة في نموذج الدردشة. تُظهر التجارب أن هذا النهج يُوفر تفسيرات أوضح لكيفية ظهور سلوك الدردشة من قدرات النموذج الأساسي، ويُنتج عوامل كامنة أحادية المعنى أكثر. تُقدم هذه الدراسة رؤى جديدة حول عملية ضبط نماذج اللغات الكبيرة بدقة، وتُوجّه تحسينات النموذج في المستقبل.

التحقق الرسمي من نماذج تعلم الآلة في Lean 4

2025-03-23
التحقق الرسمي من نماذج تعلم الآلة في Lean 4

يوفر مشروع `formal_verif_ml` إطار عمل Lean 4 للتحقق الرسمي من خصائص (المتانة، والإنصاف، وقابلية التفسير) نماذج تعلم الآلة. وهو يتضمن مكتبة Lean، و أداة تحويل النماذج، وواجهة ويب، وخط أنابيب CI/CD، ويدعم أنواعًا متعددة من النماذج. تتيح بوابة ويب تفاعلية للمستخدمين تحميل النماذج، وعرض رمز Lean المُولّد، وتشغيل تجميع الإثبات، وتصور بنية النموذج.

الذكاء الاصطناعي

القدرة الحاسوبية تنتصر: النموذج الجديد في تطوير الذكاء الاصطناعي

2025-03-23

تتناول هذه المقالة اتجاهاً جديداً في تطوير الذكاء الاصطناعي: تفوق القدرة الحاسوبية. يستخدم الكاتب تجاربه الشخصية والأمثلة التوضيحية لإظهار أن أنظمة الذكاء الاصطناعي المصممة بشكل مفرط تشبه النباتات التي يتم الاعتناء بها بعناية ولكنها تجد صعوبة في التكيف مع البيئات المتغيرة، بينما أنظمة الذكاء الاصطناعي القائمة على القدرة الحاسوبية الضخمة، مثل النباتات التي تنمو بشكل طبيعي، يمكنها أن تتعلم وتتكيف بشكل مستقل. من خلال مقارنة النهج القائمة على القواعد، والقدرة الحاسوبية المحدودة، والحلول القابلة للتوسع في بناء أنظمة أتمتة خدمة العملاء، يوضح الكاتب تفوق الحل القابل للتوسع. إن ظهور التعلم المعزز (RL) يؤكد هذا الاتجاه بشكل أكبر، حيث يستكشف حلولًا متعددة من خلال القدرة الحاسوبية الضخمة، محققًا نتائج تتجاوز التصميم البشري. في المستقبل، سيتحول دور مهندسي الذكاء الاصطناعي من إنشاء خوارزميات مثالية إلى بناء أنظمة قادرة على الاستفادة من موارد الحوسبة الضخمة بكفاءة.

الذكاء الاصطناعي القدرة الحاسوبية
1 2 27 28 29 31 33 34 35 48 49