Category: الذكاء الاصطناعي

جيمّا من جوجل: عائلة من النماذج متعددة الوسائط خفيفة الوزن

2025-03-12
جيمّا من جوجل: عائلة من النماذج متعددة الوسائط خفيفة الوزن

كشفت جوجل عن جيمّا، وهي عائلة خفيفة الوزن من النماذج متعددة الوسائط المبنية على تقنية جيميني. تُعالج نماذج جيمّا 3 النصوص والصور، وتتميز بنوافذ سياقية حجمها 128 كيلوبايت، وتدعم أكثر من 140 لغة. وهي متوفرة بأحجام معلمات تتراوح بين 1 مليار و27 مليار، وتتميز بأدائها الممتاز في مهام مثل الإجابة على الأسئلة، والتلخيص، والاستنتاج، بينما يسمح تصميمها المدمج بنشرها على الأجهزة ذات الموارد المحدودة. تُظهر نتائج الاختبارات أداءً قويًا عبر العديد من المهام، خاصةً في القدرات متعددة اللغات والوسائط.

الذكاء الاصطناعي نموذج خفيف الوزن

كسر حاجز الخوارزميات: التدريب المسبق التوليدي الفعال مع مطابقة اللحظات الاستنتاجية (IMM)

2025-03-12
كسر حاجز الخوارزميات: التدريب المسبق التوليدي الفعال مع مطابقة اللحظات الاستنتاجية (IMM)

تقدم Luma Labs تقنية تدريب أولية جديدة تسمى مطابقة اللحظات الاستنتاجية (IMM) ، والتي تعالج ركود الابتكار الخوارزمي في التدريب المسبق التوليدي. يتفوق IMM بشكل ملحوظ على نماذج الانتشار من حيث جودة العينة وكفاءة أخذ العينات ، محققًا زيادة تزيد عن عشرة أضعاف في الأخيرة. من خلال دمج خطوة الوقت الهدف ، يعزز IMM مرونة كل تكرار استنتاجي ، متغلبًا على قيود الاستيفاء الخطي في نماذج الانتشار. تُظهر التجارب درجات FID متطورة على مجموعتي بيانات ImageNet و CIFAR-10 ، بالإضافة إلى ثبات تدريب متفوق. يمثل هذا البحث تقدمًا كبيرًا في خوارزميات التدريب المسبق التوليدي ، مما يمهد الطريق لإنجازات مستقبلية في نماذج الأساس متعددة الوسائط.

نموذج Mistral OCR الجديد مخيب للآمال ؛ Google Gemini 2.0 يتصدر

2025-03-11
نموذج Mistral OCR الجديد مخيب للآمال ؛ Google Gemini 2.0 يتصدر

تكشف الاختبارات الحديثة أن نموذج Mistral OCR الجديد المخصص لا يفي بوعوده التسويقية. ويبرز المطوران Willis و Doria مشاكل في معالجة التصاميم المعقدة والخط اليدوي، بما في ذلك تكرار أسماء المدن، والأخطاء العددية، والهلوسات. على النقيض من ذلك، يتفوق Google Gemini 2.0 Flash Pro Experimental، ويعالج ملفات PDF المعقدة التي لا يستطيع Mistral معالجتها، بما في ذلك تلك التي تحتوي على محتوى مكتوب بخط اليد. تُعد نافذة السياق الكبيرة ميزة رئيسية. على الرغم من كونه واعدًا، إلا أن OCR القائم على LLM يعاني من مشاكل مثل اختلاق المعلومات، وسوء تفسير التعليمات، وسوء تفسير البيانات بشكل عام.

الذكاء الاصطناعي

ليجون هيلث: رعاية نفسية مدعومة بالذكاء الاصطناعي - نوظف!

2025-03-11
ليجون هيلث: رعاية نفسية مدعومة بالذكاء الاصطناعي - نوظف!

تقوم شركة ليجون هيلث المدعومة من واي كومبايناتور بتوظيف مهندسي ذكاء اصطناعي من ذوي الخبرة العالية لبناء نظام رعاية صحية عقلية مدعوم بالذكاء الاصطناعي. يركزون على الكفاءة التشغيلية بدلاً من تشخيص الذكاء الاصطناعي، حيث يعملون على تحسين الطب النفسي عن بُعد من خلال الذكاء الاصطناعي. سيقوم المهندسون بالعمل على تحسين سير العمل الخاص بـ LLM، وتحسين نماذج الذكاء الاصطناعي للجدولة، وتقييم المخاطر، وأتمتة دورة الإيرادات، وصقل حلقات التغذية الراجعة، وتطبيق التعلم المعزز. المرشحون المثاليون لديهم أكثر من 3 سنوات من الخبرة في هندسة الذكاء الاصطناعي/التعلم الآلي، ومهارات قوية في بايثون والتعلم الآلي (LLMs، NLP، PyTorch/TensorFlow)، واهتمام بالذكاء الاصطناعي في الرعاية الصحية.

الذكاء الاصطناعي

Firefly: ردود فعل لياقة بدنية في الوقت الحقيقي مدعومة بالذكاء الاصطناعي

2025-03-11

Firefly هو تطبيق تمارين رياضية فريد يوفر ملاحظات على الشكل في الوقت الحقيقي باستخدام متتبع وضعية موثوق وبيانات مدربين. على عكس التطبيقات التي تقترح فقط روتينًا، يقوم Firefly بتقييم شكلك ويوفر تصحيحات فورية لكل تكرار، مما يضمن التقنية الصحيحة ومنع الإصابات. سرعته ودقته تتجاوزان المنافسين، حيث يستخدم بيانات مدربين خاصة بدلاً من مصادر خارجية غير موثوقة. يوفر Firefly ملاحظات مستمرة، مما يساعدك على التحسين حتى عند ارتكاب الأخطاء.

فك تشفير نشاط الدماغ اللغوي البشري باستخدام Whisper

2025-03-11
فك تشفير نشاط الدماغ اللغوي البشري باستخدام Whisper

استخدم الباحثون نموذج Whisper لتحليل إشارات تخطيط كهربية القشرة الدماغية (ECoG) وإشارات الكلام من أربعة مرضى مصابين بالصرع أثناء محادثات طبيعية. أظهرت النتائج أن التضمينات الصوتية، والكلام، واللغة من Whisper تنبأت بدقة بالنشاط العصبي، خاصة أثناء إنتاج الكلام وفهمه. برزت تضمينات الكلام في المناطق الحسية والحركية، بينما حققت تضمينات اللغة أداءً أفضل في المناطق اللغوية ذات المستوى الأعلى. تكشف الدراسة عن كيفية ترميز معلومات الكلام واللغة عبر مناطق متعددة في الدماغ، وكيف تؤثر معلومات الكلام على معالجة اللغة. كما تم اكتشاف ديناميكيات زمنية مميزة لتدفق المعلومات أثناء إنتاج الكلام وفهمه، بالإضافة إلى الاختلافات بين نماذج التعلم العميق والنماذج الرمزية في التنبؤ بالنشاط العصبي.

الذكاء الاصطناعي

بيئة تعلم فاكتوري: مقياس جديد لأنظمة اللغات الضخمة

2025-03-11

تتجاوز نماذج اللغات الكبيرة (LLMs) بسرعة المعايير المرجعية الحالية، مما يتطلب تقييمات مفتوحة جديدة. نقدم بيئة تعلم فاكتوري (FLE)، القائمة على لعبة فاكتوري، والتي تختبر الوكلاء في التخطيط طويل الأجل، وتوليف البرامج، وتحسين الموارد. تقدم FLE تحديات مفتوحة وقابلة للتوسع بشكل كبير - من الأتمتة الأساسية إلى المصانع المعقدة التي تعالج ملايين وحدات الموارد في الثانية. نوفر إعدادين: لعب مختبري مع 24 مهمة منظمة وموارد ثابتة، ولعب مفتوح، وهو مهمة غير محدودة لبناء أكبر مصنع من الصفر على خريطة تم إنشاؤها إجرائيًا. نوضح في كلا الإعدادين أن النماذج لا تزال تفتقر إلى القدرة على التفكير المكاني القوي. في اللعب المختبري، نجد أن نماذج اللغات الكبيرة تُظهر مهارات واعدة على المدى القصير، لكنها غير قادرة على العمل بكفاءة في البيئات المقيدة، مما يعكس قيودًا في تحليل الأخطاء. في اللعب المفتوح، بينما تكتشف نماذج اللغات الكبيرة استراتيجيات أتمتة لتحسين النمو (مثل الحفر الكهربائي)، فإنها تفشل في تحقيق أتمتة معقدة (مثل تصنيع الدوائر الإلكترونية).

الذكاء الاصطناعي

فك شفرة الفهم الدلالي: تشابه جيب التمام في الذكاء الاصطناعي

2025-03-10
فك شفرة الفهم الدلالي: تشابه جيب التمام في الذكاء الاصطناعي

تشرح هذه المقالة بوضوح تشابه جيب التمام وتطبيقاته في الذكاء الاصطناعي، خاصة في فهم العلاقات الدلالية بين الكلمات. تبدأ المقالة بشرح المتجهات، ثم تفصل حساب تشابه جيب التمام بمثال خطوة بخطوة. يتم تقديم تنفيذ دالة تشابه جيب التمام بلغة تايبسكريبت، بالإضافة إلى نسخة مُحسّنة. ثم تستكشف المقالة حالات استخدام حقيقية في تطبيقات الويب، مثل توصيات المنتجات والبحث الدلالي، وتُظهر كيفية استخدام نماذج التضمين من OpenAI لتحسين الدقة. كما تُبرز المقالة التنفيذ الفعال باستخدام Math.hypot() وأهمية الحساب المسبق للتضمينات في بيئات الإنتاج.

الذكاء الاصطناعي متجهات

هل ستُوفر الذكاء الاصطناعي "قرنًا مضغوطًا من القرن الحادي والعشرين"؟ شكوك باحث

2025-03-10

يتحدى الكاتب فكرة أن الذكاء الاصطناعي سيُحدث قريبًا طفرة سريعة في التقدم العلمي. مستندًا إلى خبرته الشخصية وأمثلة من عباقرة العلم عبر التاريخ، يجادل بأن التقدم العلمي الحقيقي لا ينبع من إتقان المعارف الموجودة، بل من تحدي المعتقدات الراسخة وطرح أسئلة ثورية. تُتقن نماذج الذكاء الاصطناعي الحالية "ملء الفراغات" بدلاً من توليد أفكار أصلية. يقترح الكاتب أن هناك حاجة إلى مقاييس تقييم جديدة لقياس قدرة الذكاء الاصطناعي على طرح أسئلة مُحفزة ودفع تحولات نمطية، بدلاً من التركيز فقط على دقته في الإجابة على الأسئلة المعروفة.

الذكاء الاصطناعي الاختراق العلمي تحول النموذج

نماذج اللغات الكبيرة والبشر يُظهرون تحيزًا: تجربة تصنيف جاذبية أصوات توليف الكلام

2025-03-10

في العام الماضي، استخدم الكاتب نماذج لغات كبيرة لتصنيف مستخدمي Hacker News، واكتشف تحيزًا حيث فضلت النماذج باستمرار المستخدم المذكور أولاً في المطالبة. هذا العام، كشفت تجربة جديدة لتصنيف جاذبية أصوات توليف الكلام عن تحيز مشابه لدى المشاركين البشريين، الذين فضلوا الأصوات المعروضة على الجانب الأيمن من الشاشة. هذا يعزز النتائج السابقة للكاتب ويبرز أهمية حجم العينة والعشوائية عند استخدام أحكام من الذكاء الاصطناعي والبشر لتخفيف التحيز.

الذكاء الاصطناعي تحيز بشري أصوات توليف الكلام

روبوت محادثة Graph RAG داخل المتصفح باستخدام Kuzu-Wasm و WebLLM

2025-03-10
روبوت محادثة Graph RAG داخل المتصفح باستخدام Kuzu-Wasm و WebLLM

تُظهر هذه التدوينة مدونة روبوت محادثة يعمل بالكامل داخل المتصفح، تم إنشاؤه باستخدام Kuzu-Wasm و WebLLM، ويستخدم تقنية توليد التعزيز باستعادة الرسم البياني (Graph RAG) للإجابة على أسئلة اللغة الطبيعية حول بيانات LinkedIn. يستخدم التطبيق مزايا WebAssembly، مما يسمح بمعالجة البيانات محليًا لتعزيز الخصوصية وتبسيط النشر. تم تفصيل العمارة والتنفيذ وإدخال البيانات ومطالبات WebLLM وملاحظات الأداء. على الرغم من وجود بعض القيود الحالية، مثل حجم النموذج والسرعة، إلا أن التطورات في WebAssembly وظهور نماذج LLMs أصغر وأفضل تشير إلى مستقبل واعد لمثل هذه الأنابيب المتقدمة التي تعمل بالكامل داخل المتصفح.

الذكاء الاصطناعي قاعدة بيانات رسومية

RTX 5090: معايير أداء Llama.cpp الأولية للذكاء الاصطناعي

2025-03-10

بعد اختبارات معايير الأداء CUDA وOpenCL وOptiX الخاصة بمعالج RTX 5090، حفز اهتمام القراء على إجراء تحقيق في أدائه في مجال الذكاء الاصطناعي، وتحديداً مع Llama.cpp. تُظهر معايير الأداء الأولية التي تقارن بين RTX 5090 وبطاقات سلسلة RTX 40 وRTX 30 باستخدام Llama.cpp (مع نماذج Llama 3.1 وMistral 7B) مكاسب كبيرة في الأداء لمعالج RTX 5090 في توليد النصوص ومعالجة المطالبات. وسيتم إجراء المزيد من اختبارات معايير الأداء الأكثر شمولاً لاحقاً، بناءً على اهتمام القراء.

الذكاء الاصطناعي أداء الذكاء الاصطناعي

هل انتهى زخم نماذج اللغات الضخمة؟

2025-03-10
هل انتهى زخم نماذج اللغات الضخمة؟

تقدم هذه المقالة نظرة متفائلة بحذر حول التقدم الحالي لأنماط اللغات الكبيرة (LLMs). يُجادل الكاتب بأن نماذج LLMs، على الرغم من تفوقها في مهام محددة، إلا أن المسار التكنولوجي الحالي من غير المرجح أن يؤدي إلى الذكاء الاصطناعي العام (AGI). تتمثل التحسينات في تحسينات تدريجية، تتجلى في تطورات طفيفة وتحسينات في المعايير بدلاً من قفزات أساسية في القدرات. يتنبأ الكاتب بأنه في السنوات القادمة، ستصبح نماذج LLMs أدوات مفيدة، لكنها لن تؤدي إلى AGI أو أتمتة واسعة النطاق. قد تتطلب الاختراقات المستقبلية نهجًا جديدًا تمامًا.

الذكاء الاصطناعي

مشفرات أوتوماتيكية ذات فقدان متغير: عندما تتجاهل شبكات RNN المتغيرات الكامنة

2025-03-09
مشفرات أوتوماتيكية ذات فقدان متغير: عندما تتجاهل شبكات RNN المتغيرات الكامنة

يتناول هذا البحث التحدي المتمثل في دمج الشبكات العصبية المتكررة (RNN) مع مشفرات أوتوماتيكية متغيرة (VAEs). بينما تستخدم VAEs متغيرات كامنة لتعلم تمثيلات البيانات، غالبًا ما تتجاهل شبكات RNN كفكاكات هذه المتغيرات، وتتعلم توزيع البيانات مباشرة. يقترح المؤلفون مشفرات أوتوماتيكية متغيرة ذات فقدان (VLAEs)، والتي تقيد وصول RNN إلى المعلومات، مما يجبرها على استخدام المتغيرات الكامنة لتشفير الهيكل العام. تُظهر التجارب أن VLAEs تتعلم تمثيلات كامنة مضغوطة وغنية دلاليًا.

الذكاء الاصطناعي تعلم التمثيل

إطار عمل الوكلاء المتطورين: أنظمة بيئية تعاونية لوكلاء الذكاء الاصطناعي

2025-03-09
إطار عمل الوكلاء المتطورين: أنظمة بيئية تعاونية لوكلاء الذكاء الاصطناعي

يُعد إطار عمل الوكلاء المتطورين نظامًا جاهزًا للإنتاج لبناء وإدارة وتطوير وكلاء الذكاء الاصطناعي مع اتصال ذكي. وهو يُمكّن النظم البيئية التعاونية للوكلاء الذين يفهمون المتطلبات دلاليًا، ويتعلمون من الخبرة، ويتواصلون بفعالية لحل المهام المعقدة. وتشمل الميزات الرئيسية تطور الوكيل (إعادة الاستخدام أو التكيف أو الإنشاء)، والاتصال بين الوكلاء من خلال نظام سير عمل YAML، ومكتبة ذكية مع بحث دلالي مدعوم بدمج OpenAI، والتحسين الذاتي من خلال التعلم المستمر، ودعم إطار عمل متعدد (BeeAI، OpenAI، إلخ). يستخدم الإطار وكيلًا للنظام لتحديد ما إذا كان سيتم إعادة استخدام أو تطوير أو إنشاء وكلاء جدد بناءً على التشابه الدلالي، ويتضمن الحوكمة من خلال البرامج الثابتة. يوضح مثال شامل تعاون وتطور الوكيل لمهام مثل تحليل الفواتير.

الذكاء الاصطناعي

الذكاء الاصطناعي: الضجة مقابل الواقع - تحول تقني، وليس سيناريو سكاي نت

2025-03-08
الذكاء الاصطناعي: الضجة مقابل الواقع - تحول تقني، وليس سيناريو سكاي نت

أدى التقدم السريع في مجال الذكاء الاصطناعي إلى إثارة مخاوف واسعة النطاق بشأن فقدان الوظائف وحتى التهديدات الوجودية. تجادل هذه المقالة بأن الذكاء الاصطناعي، في جوهره، هو محرك لمعالجة الأنماط، يتعلم توزيعات الاحتمالات من البيانات لإجراء التنبؤات، وليس التفكير الحقيقي. على الرغم من أن الذكاء الاصطناعي يحقق نتائج رائعة في توليد الصور وإنشاء النصوص، إلا أن هناك قيودًا لا تزال قائمة، بما في ذلك الهلوسة ونقص التفكير المنطقي الحقيقي. يرسم الكاتب أوجه تشابه مع التحولات التكنولوجية السابقة، مشددًا على قدرة البشر على التكيف. سيؤدي الذكاء الاصطناعي إلى أتمتة المهام، ولكنه سيخلق أيضًا فرصًا جديدة، مما يحث على تبني التغيير بشكل استباقي وإعادة توجيه الطاقة البشرية نحو مساعي أكثر أهمية.

الذكاء الاصطناعي التحول التكنولوجي

الذكاء الاصطناعي يحل لغز الكتابة المسمارية عمرها 3000 عام، ثورة في دراسات الحضارات القديمة

2025-03-08
الذكاء الاصطناعي يحل لغز الكتابة المسمارية عمرها 3000 عام، ثورة في دراسات الحضارات القديمة

طور باحثون من جامعتي كورنيل وتل أبيب نظامًا للذكاء الاصطناعي يسمى ProtoSnap، يُحدد و ينسخ تلقائيًا رموز الكتابة المسمارية من ألواح عمرها 3000 عام. باستخدام نموذج الانتشار، يقارن ProtoSnap تشابه وحدات البكسل بين صورة الرمز ونماذج أولية، مما يعيد إنشاء الرموز بدقة على الرغم من اختلافات أنماط الكتابة والعمر. هذا يُسرّع بشكل كبير ترجمة وبحث الكتابة المسمارية، ويوفر مجموعات بيانات ضخمة لدراسة المجتمعات القديمة، ويُقدّم رؤى جديدة حول دياناتها واقتصادياتها وهياكلها الاجتماعية ونظمها القانونية.

الذكاء الاصطناعي الكتابة المسمارية

ريفلَكشن إيه آي: 130 مليون دولار لتمويل مشروع الذكاء الخارق

2025-03-08
ريفلَكشن إيه آي: 130 مليون دولار لتمويل مشروع الذكاء الخارق

حصلت شركة ريفلَكشن إيه آي، وهي شركة ناشئة أسسها باحثون سابقون في جوجل ديب مايند، على تمويل قدره 130 مليون دولار في جولتي تمويل البذور وجولة التمويل الأولية من الفئة أ، لتصل قيمتها إلى 555 مليون دولار. ويهدف هذا المشروع الطموح إلى إنشاء ما يسمى بـ "الذكاء الخارق"، وهو نظام ذكاء اصطناعي قادر على التعامل مع معظم المهام المتعلقة بالحاسوب. ويركز المشروع في مراحله الأولى على أداة برمجة مستقلة تعتمد على نماذج اللغات الكبيرة (LLMs) وتعلم التعزيز، مع استكشاف بنى عصبية جديدة تتجاوز نماذج المحولات لزيادة الكفاءة. وستقوم هذه الأداة بأتمتة مهام مثل فحص الثغرات الأمنية، وتحسين استخدام الذاكرة، واختبارات الموثوقية، بهدف النهائي هو التعامل مع أحمال العمل الضخمة بشكل مستقل.

الذكاء الاصطناعي الذكاء الخارق

شبكة معلومات خاطئة روسية تتسلل إلى روبوتات الدردشة بالذكاء الاصطناعي الغربية

2025-03-07
شبكة معلومات خاطئة روسية تتسلل إلى روبوتات الدردشة بالذكاء الاصطناعي الغربية

تتسلل شبكة معلومات خاطئة مقرها موسكو تسمى "Pravda" (تعني الحقيقة بالروسية) إلى بيانات روبوتات الدردشة بالذكاء الاصطناعي، حيث تضخ ادعاءات كاذبة ودعاية للتلاعب بردودها على الأخبار. من خلال إغراق نتائج البحث بمعلومات خاطئة مؤيدة للكرملين، تشوه الشبكة الطريقة التي تعالج بها نماذج اللغة الكبيرة المعلومات. وقد أدى ذلك إلى دمج ملايين المقالات من الدعاية الروسية في أنظمة الذكاء الاصطناعي الغربية، مما أدى إلى إصابة مخرجاتها. كشف تدقيق أجرته NewsGuard على 10 روبوتات دردشة رائدة بالذكاء الاصطناعي أنها كررت الروايات الخاطئة من شبكة Pravda بنسبة 33% من الوقت. الشبكة لا تنشئ محتوى أصليًا، بل تعمل كآلة لغسل الأموال للدعاية الكرملينية، حيث تجمعها عبر العديد من المواقع الإلكترونية التي تبدو مستقلة. هذه العملية واسعة النطاق تبرز مدى ضعف نماذج الذكاء الاصطناعي أمام حملات المعلومات الخاطئة.

الذكاء الاصطناعي دعاية روسية

Reflection AI: بناء الذكاء الفائق من خلال البرمجة الذاتية

2025-03-07
Reflection AI: بناء الذكاء الفائق من خلال البرمجة الذاتية

تقوم Reflection AI ببناء أنظمة مستقلة فائقة الذكاء. كان أعضاء الفريق جزءًا أساسيًا في مشاريع مثل AlphaGo، وقد قادوا اختراقات رئيسية في مجال التعلم المعزز ونماذج اللغات الكبيرة. يعتقدون أن البرمجة الذاتية هي المفتاح للذكاء الفائق الأوسع نطاقًا، ويخططون أولاً لبناء نظام برمجة ذاتي فائق الذكاء، ثم توسيع هذا النموذج إلى جميع المهام الأخرى القائمة على الكمبيوتر. تركز الشركة على التطبيقات الواقعية، حيث تتكرر مع ملاحظات المستخدم لضمان تلبية الأنظمة بشكل موثوق لاحتياجات العالم الحقيقي، وتشكيل مستقبل الذكاء الاصطناعي بشكل مسؤول.

جزيء طبيعي ينافس أوزيمبيك في إنقاص الوزن، بدون آثار جانبية

2025-03-07
جزيء طبيعي ينافس أوزيمبيك في إنقاص الوزن، بدون آثار جانبية

استخدم باحثون من كلية الطب في جامعة ستانفورد خوارزمية ذكاء اصطناعي لاكتشاف جزيء طبيعي، يُسمى BRP، ينافس عقار سيماجلوتيد (أوزيمبيك) في كبح الشهية وخفض الوزن. ومن المهم ملاحظة أن الاختبارات على الحيوانات أظهرت أن BRP يتجنب الآثار الجانبية مثل الغثيان والإمساك وفقدان كتلة العضلات. يعمل BRP من خلال مسار استقلابي مختلف ولكنه مشابه، يستهدف منطقة ما تحت المهاد للتحكم في الشهية. وقد تم تأسيس شركة لإطلاق تجارب سريرية على البشر. وقد اعتمد هذا الاختراق على الذكاء الاصطناعي لفحص آلاف البروتينات، مما يوفر طريقة جديدة واعدة لعلاج السمنة.

الذكاء الاصطناعي إنقاص الوزن

ما وراء النماذج الانحدارية الذاتية: الحدود القادمة للذكاء الاصطناعي

2025-03-07

معظم نماذج الذكاء الاصطناعي التوليدية في الوقت الحاضر هي نماذج انحدارية ذاتية، مما يعني أنها تتوقع الرمز التالي، حيث تُعدّ بنية المحوّل التنفيذ السائد بسبب كفاءتها الحسابية. ومع ذلك، فإن النماذج الانحدارية الذاتية لها قيود جوهرية، مثل نقص قدرات التخطيط والتفكير، والذاكرة طويلة المدى المحدودة، والميل إلى "الهلوسة". ويجادل الكاتب بأن التفكير البشري ليس انحدارياً ذاتياً بحتاً، بل يشمل التفكير غير المتسلسل والتخطيط. ولتحقيق ذكاء اصطناعي أقرب إلى الإدراك البشري، يستكشف الباحثون نماذج بديلة مثل JEPA ونماذج الانتشار، والتي تولد المحتوى من خلال الصقل المتكرر أو إزالة الضوضاء من الضوضاء، مما يعكس عمليات التفكير البشرية بشكل أدق.

الذكاء الاصطناعي هندسة النماذج

InstantStyle: إطار عمل لنقل الأنماط بنقرة واحدة لتوليد صور الذكاء الاصطناعي دون عناء

2025-03-07
InstantStyle: إطار عمل لنقل الأنماط بنقرة واحدة لتوليد صور الذكاء الاصطناعي دون عناء

InstantStyle هو إطار عمل بسيط ولكنه قوي لنقل أنماط الصور، حيث يحقق التحكم الدقيق في الأنماط من خلال فصل معلومات المحتوى والنمط للصورة بذكاء. يستخدم الميزات العالمية لـ CLIP ويركز على طبقات الاهتمام المحددة (up_blocks.0.attentions.1 و down_blocks.2.attentions.1) للتحكم في النمط والتصميم. تم دمج InstantStyle في أدوات شائعة مثل diffusers، ويدعم نماذج مثل SDXL و SD1.5، كما يوفر عروضًا توضيحية عبر الإنترنت وقدرات توليد عالية الدقة، مما يبسط سير العمل بشكل كبير ويوفر للمستخدمين تجربة مريحة لتوليد الصور المنمقة.

الذكاء الاصطناعي نقل الأنماط

آلات خلوية منطقية قابلة للاشتقاق: من لعبة الحياة إلى توليد الأنماط باستخدام دوائر متكررة مُتعلمة

2025-03-07

تُقدم هذه الورقة آلة خلوية منطقية قابلة للاشتقاق (DiffLogic CA) ، وهي بنية جديدة لآلات الخلايا العصبية (NCA) تستخدم حالة خلية منفصلة بالكامل يتم تحديثها عبر دائرة ثنائية متكررة مُتعلمة. باستبدال مكونات الشبكة العصبية بشبكات منطقية قابلة للاشتقاق عميقة ، يسمح ذلك بتدريب قابل للاشتقاق لبابات المنطق المنفصلة. يتم إثبات نجاح تطبيق بوابات المنطق القابلة للاشتقاق على الآلات الخلوية من خلال تكرار لعبة كونواي للحياة وتوليد الأنماط من خلال ديناميكيات منفصلة مُتعلمة. يُبرز هذا إمكانات دمج المنطق المنفصل داخل NCAs ويُثبت أن شبكات بوابات المنطق القابلة للاشتقاق يمكن تعلمها بفعالية في الهياكل المتكررة. على الرغم من كونها واعدة ، إلا أن التدريب على الأشكال المعقدة لا يزال يُمثل تحديًا ، مما يُشير إلى أعمال مستقبلية على الهياكل الهرمية وبوابات متخصصة لتحسين إدارة الحالة.

نماذج اللغات الكبيرة القائمة على الانتشار: تغيير جذري في نماذج اللغات

2025-03-06

كشفت شركة Inception Labs عن نموذج لغة كبير قائم على الانتشار (dLLM) ثوري يتحدى النهج التلقائي التكراري التقليدي. على عكس النماذج التلقائية التكرارية التي تتنبأ بالرموز بشكل تسلسلي، تولد نماذج dLLM مقاطع نصية في وقت واحد، وتُحسّنها بشكل تكراري. هذه الطريقة، التي حققت نجاحًا في نماذج الصور والفيديو، تتفوق الآن على نماذج LLMs من نفس الحجم في توليد الأكواد، مع تحسين السرعة والكفاءة بنسبة تتراوح بين 5 و 10 أضعاف. الميزة الرئيسية؟ تقليل الهلوسة. تولد نماذج dLLM وتُصحّح الأجزاء المهمة قبل المتابعة، وهو أمر بالغ الأهمية للتطبيقات التي تتطلب الدقة، مثل روبوتات الدردشة والوكلاء الذكيين. هذا النهج يعد بتحسين سير عمل الوكلاء متعددي الخطوات، وتجنب الدورات، وتحسين التخطيط، والتفكير، والتصحيح الذاتي.

الذكاء الاصطناعي توليد الاكواد

نموذج كشف دور الحديث مفتوح المصدر: Smart Turn

2025-03-06
نموذج كشف دور الحديث مفتوح المصدر: Smart Turn

أصدر فريق Pipecat نموذج كشف دور الحديث مفتوح المصدر Smart Turn، والذي يهدف إلى تحسين أنظمة الذكاء الاصطناعي الصوتية القائمة على كشف النشاط الصوتي (VAD). يستخدم النموذج Wav2Vec2-BERT من Meta AI كعمود فقري، مع رأس تصنيف بسيط من طبقتين. يدعم النموذج حاليًا اللغة الإنجليزية، وهو في مرحلة مبكرة من إثبات المفهوم، لكن الفريق واثق من إمكانية تحسين أدائه بسرعة. يدعون مجتمع المصادر المفتوحة للمساهمة في تحسين النموذج وتوسيع دعمه اللغوي وقدراته.

الذكاء الاصطناعي

كوكو: منظمة غير ربحية للصحة النفسية تعمل بالذكاء الاصطناعي تبحث عن قائد تقني

2025-03-06
كوكو: منظمة غير ربحية للصحة النفسية تعمل بالذكاء الاصطناعي تبحث عن قائد تقني

تبحث كوكو، وهي منظمة غير ربحية تعمل في مجال تكنولوجيا الصحة النفسية أسسها مهندسون سابقون من معهد ماساتشوستس للتكنولوجيا وأير بي إن بي، عن قائد تقني. إنهم يبنيون أنظمة ذكاء اصطناعي قابلة للتطوير لتقديم دعم فوري للصحة النفسية عبر الإنترنت للشباب، من خلال دمج تدخلاتهم في منصات مثل تيك توك وديسكورد. بعد أن ساعدوا أكثر من 4 ملايين شاب في 199 دولة، تُركز كوكو على قرارات المنتجات القائمة على البيانات، واختبارات أ/ب، ومعايير السلامة الصارمة. هذه فرصة لإحداث تأثير كبير باستخدام الذكاء الاصطناعي لتحقيق الخير.

الذكاء الاصطناعي

نماذج استنتاج رخيصة تتفوق على عمالقة التكنولوجيا: حل الألغاز المنطقية باستخدام التعلم المعزز

2025-03-06
نماذج استنتاج رخيصة تتفوق على عمالقة التكنولوجيا: حل الألغاز المنطقية باستخدام التعلم المعزز

استخدم الباحثون تقنية التعلم المعزز لتدريب نماذج لغة مفتوحة المصدر أصغر حجماً وأقل تكلفة، متفوقة على نماذج DeepSeek R1 و OpenAI o1 و o3-mini، وقريبة من أداء نموذج Anthropic Sonnet 3.7 في لعبة تعتمد على المنطق تسمى "الدليل الزمني"، مع انخفاض تكلفة الاستنتاج بأكثر من 100 مرة. وقد حققوا ذلك من خلال تصميم دقيق للمهام، وضبط المعلمات الفائقة، واستخدام خوارزمية تحسين السياسة النسبية للمجموعة (GRPO) ومكتبة torchtune. تُظهر هذه الدراسة إمكانات التعلم المعزز في تدريب النماذج المفتوحة المصدر بكفاءة لمهام الاستنتاج المعقدة، حتى مع البيانات المحدودة، محققة مكاسب كبيرة في الأداء مع 16 مثالاً تدريبياً فقط.

الذكاء الاصطناعي

جلسة أسئلة وأجوبة مع خبير الذكاء الاصطناعي ويليام جيه رابابورت: مستقبل الذكاء الاصطناعي واختبار تورينج

2025-03-06
جلسة أسئلة وأجوبة مع خبير الذكاء الاصطناعي ويليام جيه رابابورت: مستقبل الذكاء الاصطناعي واختبار تورينج

في 27 مارس، سنُقيم جلسة أسئلة وأجوبة مع الأستاذ ويليام جيه رابابورت، خبير ذكاء اصطناعي مرموق من جامعة بوفالو، حاصل على وظائف في علوم الكمبيوتر والهندسة والفلسفة واللغويات. الأستاذ رابابورت، مؤلف كتاب "فلسفة علوم الكمبيوتر" الرائد، والعديد من المقالات المهمة، بما في ذلك أعمال حديثة حول نجاح الذكاء الاصطناعي ونماذج اللغات الكبيرة فيما يتعلق باختبار تورينج، سيكون متاحًا للإجابة على أسئلتكم. أرسل أسئلتكم عبر هذا النموذج! هذه فرصة نادرة للتفاعل مباشرةً مع باحث رائد في مجال الذكاء الاصطناعي.

الذكاء الاصطناعي خبير

Mistral OCR: واجهة برمجة تطبيقات (API) ثورية للتعرف الضوئي على الحروف (OCR) تُطلق العنان لقوة المعلومات الرقمية

2025-03-06
Mistral OCR: واجهة برمجة تطبيقات (API) ثورية للتعرف الضوئي على الحروف (OCR) تُطلق العنان لقوة المعلومات الرقمية

تُحدد Mistral OCR، وهي واجهة برمجة تطبيقات جديدة للتعرف الضوئي على الحروف (OCR)، معيارًا جديدًا لفهم الوثائق. على عكس غيرها، فإنها تفهم الوسائط والنصوص والجدول والرموز الرياضية بدقة ووعي غير مسبوقين. باستخدام الصور وملفات PDF كمدخلات، تقوم باستخراج المحتوى كنص وصور متداخلة. بفضل أدائها المتطور في الوثائق المعقدة، ودعمها للغات متعددة، ونتائجها الرائدة في الاختبارات المعيارية، تُعد Mistral OCR النموذج الافتراضي لملايين المستخدمين على Le Chat. وتوفر وظيفة الوثيقة كإيحاء، ومخرجات منظمة (JSON)، مع خيار الاستضافة الذاتية الانتقائية للبيانات الحساسة. تتوفر واجهة برمجة التطبيقات على la Plateforme، بسعر 1000 صفحة لكل دولار (مع استنتاج الدُفعات الذي يوفر قيمة أفضل).

الذكاء الاصطناعي
1 2 30 31 32 34 36 37 38 48 49