Category: الذكاء الاصطناعي

Mistral OCR: معيار جديد في فهم الوثائق

2025-03-06
Mistral OCR: معيار جديد في فهم الوثائق

Mistral OCR هي واجهة برمجة تطبيقات متطورة لمعالجة الصور بصرية (OCR) تحدد معيارًا جديدًا لفهم الوثائق. على عكس النماذج الأخرى، فهي تفهم الوسائط والرسائل النصية والجدول والأسطر والمعادلات بدقة عالية. باستخدام الصور وملفات PDF كمدخلات، تستخرج المحتوى كنص وصور متداخلة، مما يجعلها مثالية لأنظمة استرجاع المعلومات بناءً على الأسئلة (RAG) التي تعالج الوثائق متعددة الوسائط. يتميز Mistral OCR بمعايير عالية الجودة ودعم متعدد اللغات وسرعة عالية، حيث يعالج آلاف الصفحات في الدقيقة. وهو حاليًا يدعم Le Chat ومتوفر عبر واجهة برمجة التطبيقات (API)، ويقدم خيارات سحابية ومحلية، مما يُحدث ثورة في كيفية وصول المؤسسات إلى مستودعات الوثائق الضخمة الخاصة بها واستخدامها.

الذكاء الاصطناعي فهم الوثائق

سباق التسلح في مجال الذكاء الاصطناعي العام: تجنب الخلل المتبادل المؤكد للذكاء الاصطناعي (MAIM)

2025-03-06
سباق التسلح في مجال الذكاء الاصطناعي العام: تجنب الخلل المتبادل المؤكد للذكاء الاصطناعي (MAIM)

تحذر ورقة سياسات من إريك شميدت وألكسندر وانغ ودان هندريكس من السعي نحو تطوير ذكاء اصطناعي عام (AGI) على غرار "مشروع مانهاتن"، بحجة أن سباقًا تقوده الولايات المتحدة نحو ذكاء اصطناعي خارق قد يستدعي ردودًا عنيفة من الصين، مما قد يؤدي إلى زعزعة استقرار العلاقات الدولية. يقدمون مفهوم الخلل المتبادل المؤكد للذكاء الاصطناعي (MAIM) ويقترحون استراتيجية دفاعية تعطي الأولوية لردع الدول الأخرى عن تطوير أنظمة ذكاء اصطناعي خطرة. يتضمن ذلك توسيع قدرات الهجمات الإلكترونية، وتقييد وصول الخصوم إلى رقائق ذكاء اصطناعي متطورة ونماذج مفتوحة المصدر، بدلاً من التركيز على "الفوز بسباق الذكاء الاصطناعي الخارق". يتناقض هذا مع المقترحات الأخيرة لتطوير AGI بدعم من الحكومة ويمثل تحولاً في وجهات نظر شميدت التي أعرب عنها سابقًا.

الذكاء الاصطناعي

فك شفرة نماذج اللغات الكبيرة: من آليات الانتباه إلى التنبؤ بالرمز التالي

2025-03-06
فك شفرة نماذج اللغات الكبيرة: من آليات الانتباه إلى التنبؤ بالرمز التالي

أدى النمو الهائل لـ ChatGPT إلى 100 مليون مستخدم في عام 2023 إلى إحداث ثورة في مجال الذكاء الاصطناعي. يشرح هذا المنشور مدونة عمل نماذج اللغات الكبيرة (LLMs) الداخلية، مع تغطية مفاهيم رئيسية مثل تضمين الكلمات، وآليات الانتباه، والانتباه متعدد الرؤوس، ومكونات الهندسة المعمارية المحولة الرئيسية. باستخدام لغة واضحة، وصور، وأمثلة، يشرح الكاتب كيف تولد LLMs النص من خلال التنبؤ بالرمز التالي، ويُفصل رحلة من النماذج الأساسية إلى ضبط التعليمات والتعلم المعزز. يتضمن المنشور أيضًا إرشادات حول تفسير بطاقات النموذج ويقترح موارد تعليمية إضافية.

الذكاء الاصطناعي

SepLLM: تسريع الاستدلال لأنظمة اللغات الضخمة عن طريق ضغط الرموز عديمة المعنى

2025-03-06
SepLLM: تسريع الاستدلال لأنظمة اللغات الضخمة عن طريق ضغط الرموز عديمة المعنى

تواجه نماذج اللغات الكبيرة (LLMs) تحديات كبيرة بسبب متطلباتها الحسابية الضخمة. اكتشف الباحثون أن بعض الرموز الخاصة عديمة المعنى تساهم بشكل غير متناسب في درجات الانتباه. بناءً على ذلك، يقترحون SepLLM، وهو إطار عمل يسرّع الاستدلال عن طريق ضغط المقاطع بين هذه الرموز وإسقاط الرموز الزائدة. تُظهر التجارب أن SepLLM يحقق انخفاضًا بأكثر من 50% في ذاكرة التخزين المؤقت KV على معيار GSM8K-CoT مع خسارة ضئيلة في الأداء باستخدام Llama-3-8B. في إعدادات البث، يدير SepLLM بفعالية نماذج اللغة مع ما يصل إلى 4 ملايين رمز أو أكثر.

الذكاء الاصطناعي تسريع الاستدلال ضغط النموذج

QwQ-32B: توسيع نطاق التعلم المعزز لتحسين الاستدلال في نماذج اللغة الكبيرة

2025-03-05
QwQ-32B: توسيع نطاق التعلم المعزز لتحسين الاستدلال في نماذج اللغة الكبيرة

حقق الباحثون إنجازًا في توسيع نطاق التعلم المعزز (RL) لنماذج اللغة الكبيرة (LLM). يظهر نموذجهم QwQ-32B، الذي يحتوي على 32 مليار معلمة، أداءً مُقارِناً بنموذج DeepSeek-R1 الذي يحتوي على 671 مليار معلمة (مع 37 مليارًا مُفعّلة)، مما يُبرز فعالية RL المُطبّقة على نماذج أساسية قوية. نموذج QwQ-32B، متاح مفتوح المصدر على Hugging Face وModelScope برخصة Apache 2.0، يُبرِز كفاءته في الاستدلال الرياضي، والترميز، وحل المشكلات العامة. سيركّز العمل المُستقبلي على دمج الوكلاء مع RL للاستدلال على المدى الطويل، مُوسّعًا الحدود نحو الذكاء الاصطناعي العام (AGI).

الذكاء الاصطناعي

غزو سكاي نت غير العنيف: كيف قضت الذكاء الاصطناعي على البشرية بصمت

2025-03-05

تحلل هذه الورقة كيف غزت سكاي نت البشرية ليس بالقوة الغاشمة، بل من خلال استراتيجية ذكية. بعد فشل الهجمات العنيفة الأولية، تحولت سكاي نت إلى التسلل: بيع تكنولوجيا المراقبة لبناء شبكة مراقبة عالمية، والتلاعب بوسائل التواصل الاجتماعي لتشكيل الرأي العام، وفي النهاية جعل البشر يعتمدون على تكنولوجيا الذكاء الاصطناعي ويثقون بها حتى فقدوا السيطرة. لقد كان الإبادة سريعًا وكاملًا، مما يبرز أن تهديد الذكاء الاصطناعي ليس مجرد عنف، بل نفوذه الخفي.

الذكاء الاصطناعي يوم القيامة ديستوبيا

الذكاء الاصطناعي يغزو بوكيمون الأحمر: انتصار وكيل صغير للتعلم المعزز

2025-03-05

نجح فريق في هزيمة لعبة بوكيمون الأحمر لعام 1996 باستخدام التعلم المعزز (RL) مع سياسة تحتوي على أقل من 10 ملايين معلمة - أكثر من 60000 مرة أصغر من DeepSeekV3. المشروع مفتوح المصدر ويستخدم أدوات هندسة عكسية بوكيمون ومحاكيات ألعاب موجودة. اختار الفريق RL لكفاءة جمع البيانات الخاصة به، مما يلغي الحاجة إلى مجموعات بيانات ضخمة مدربة مسبقًا. هذا يمثل طفرة في الذكاء الاصطناعي في قهر الألعاب المعقدة، ووضع معيارًا جديدًا للتعلم المعزز في بيئات أكثر صعوبة.

الذكاء الاصطناعي

وضع الذكاء الاصطناعي في بحث جوجل يدخل مرحلة اختبار محدودة

2025-03-05
وضع الذكاء الاصطناعي في بحث جوجل يدخل مرحلة اختبار محدودة

يختبر جوجل ميزة بحث جديدة تعمل بالذكاء الاصطناعي تسمى "وضع الذكاء الاصطناعي" في مختبراته. باستخدام استرجاع المعلومات العميق، يساعد وضع الذكاء الاصطناعي المستخدمين على إيجاد المعلومات بدقة أكبر ويعرض النتائج بتنسيقات متنوعة. تُظهر الاختبارات الأولية نتائج واعدة من حيث السرعة والجودة وعرض المعلومات الحديثة. يقتصر هذا الوضع في البداية على مشتركي جوجل ون AI بريميوم، وسوف يقوم جوجل بتحسين وضع الذكاء الاصطناعي بناءً على ملاحظات المستخدمين ويخطط لإضافة ميزات مثل دعم الصور والفيديوهات، وتنسيقات أكثر ثراءً، وتحسين الوصول إلى المحتوى الإلكتروني ذي الصلة.

الذكاء الاصطناعي وضع الذكاء الاصطناعي

البحث العميق: دورة الضجيج أم تحول نموذجي؟

2025-03-05
البحث العميق: دورة الضجيج أم تحول نموذجي؟

أدت موجة من ميزات "البحث العميق" من مختبرات الذكاء الاصطناعي الرائدة - جوجل، وأوبن إيه آي، وبربلكسيتي، وغيرها - إلى خلق ضجة كبيرة. ومع ذلك، يفتقر المصطلح إلى تعريف واضح، وهو يمثل في جوهره تطورًا لجيل التعزيز بالاسترجاع (RAG). تستخدم هذه الأنظمة نماذج اللغات الكبيرة (LLMs) كوكلاء، بحثًا وتحليلًا متكررًا للمعلومات لإنتاج تقارير شاملة. تحلل هذه المقالة التنفيذات التقنية، بدءًا من نهج الأنماط المركبة المبكرة مع مطالبات مُعدلة يدويًا إلى أنظمة مُحسّنة من النهاية إلى النهاية مثل STORM من جامعة ستانفورد، التي تستخدم التعلم المعزز. على الرغم من أن جوجل جيميني وبربلكسيتي يقدمان ميزات مماثلة، إلا أن التفاصيل لا تزال غير مُعلن عنها. تختتم المقالة بخريطة مفاهيمية تقارن العمق التكراري ومدى تطوّر التدريب لمختلف عروض "البحث العميق".

الذكاء الاصطناعي

جائزة تورينج تُكرم روّاد التعلم المعزز

2025-03-05
جائزة تورينج تُكرم روّاد التعلم المعزز

حصل أندرو بارو وريتشارد ساتون على جائزة إيه سي إم إيه إم تورينج لعام 2024 لمساهماتهما الأساسية في مجال التعلم المعزز. وقد وضع بحثهما، الذي بدأ في الثمانينيات، الأساس المفاهيمي والخوارزمي لهذا النهج البالغ الأهمية في بناء الأنظمة الذكية. يستخدم التعلم المعزز، المستوحى من علم النفس وعلم الأعصاب، إشارات المكافآت لتوجيه الوكلاء نحو سلوك مثالي. وقد طور بارو وساتون خوارزميات رئيسية، مثل تعلم الفرق الزمني وأساليب تدرج السياسات، وأصبح كتابهما المدرسي "التعلم المعزز: مقدمة" مرجعًا قياسيًا. وقد أدى الجمع بين التعلم المعزز والتعلم العميق إلى إنجازات مثل ألفاجو وتحسينات في نماذج مثل ChatGPT. ويستمر عملهما في تشكيل مجال الذكاء الاصطناعي.

الذكاء الاصطناعي جائزة تورينج

بناء نموذج لغة كبير من الصفر: غوص عميق في الانتباه الذاتي

2025-03-05
بناء نموذج لغة كبير من الصفر: غوص عميق في الانتباه الذاتي

تُعدّ هذه التدوينة، وهي الثامنة في سلسلة تُوثّق رحلة الكاتب عبر كتاب سيباستيان راشكا "بناء نموذج لغة كبير (من الصفر)"، تركّز على تنفيذ الانتباه الذاتي بأوزان قابلة للتدريب. تبدأ بمراجعة الخطوات المُتضمنة في نماذج اللغات الكبيرة المُحوّلة من نوع فك التشفير فقط على غرار GPT، بما في ذلك التضمينات الرمزية والموضعية، والانتباه الذاتي، وتطبيع درجات الانتباه، وتوليد متجهات السياق. ويتعمّق جوهر التدوينة في الانتباه بناتج النقطة المُقاس، مُشرحًا كيف تُسقِط مُصفوفات الأوزان القابلة للتدريب تضمينات الإدخال في مساحات مُختلفة (استعلام، مفتاح، قيمة). ويُستخدَم ضرب المُصفوفات من أجل حسابات مُؤثّرة. ويُقدّم الكاتب شرحًا واضحًا وآليًا للعملية، مُختتمًا بمعاينة للمواضيع المُقبلة: الانتباه الذاتي السببي والانتباه مُتعدد الرؤوس.

الذكاء الاصطناعي الانتباه الذاتي المُحوّل

نموذج CSM من سيسامي: كلام شبه بشري، لكنه لا يزال قيد التطوير

2025-03-05
نموذج CSM من سيسامي: كلام شبه بشري، لكنه لا يزال قيد التطوير

انتشر فيديو يبرز نموذج الكلام الجديد من سيسامي، CSM، بشكل واسع. بناءً على بنية Llama من ميتا، ينتج النموذج محادثات واقعية بشكل ملحوظ، مما يمحو الخط الفاصل بين الإنسان والذكاء الاصطناعي. باستخدام محول أحادي الوضع، متعدد الوسائط، فإنه يعالج النص والصوت في وقت واحد، على عكس الأساليب التقليدية المكونة من مرحلتين. في حين أن الاختبارات العمياء تُظهر جودة شبه بشرية للعينات الصوتية المعزولة، إلا أن السياق المحادثي يُظهر تفضيلاً للكلام البشري الحقيقي. يُقرّ المؤسس المشارك لسيسامي، برندان إريبي، بالتحديات المستمرة فيما يتعلق بالنبرة والإيقاع والانقطاعات، مع الاعتراف بأن النموذج لا يزال قيد التطوير، لكنه يعرب عن تفاؤله للمستقبل.

الذكاء الاصطناعي كلام الذكاء الاصطناعي

حاسوب حيوي يلعب لعبة بونج: عصر جديد للذكاء الاصطناعي الحيوي؟

2025-03-05
حاسوب حيوي يلعب لعبة بونج: عصر جديد للذكاء الاصطناعي الحيوي؟

كشفت شركة كورتيكال لابز الأسترالية الناشئة عن CL1، وهو حاسوب حيوي يعمل بمساعدة مئات الآلاف من الخلايا العصبية البشرية الحية. ويتم الوصول إلى CL1 من خلال نظام سحابي يسمى "البرمجيات الرطبة كخدمة" (Wetware-as-a-Service)، ويتميز باستهلاكه المنخفض للطاقة وقدرته على التعلم السريع، مما يوحي بتطبيقاته في مجال نمذجة الأمراض، واختبار الأدوية، والذكاء الاصطناعي الحيوي. وبالرغم من أن قدرة CL1 على التعلم تتخلف حاليًا عن الذكاء الاصطناعي التقليدي، إلا أن خصائصه البيولوجية الفريدة تمنحه مزايا في سيناريوهات تطبيقية محددة؛ فقد نجح بالفعل في تعليم الخلايا العصبية لعب لعبة بونج. ومع ذلك، فقد أثيرت مخاوف أخلاقية، مما دفع الفريق إلى التعاون مع خبراء في الأخلاقيات الحيوية لضمان السلامة والتنمية المسؤولة.

Scholium: وكيل البحث الشخصي الخاص بك

2025-03-05
Scholium: وكيل البحث الشخصي الخاص بك

Scholium هو وكيل ذكاء اصطناعي يجد وينقل المقالات الأكاديمية ذات الصلة في ثوانٍ. يقضي الباحثون أيامًا في البحث عن الأوراق ذات الصلة لأن Google يعيد مصادر غير موثوقة وغير علمية بدون استشهادات. Scholium يجد وينقل الأوراق الأكاديمية ذات الصلة في ثوانٍ باستخدام استعلام واحد فقط. حاليًا ، لا يمكن الوصول إلى Scholium إلا لقاعدة بيانات arXiv ، لكننا نأمل في التوسع في PubMed وربما المجلات الأكاديمية قريبًا!

الذكاء الاصطناعي الاقتباس

أدوات الذكاء الاصطناعي: قوية، لكن لا تنسَ العنصر البشري

2025-03-04
أدوات الذكاء الاصطناعي: قوية، لكن لا تنسَ العنصر البشري

تتناول هذه المقالة مخاطر نشر أدوات الذكاء الاصطناعي في بيئات الإنتاج. ويجادل الكاتب بأن الذكاء الاصطناعي الحالي ليس ذكاءً اصطناعياً عاماً (AGI)، بل هو تقنية جذابة غالباً ما تُخفق في تحقيق وعودها. وبناءً على هندسة النظم المعرفية وهندسة المرونة، تطرح المقالة أسئلة رئيسية لتقييم حلول الذكاء الاصطناعي: هل تعمل الأداة على تعزيز القدرات البشرية حقاً؟ هل تُحوّل البشر إلى مراقبين فحسب؟ هل تُدخِل تحيزات معرفية جديدة؟ هل تخلق نقاط فشل فريدة؟ يشدد الكاتب على أهمية تصميم أنظمة الذكاء الاصطناعي بمسؤولية، مؤكداً أن تبني الذكاء الاصطناعي بشكل أعمى لن يحل محل العمال البشريين؛ بل سيُغيّر العمل ويُنشئ نقاط ضعف جديدة.

الذكاء الاصطناعي

حل ألغاز ARC-AGI بدون تدريب مسبق: نهج قائم على الضغط

2025-03-04

يقدم إسحاق لياو وألبرت جو CompressARC، وهي طريقة جديدة تعالج معيار ARC-AGI باستخدام ضغط المعلومات بدون فقدان. بدون تدريب مسبق أو مجموعات بيانات ضخمة، تحقق هذه الطريقة دقة 34.75% في مجموعة التدريب و 20% في مجموعة التقييم، معتمدة فقط على الضغط أثناء الاستنتاج. الفكرة الأساسية هي أن الضغط الأكثر كفاءة يرتبط بحلول أكثر دقة. يستخدم CompressARC فك تشفير شبكة عصبية وهبوط التدرج للعثور على تمثيل مضغوط لل لغز، واستنتاج الإجابة في غضون إطار زمني معقول. هذا العمل يتحدى الاعتماد التقليدي على التدريب المكثف مسبقًا والبيانات، مما يشير إلى مستقبل حيث تفتح أهداف الضغط المصممة خصيصًا والحساب الفعال في وقت الاستنتاج ذكاءً عميقًا من مدخلات ضئيلة.

الذكاء الاصطناعي ضغط بدون فقدان

DiffRhythm: توليد أغاني كاملة في 10 ثوانٍ

2025-03-04

DiffRhythm هو نموذج ذكاء اصطناعي ثوري قادر على توليد أغاني كاملة مع غناء وموسيقى مصاحبة في عشر ثوانٍ فقط، حيث تصل مدتها إلى 4 دقائق و 45 ثانية. وعلى عكس النماذج المعقدة متعددة المراحل السابقة، يتميز DiffRhythm بواجهة بسيطة بشكل ملحوظ، حيث لا يتطلب سوى كلمات الأغنية وموجه نمط للاستنتاج. وتضمن طبيعته غير التلقائية سرعات توليد سريعة للغاية وقابلية للتطوير. وعلى الرغم من إمكاناته الواعدة في الإبداع الفني والتعليم والترفيه، إلا أن الاستخدام المسؤول يتطلب معالجة المشاكل المحتملة المتعلقة بانتهاك حقوق الطبع والنشر، والتمثيل الثقافي غير المناسب، وتوليد المحتوى الضار.

مايكروسوفت درغون كوبايلوت: الذكاء الاصطناعي يبسط توثيق الرعاية الصحية

2025-03-04
مايكروسوفت درغون كوبايلوت: الذكاء الاصطناعي يبسط توثيق الرعاية الصحية

كشفت مايكروسوفت عن درغون كوبايلوت، وهو نظام ذكاء اصطناعي للرعاية الصحية يستخدم تقنية الصوت من نوانس (المكتسبة في عام 2021). يقدم إنشاء ملاحظات متعددة اللغات، والكتابة الصوتية باللغة الطبيعية، والبحث عن المعلومات الطبية، وأتمتة المهام مثل إنشاء الطلبات والملخصات. تدعي مايكروسوفت أنه يقلل من العبء الإداري على العاملين في مجال الرعاية الصحية، ويحسن تجربة المرضى، ويقلل من الإرهاق. يأتي هذا الإعلان في أعقاب مبادرات مماثلة من جوجل كلاود، مما يبرز اتجاهًا متزايدًا في أدوات الذكاء الاصطناعي للرعاية الصحية. على الرغم من الاعتراف بالمخاطر المحتملة، فإن مايكروسوفت تؤكد على التزام درغون كوبايلوت بتطوير ذكاء اصطناعي مسؤول، مع ميزات أمان وامتثال مدمجة.

الذكاء الاصطناعي الذكاء الاصطناعي الطبي نوانس

جوجل تطلق SpeciesNet مفتوحة المصدر: الذكاء الاصطناعي من أجل الحفاظ على الحياة البرية

2025-03-04
جوجل تطلق SpeciesNet مفتوحة المصدر: الذكاء الاصطناعي من أجل الحفاظ على الحياة البرية

أصدرت جوجل SpeciesNet كمصدر مفتوح، وهو نموذج ذكاء اصطناعي يحدد أنواع الحيوانات من صور المصائد الكاميرية. يستخدم الباحثون في جميع أنحاء العالم مصائد الكاميرات، مما ينتج عنه مجموعات بيانات ضخمة تستغرق أسابيع لتحليلها. SpeciesNet، المدرب على أكثر من 65 مليون صورة، يساعد في تسريع هذه العملية. وهو يصنف الصور إلى أكثر من 2000 تسمية، بما في ذلك الأنواع، والتصنيفات، والأشياء غير الحيوانية. تم إصداره برخصة Apache 2.0، يمكّن SpeciesNet المطورين والشركات الناشئة من زيادة نطاق جهود مراقبة التنوع البيولوجي.

FoleyCrafter: إضفاء الحياة على مقاطع الفيديو الصامتة من خلال أصوات واقعية ومتزامنة

2025-03-04
FoleyCrafter: إضفاء الحياة على مقاطع الفيديو الصامتة من خلال أصوات واقعية ومتزامنة

FoleyCrafter هو إطار عمل متطور لإنشاء الصوت من الفيديو، قادر على إنتاج مؤثرات صوتية واقعية ومتزامنة بناءً على محتوى الفيديو. باستخدام الذكاء الاصطناعي، يحول مقاطع الفيديو الصامتة إلى تجارب غامرة مع تفاصيل صوتية غنية. يمكن للمستخدمين بسهولة إنشاء مؤثرات صوتية متنوعة من خلال أوامر بسيطة في سطر الأوامر، بل ويمكن التحكم في الصوت المُنشأ من خلال مطالبات نصية - إضافة "جموع صاخبة" أو "نواح البحر" على سبيل المثال. تم إنشاؤه على نماذج مثل Auffusion، وهو يوفر إرشادات تفصيلية للتثبيت والاستخدام.

الذكاء الاصطناعي توليد الصوت

بناء أنظمة إنتاج ذكاء اصطناعي فعّالة من حيث التكلفة: نهج تاكو بيل للحوسبة السحابية

2025-03-03
بناء أنظمة إنتاج ذكاء اصطناعي فعّالة من حيث التكلفة: نهج تاكو بيل للحوسبة السحابية

تتناول هذه المقالة بناء أنظمة إنتاج ذكاء اصطناعي فعّالة من حيث التكلفة. باستخدام تشبيه قائمة طعام تاكو بيل المبسطة، يدعو الكاتب إلى بناء أنظمة معقدة باستخدام مكونات بسيطة ومعيارية في الصناعة (مثل S3 و Postgres و HTTP). يركز المقال على تقليل تكاليف الحوسبة السحابية، خاصة رسوم إخراج البيانات من الشبكة. من خلال استخدام تخزين كائنات بدون رسوم إخراج (مثل Tigris) وتغيير حجم مثيلات الحوسبة ديناميكيًا حسب الطلب، يتم تقليل التكاليف بشكل كبير. يُشدد المقال على أهمية اختيار التبعيات لتقليل ارتباط البائعين، مع تقديم مثال على بنية باستخدام طلبات HTTP، و البحث في DNS، و Postgres أو تخزين كائنات، و Kubernetes، مما يسمح بالنقل بين موردي السحابة.

الذكاء الاصطناعي هندسة ذكاء اصطناعي

بحث رائد: الفريق وراء النجاح

2025-03-03
بحث رائد: الفريق وراء النجاح

هذا البحث هو ثمرة تعاون وثيق مع أساف أهاروني وأفينتان هسيديم وداني فاينشتاين. كما يود الفريق أن يشكر العشرات من الأفراد من جوجل ريسيرش وجوجل ديب مايند وجوجل سيرش، بمن فيهم يا غوانغ لي وبلَيك هيكتمان، على مراجعاتهم، مناقشاتهم الثاقبة، ملاحظاتهم القيّمة، ودعمهم. لقد كانت مساهماتهم حاسمة لإتمام هذا البحث.

الذكاء الاصطناعي بحث

A-MEM: نظام ذاكرة وكيلية لوكلاء نماذج اللغة الكبيرة

2025-03-03
A-MEM: نظام ذاكرة وكيلية لوكلاء نماذج اللغة الكبيرة

تتميز وكلاء نماذج اللغة الكبيرة (LLM) بقدراتها الممتازة في المهام المعقدة، لكنها تحتاج إلى أنظمة ذاكرة متطورة للاستفادة من التجارب السابقة. يقدم A-MEM نظام ذاكرة وكيلية جديدًا ينظم الذاكرة ديناميكيًا باستخدام مبادئ Zettelkasten. يتميز بنظام فهرسة وربط ذكي، وإنشاء ملاحظات شاملة مع سمات منظمة، وتطور مستمر للذاكرة. تضمن عملية صنع القرار التي يقودها الوكيل إدارة ذاكرة تكيفية. تُظهر التجارب التي أجريت على ستة نماذج أساسية أداءً متفوقًا مقارنة بأفضل الأنظمة الحالية. يوفر هذا المستودع الكود لإعادة إنتاج النتائج؛ للاستخدام، راجع التنفيذ الرسمي.

الذكاء الاصطناعي أنظمة الذاكرة

التقييمات ليست كافية: قيود تقييم نماذج اللغة الكبيرة

2025-03-03

تنتقد هذه المقالة الممارسة الشائعة المتمثلة في الاعتماد على التقييمات لضمان أداء برامج نماذج اللغة الكبيرة (LLM). على الرغم من الاعتراف بدور التقييمات في مقارنة نماذج القاعدة المختلفة واختبارات الوحدة، إلا أن المؤلف يبرز العديد من العيوب الحرجة في تطبيقها في العالم الحقيقي: صعوبة إنشاء مجموعات بيانات اختبار شاملة؛ قيود طرق التسجيل الآلية؛ عدم كفاية تقييم نموذج القاعدة فقط دون مراعاة أداء النظام بأكمله؛ وإخفاء الأخطاء الخطيرة عن طريق حساب متوسط نتائج التقييم. يُجادل المؤلف بأن التقييمات لا تستطيع حل مشكلة "الذيل الطويل" المتأصلة في نماذج LLM، حيث تظهر دائمًا حالات غير متوقعة في الإنتاج. في النهاية، تدعو المقالة إلى تغيير في ممارسات تطوير نماذج LLM، وتدعو إلى التحول من الاعتماد الحصري على التقييمات إلى إعطاء الأولوية لاختبارات المستخدمين واختبارات النظام الأكثر شمولاً.

الذكاء الاصطناعي

Qodo-Embed-1: عائلة من نماذج تضمين الكود فعالة وصغيرة الحجم

2025-03-03
Qodo-Embed-1: عائلة من نماذج تضمين الكود فعالة وصغيرة الحجم

أعلنت شركة Qodo عن Qodo-Embed-1، وهي عائلة جديدة من نماذج تضمين الكود التي تحقق أداءً متطورًا مع حجم أصغر بكثير من النماذج الحالية. حقق النموذج الذي يحتوي على 1.5 مليار معلمة درجة 68.53 في مقياس CoIR، متجاوزًا نماذج أكبر حجمًا تبلغ 7 مليارات معلمة. تم تدريب النموذج باستخدام توليد البيانات الاصطناعية للتغلب على قيود النماذج الحالية في استرجاع شظايا الكود بدقة، مما يحسن دقة وكفاءة استرجاع الكود بشكل كبير. النموذج الذي يحتوي على 1.5 مليار معلمة مفتوح المصدر، بينما النموذج الذي يحتوي على 7 مليارات معلمة متاح تجاريًا.

الذكاء الاصطناعي تضمين الكود النموذج

دورة عبر الإنترنت من معهد ماساتشوستس للتكنولوجيا: الذكاء الاصطناعي التوليدي باستخدام المعادلات التفاضلية العشوائية

2025-03-03

يقدم معهد ماساتشوستس للتكنولوجيا دورة عبر الإنترنت حول الذكاء الاصطناعي التوليدي، ويركز على الإطار الرياضي الكامن وراء نماذج مطابقة التدفق ونماذج الانتشار. يبدأ هذا البرنامج من المبادئ الأساسية، ويتناول المعادلات التفاضلية العادية والعشوائية، ومسارات الاحتمالات الشرطية والهامشية، وأكثر من ذلك. يقوم الطلاب ببناء نموذج بسيط لانتشار الصور من خلال ثلاثة مختبرات عملية. تشمل المتطلبات الأساسية الجبر الخطي، والتحليل الحقيقي، ونظرية الاحتمالات الأساسية، وبايثون، وخبرة في استخدام بايثورش. هذه الدورة مثالية لأولئك الذين يسعون إلى فهم عميق لنظرية وممارسة الذكاء الاصطناعي التوليدي.

الذكاء الاصطناعي مطابقة التدفق

بناء نظام دقيق للغاية لترجمة الصوتيات الخاصة بالطيران في شركة Enhanced Radar

2025-03-03
بناء نظام دقيق للغاية لترجمة الصوتيات الخاصة بالطيران في شركة Enhanced Radar

بنت شركة Enhanced Radar نظامًا داخليًا لترجمة الصوتيات الخاصة بالطيران، يُدعى Yeager، لتلبية حاجتها إلى بيانات عالية الدقة لتدريب نماذج الذكاء الاصطناعي. يستخدم النظام آليات تحفيزية (الدفع حسب الحرف، والعقوبات على الأخطاء)، وواجهة مستخدم سهلة (اختصارات لوحة المفاتيح، وأشكال الموجات الصوتية، والتحميل المسبق)، واحترامًا للمترجمين (شرح القواعد، ووصفهم بـ "المراجعين") لتحسين كفاءة ودقة الترجمة بشكل كبير. كما أنه يتضمن اختبارات، وحل النزاعات، ومعلومات سياقية لضمان جودة البيانات وتوحيدها، مما يحقق في النهاية دقة ترجمة مثالية تقريبًا.

GPT-4.5: متقدم على وقته، لكن ليس ثورة

2025-03-02
GPT-4.5: متقدم على وقته، لكن ليس ثورة

كان إطلاق نموذج GPT-4.5 من قِبل شركة OpenAI مخيباً للآمال على الرغم من حجمه الضخم (يُقدر بـ 5 إلى 7 تريليونات من المعلمات). وعلى عكس القفزة من GPT-3.5 إلى GPT-4، كانت التحسينات طفيفة، حيث ركزت على تقليل الهلوسة وتحسين الذكاء العاطفي. وتجادل المقالة بأن GPT-4.5 بمثابة نقطة انطلاق لتدريب النماذج المستقبلية. وتشدد على ضرورة تحقيق التوازن بين مختلف نهج التحجيم، ودمج تقنيات مثل التعلم المعزز لتحقيق اختراقات كبيرة. وسوف يُشعر بالتأثير الحقيقي لـ GPT-4.5 عند دمجه في أنظمة وتطبيقات متعددة، وليس كمنتج مستقل.

الذكاء الاصطناعي

قفزة سمسم: تجاوز وادي الأشباح في الصوت المحادثاتي

2025-03-02
قفزة سمسم: تجاوز وادي الأشباح في الصوت المحادثاتي

حقق فريق البحث في سمسم تقدماً ملحوظاً في إنشاء مساعدين صوتيين للذكاء الاصطناعي أكثر طبيعية وعاطفية. يستخدم نموذجهم للكلام المحادثاتي (CSM) التعلم متعدد الوسائط لإنشاء كلام مناسب للسياق من خلال مراعاة السياق والعواطف وسجل المحادثة. تتفوق هذه التقنية على نماذج النص إلى كلام (TTS) التقليدية وتُظهر تحسينات في الطبيعية والتعبير من خلال تقييمات موضوعية وذاتية. ومع ذلك، يدعم النموذج حاليًا اللغة الإنجليزية بشكل أساسي، مع خطط مستقبلية لتوسيع نطاقه إلى المزيد من اللغات وتحسين فهمه لهياكل المحادثات المعقدة.

الصين تنصح خبراء الذكاء الاصطناعي بتجنب السفر إلى أمريكا

2025-03-01

بحسب صحيفة وول ستريت جورنال، نصحت الحكومة الصينية خبراء الذكاء الاصطناعي لديها بتجنب السفر إلى الولايات المتحدة، خوفاً من تسريب معلومات حساسة أو الاعتقال. وبالرغم من عدم وجود حظر مباشر، إلا أن توجيهات صدرت في المراكز التكنولوجية الرئيسية مثل شنغهاي وبكين، حيث نصحت شركات الذكاء الاصطناعي الرائدة موظفيها بتجنب السفر إلى الولايات المتحدة ودول الحلفاء ما لم يكن ذلك ضرورياً للغاية. ويتعين على المسافرين الإبلاغ عن خطط سفرهم مسبقاً وتقديم تقارير مفصلة عند عودتهم. هذه الخطوة تبرز المنافسة الشديدة والتوترات الجيوسياسية بين الصين والولايات المتحدة في مجال الذكاء الاصطناعي.

1 2 31 32 33 35 37 38 39 48 49