شكر فريق LearnLM: العقول وراء النموذج

2025-09-19
شكر فريق LearnLM: العقول وراء النموذج

نشر فريق LearnLM من جوجل للأبحاث منشور شكر، معربًا عن امتنانه لكل من ساهم في عمله. يسرد المنشور العديد من المساهمين، بدءًا من الباحثين وحتى الرعاة التنفيذيين، مما يبرز الطبيعة التعاونية لنجاح المشروع. يُعد التقدم المحرز في LearnLM شهادة على الجهد الجماعي لهؤلاء الأفراد.

اقرأ المزيد
الذكاء الاصطناعي

مشروع جيمّا: شكر وتقدير لمساهمات الفريق

2025-09-12
مشروع جيمّا: شكر وتقدير لمساهمات الفريق

يُعزى نجاح مشروع جيمّا إلى الجهود التعاونية لفريقي جيمّا وخصوصية جوجل. شكر خاصّ لبتر كايروز، وبراندن مكماهون، ودان راميج على ملاحظاتهم على تدوينة المدونة؛ ومارك سيمبورغ وكيمبرلي شويد لمساعدتهما في عمليات التصور؛ ولفرق جوجل على تصميم الخوارزميات، وتنفيذ البنية التحتية، والصيانة الإنتاجية. كما تُدرج التدوينة قائمة بـ 20 فردًا ساهموا بشكل مباشر في العمل.

اقرأ المزيد

تحسين ضبط نماذج اللغة الكبيرة من خلال عملية اختيار البيانات التكراريّة

2025-08-08
تحسين ضبط نماذج اللغة الكبيرة من خلال عملية اختيار البيانات التكراريّة

حسّن الباحثون أداء نماذج اللغة الكبيرة (LLMs) بشكل ملحوظ من خلال عملية اختيار البيانات التكراريّة لبيانات التدريب الخاصة بها. وشملت التجارب نموذجين من نماذج اللغة الكبيرة بأحجام مختلفة (Gemini Nano-1 و Nano-2) على مهام ذات تعقيد مختلف، باستخدام حوالي 100000 تعليق من مصادر متعددة، عانت في البداية من اختلال شديد في التوزيع الطبقي (95% حميدة). من خلال عملية اختيار البيانات التكراريّة من قبل الخبراء وضبط النموذج الدقيق، تحسن الأداء بشكل كبير. وقد وصلت النماذج إلى حوالي 40% من الأمثلة الإيجابية ومعامل كابا لكوهين يبلغ حوالي 0.81 (تعقيد منخفض) و 0.78 (تعقيد مرتفع)، واقتربت من أداء الخبراء، مما يبرز الدور الحاسم لبيانات عالية الجودة في تدريب نماذج اللغة الكبيرة.

اقرأ المزيد

إنذار مبكر بالزلازل: التوازن بين السرعة والدقة في تقدير الحجم

2025-07-23
إنذار مبكر بالزلازل: التوازن بين السرعة والدقة في تقدير الحجم

يُشكل تقدير حجم الزلزال في الوقت الحقيقي أحد التحديات الرئيسية في أنظمة الإنذار المبكر بالزلازل (EEW). يحدد الحجم مدى الهزات ومن يحتاج إلى الإنذار. إن التقليل من شأن الخطر يؤدي إلى تفويت الإنذارات، بينما يؤدي المبالغة في تقديره إلى إصدار إنذارات خاطئة وتآكل ثقة الجمهور. يكمن التحدي الرئيسي في تحقيق التوازن بين السرعة والدقة؛ البيانات الأولية محدودة، لكن تأخير الإنذارات يقلل من وقت التحذير. على مدار السنوات الثلاث الماضية، قمنا بتحسين تقدير الحجم بشكل كبير، حيث قللنا الخطأ المطلق المتوسط من 0.50 إلى 0.25. تتنافس دقتنا الآن، وفي بعض الحالات تتجاوز، دقة الشبكات الزلزالية الراسخة.

اقرأ المزيد

MUVERA: استرجاع متعدد المتجهات بكفاءة

2025-06-26
MUVERA: استرجاع متعدد المتجهات بكفاءة

يعتمد استرجاع المعلومات الحديثة على نماذج تضمين الأعصاب، ولكن على الرغم من أن نماذج المتجهات المتعددة توفر دقة أعلى، إلا أن تعقيدها الحسابي يؤدي إلى عدم الكفاءة. يقدم الباحثون MUVERA، وهي خوارزمية جديدة تحول استرجاع المتجهات المتعددة المعقد إلى بحث أبسط عن حاصل الضرب الداخلي الأقصى لمتجه واحد (MIPS) من خلال إنشاء ترميزات ذات أبعاد ثابتة (FDEs). هذا يحسن الكفاءة بشكل كبير دون التضحية بالدقة. التنفيذ مفتوح المصدر متاح على GitHub.

اقرأ المزيد
الذكاء الاصطناعي استرجاع متعدد المتجهات

Veo الجيل الثالث: تعميم إنشاء الفيديو

2025-05-16
Veo الجيل الثالث: تعميم إنشاء الفيديو

أحدث إنجاز من جوجل في مجال إنشاء الفيديو، Veo، لديه الآن جيل ثالث قادر على التعميم عبر مهام متنوعة. تم تدريب Veo على ملايين من الأصول الاصطناعية ثلاثية الأبعاد عالية الجودة، ويتفوق في توليف مناظر جديدة، حيث يحول صور المنتجات إلى مقاطع فيديو 360 درجة متناسقة. من المهم ملاحظة أن هذا النهج يتعمم بفعالية على الأثاث والملابس والإلكترونيات وما إلى ذلك، مع التقاط دقيق للتفاعلات المعقدة للإضاءة والمواد - وهي تحسين كبير مقارنة بالأجيال السابقة.

اقرأ المزيد
الذكاء الاصطناعي إنشاء الفيديو

جوجل تعزز إنتاجية المطورين من خلال إكمال التعليمات البرمجية شبه الدلالي الهجين القائم على التعلم الآلي

2025-05-15
جوجل تعزز إنتاجية المطورين من خلال إكمال التعليمات البرمجية شبه الدلالي الهجين القائم على التعلم الآلي

طور باحثو جوجل نظامًا جديدًا مبتكرًا لإكمال التعليمات البرمجية شبه الدلالي الهجين القائم على مُحوِّل (Transformer)، يجمع بين التعلم الآلي (ML) ومحركات دلالية قائمة على القواعد (SEs) لتحسين إنتاجية المطورين بشكل كبير. يُدمج النظام ML و SEs بثلاث طرق: 1) إعادة ترتيب اقتراحات الرمز المميز المفرد من SE باستخدام ML؛ 2) تطبيق إكمالات سطر واحد وأكثر باستخدام ML والتحقق من الصحة باستخدام SE؛ و 3) استخدام استمرار سطر واحد وأكثر بواسطة ML لا اقتراحات دلالية لرمز مميز مفرد. أظهرت دراسة استمرت ثلاثة أشهر شملت أكثر من 10000 مطور داخلي في جوجل انخفاضًا بنسبة 6% في وقت تكرار الترميز باستخدام إكمال ML لسطر واحد. حاليًا، يتم إنشاء أكثر من 3% من التعليمات البرمجية الجديدة من خلال قبول اقتراحات إكمال ML. يدعم النظام ثماني لغات برمجة ويدمج عمليات فحص دلالية لضمان صحة التعليمات البرمجية، مما يعزز ثقة المطورين وكفاءتهم بشكل كبير.

اقرأ المزيد

مُطابقات Whisper مُدهشة مع نشاط الدماغ البشري أثناء الكلام

2025-03-26
مُطابقات Whisper مُدهشة مع نشاط الدماغ البشري أثناء الكلام

تكشف دراسة عن تطابق مُدهش بين نموذج التعرف على الكلام Whisper من OpenAI والنشاط العصبي في الدماغ البشري أثناء المحادثات الطبيعية. من خلال مُقارنة مُطابقات Whisper مع النشاط الدماغي في مناطق مثل الجيروس الأمامي السفلي (IFG) والجيروس الصدغي العلوي (STG) ، وجد الباحثون أن مُطابقات اللغة بلغت ذروتها قبل مُطابقات الكلام أثناء إنتاج الكلام ، والعكس صحيح أثناء الفهم. هذا يُشير إلى أن Whisper ، على الرغم من عدم تصميمه مع وضع آليات الدماغ في الاعتبار ، يُمسك بجوانب أساسية من معالجة اللغة. كما تُبرز النتائج "هيكلية ناعمة" في معالجة اللغة في الدماغ: المناطق ذات الرتبة الأعلى مثل IFG تُعطي الأولوية للمعلومات الدلالية والنحوية ، لكنها تُعالج أيضًا ميزات سمعية منخفضة المستوى ، بينما تُعطي المناطق ذات الرتبة الأدنى مثل STG الأولوية للمعالجة الصوتية والسمعية ، لكنها تُمسك أيضًا بمعلومات على مستوى الكلمات.

اقرأ المزيد
الذكاء الاصطناعي

بحث رائد: الفريق وراء النجاح

2025-03-03
بحث رائد: الفريق وراء النجاح

هذا البحث هو ثمرة تعاون وثيق مع أساف أهاروني وأفينتان هسيديم وداني فاينشتاين. كما يود الفريق أن يشكر العشرات من الأفراد من جوجل ريسيرش وجوجل ديب مايند وجوجل سيرش، بمن فيهم يا غوانغ لي وبلَيك هيكتمان، على مراجعاتهم، مناقشاتهم الثاقبة، ملاحظاتهم القيّمة، ودعمهم. لقد كانت مساهماتهم حاسمة لإتمام هذا البحث.

اقرأ المزيد
الذكاء الاصطناعي بحث

اختراق جوجل للذكاء الاصطناعي: قائمة الشكر تكشف عن جهد جماعي هائل

2025-02-19
اختراق جوجل للذكاء الاصطناعي: قائمة الشكر تكشف عن جهد جماعي هائل

تكشف عبارات الشكر في هذه الورقة عن جهد تعاوني هائل يضم العديد من الباحثين من جوجل ريسيرش وجوجل ديب مايند وجوجل كلاود آي، بالإضافة إلى متعاونين من مبادرة فليمنغ، وكلية إمبريال كوليدج لندن، ومستشفى هيوستن ميثوديست، وسيكوم، وجامعة ستانفورد. تبرز القائمة الطويلة الطبيعة التعاونية للبحث، وتشكر العديد من العلماء الذين قدموا ردود فعل تقنية وخبرات، بالإضافة إلى العديد من فرق جوجل الداخلية التي قدمت الدعم في مجالات المنتجات والهندسة والإدارة. يؤكد طول قائمة الشكر على الجهد الجماعي الهائل وراء مشاريع الذكاء الاصطناعي واسعة النطاق.

اقرأ المزيد
الذكاء الاصطناعي

صادم! جميع عمليات البحث الثنائي وفرز الاندماج تقريبًا معطلة

2025-01-11
صادم! جميع عمليات البحث الثنائي وفرز الاندماج تقريبًا معطلة

كشف مهندس البرمجيات في جوجل، جوشوا بلوخ، عن خطأ عمره ما يقرب من عقدين من الزمن كامن في خوارزميات البحث الثنائي، تم العثور عليه في كل من JDK وكتاب "لآلئ البرمجة" لجون بنتلي! ينبع الخطأ من السطر `int mid = (low + high) / 2;`، مما يتسبب في تجاوز سعة الأعداد الصحيحة واستثناءات مؤشر المصفوفة خارج الحدود عندما يتجاوز مجموع `low` و `high` الحد الأقصى لقيمة الصحيح الموجبة. لا يظهر هذا الخطأ إلا مع مجموعات البيانات الضخمة، مما يجعله خطيرًا بشكل خاص في عصر البيانات الضخمة. يستكشف المقال عدة حلول ويشدد على أن الأخطاء قد تستمر حتى مع الاختبارات والإثباتات الصارمة، مما يحث المبرمجين على توخي الحذر والتواضع.

اقرأ المزيد

جوجل توسّع تقييم الإمكانات الشمسية العالمية باستخدام صور الأقمار الصناعية والتعلم الآلي

2024-12-19
جوجل توسّع تقييم الإمكانات الشمسية العالمية باستخدام صور الأقمار الصناعية والتعلم الآلي

وسّع باحثو جوجل تغطية واجهة برمجة تطبيقات الطاقة الشمسية في منصة خرائط جوجل في جنوب الكرة الأرضية من خلال تطبيق نماذج التعلم الآلي على صور الأقمار الصناعية لإنشاء نماذج رقمية لسطح الأرض عالية الدقة وخرائط لتجزئة الأسطح. يتغلب هذا الابتكار على قيود الأساليب التقليدية لاكتساب البيانات ومعالجتها، مما يوفر بيانات لتقييم الإمكانات الشمسية لما يقرب من 1.25 مليار مبنى في جميع أنحاء العالم، ويعجل من اعتماد الطاقة المتجددة على الصعيد العالمي. يستخدم المشروع بيانات الأقمار الصناعية لزيادة وتيرة تحديث البيانات وخفض التكاليف، وهو أمر مفيد بشكل خاص في المناطق التي تعاني من نقص البيانات.

اقرأ المزيد