أنثروبي تكشف عن وضع "التفكير الفائق" في كود كلود

2025-04-20

أصدرت أنثروبي وثائقًا شاملة حول أفضل الممارسات لأداة وكيل الترميز الخاصة بها كلود كود CLI. تكشف نصيحة رائعة أن استخدام كلمات مثل "think"، "think hard"، إلخ، يُشغل أوضاع التفكير الموسعة. ترتبط هذه العبارات مباشرة بميزانيات تفكير مختلفة؛ "ultrathink" يخصص 31999 رمزًا، بينما "think" يستخدم 4000 فقط. يُظهر تحليل الشفرة أن هذه الكلمات الرئيسية تُشغل وظائف تُعين أعدادًا متغيرة من الرموز، مما يؤثر على عمق التفكير ومخرجات كلود. وهذا يشير إلى أن "ultrathink" ليس ميزة في نموذج كلود نفسه، بل هو تحسين محدد لكلود كود.

اقرأ المزيد
الذكاء الاصطناعي كلود كود تحسين الشفرة

محسّن برنامج استخراج خلاصة ذرية لنماذج أولاما باستخدام جيميني 2.5 برو

2025-03-26

تشرح هذه التدوينة إنشاء خلاصة ذرية تعمل بواسطة GitHub Actions و GitHub Pages، تقوم باستخراج بيانات النماذج الحديثة من صفحة أحدث النماذج في أولاما. تم إنشاء البرنامج النصي في البداية باستخدام كلود لتحويل HTML إلى Atom، وقد تم تحسينه باستخدام Google Gemini 2.5 Pro. تقسم هذه التحديثات المخرجات إلى خلاصتين: إحداهما تحتوي على جميع النماذج، والأخرى تحتوي على آخر 20 نموذجًا فقط، مما يحسّن من الكفاءة وسهولة الاستخدام.

اقرأ المزيد

هل يتفوق نموذج OLMo-2 مفتوح المصدر على GPT-3.5؟ إعداد سهل على نظام Mac!

2025-03-18
هل يتفوق نموذج OLMo-2 مفتوح المصدر على GPT-3.5؟ إعداد سهل على نظام Mac!

يُزعم أن نموذج اللغة المفتوح المصدر OLMo-2، الذي يحتوي على 32 مليار معلمة، يتفوق على GPT-3.5-Turbo وGPT-4 mini. جميع البيانات، والشيفرة، والأوزان، والتفاصيل متاحة بحرية. تشرح هذه المشاركة إعدادًا بسيطًا لتشغيله على نظام Mac باستخدام ملحق llm-mlx. قم بتنزيل النموذج الذي يبلغ حجمه 17 غيغابايت باستخدام عدد قليل من الأوامر، وانخرط في محادثة تفاعلية أو قم بإنشاء صور؛ يوضح المثال إنشاء صورة SVG لطيور البجع على دراجة هوائية.

اقرأ المزيد
الذكاء الاصطناعي

تركيب أداة Aider بطريقة مبتكرة: تجاوز بيئات العمل الظاهرية

2025-03-06

توفر أداة سطر الأوامر Aider من Paul Gauthier طريقة مبتكرة للتركيب تتجنب تعقيدات بيئات العمل الظاهرية للمستخدمين النهائيين. باستخدام الأمر البسيط `pip install aider-install && aider-install`، تستخدم الأداة `uv` لتركيب بيئة عمل مستقلة لـ Python 3.12، وتركيب Aider بداخلها، بالإضافة إلى تهيئة متغير البيئة PATH تلقائيًا. يوفر هذا تجربة تركيب آمنة وسهلة للمستخدمين المبتدئين في Python، ويُزيل خطوات الإعداد المعقدة.

اقرأ المزيد
التطوير

هلوسات رمز LLM: ليست نهاية العالم

2025-03-02

شكوى شائعة بين المطورين الذين يستخدمون نماذج اللغات الكبيرة (LLMs) للترميز هي حدوث "هلوسات" - حيث يبتكر نموذج LLM طرقًا أو مكتبات غير موجودة. ومع ذلك، يجادل المؤلف بأن هذا ليس عيبًا مميتًا. سهل اكتشاف الهلوسات البرمجية من خلال أخطاء المُترجم/المُفسّر، ويمكن إصلاحها، وأحيانًا تلقائيًا بواسطة أنظمة أكثر تقدمًا. يكمن الخطر الحقيقي في الأخطاء غير المكتشفة التي لا تظهر إلا أثناء التشغيل، مما يتطلب مهارات قوية في الاختبار اليدوي وضمان الجودة. ينصح المؤلف المطورين بتحسين مهاراتهم في قراءة وفهم ومراجعة التعليمات البرمجية، ويقدم نصائح للحد من الهلوسات، مثل تجربة نماذج مختلفة، واستخدام السياق بكفاءة، واختيار تقنيات راسخة. تُقدّم القدرة على مراجعة التعليمات البرمجية التي تم إنشاؤها بواسطة نماذج اللغات الكبيرة كمهارة قيّمة.

اقرأ المزيد
التطوير

نموذج LLM أقل من 100 ميجابايت قابل للتثبيت الآن عبر pip: تقديم llm-smollm2

2025-02-07
نموذج LLM أقل من 100 ميجابايت قابل للتثبيت الآن عبر pip: تقديم llm-smollm2

مكوّن إضافي جديد، llm-smollm2، يضم نموذج LLM SmolLM2-135M-Instruct مُكمّن بحجم أقل من 100 ميجابايت، مما يجعله قابلًا للتثبيت عبر pip. يفصل الكاتب عملية إنشاء المكوّن الإضافي، بدءًا من البحث عن نموذج مناسب أقل من 100 ميجابايت (محدود بقيود حجم PyPI) وحتى كتم سجلات llama-cpp-python التفصيلية وتعبئة المكوّن الإضافي لنشره على PyPI. على الرغم من قدرات النموذج المحدودة، إلا أنه يُقدّم كأداة تعليمية قيّمة لفهم تقنية LLM.

اقرأ المزيد
التطوير كمّنة النموذج

وثيقة تدريب IBM المفقودة: لا يمكن محاسبة أجهزة الكمبيوتر (1979)

2025-02-03
وثيقة تدريب IBM المفقودة: لا يمكن محاسبة أجهزة الكمبيوتر (1979)

ظهرت صفحة أسطورية من تدريب داخلي لشركة IBM في عام 1979 على الإنترنت، تنص على: "لا يمكن محاسبة الكمبيوتر أبدًا؛ لذلك، يجب ألا يتخذ الكمبيوتر أبدًا قرارًا إداريًا". فقدت المصدر الأصلي، ويقال إنه دمرته الفيضانات. هذا البيان يتردد صداها بقوة في عصرنا الذي تقوده الذكاء الاصطناعي، مما يدفع إلى التفكير في مسؤولية الذكاء الاصطناعي واتخاذ القرارات.

اقرأ المزيد
الذكاء الاصطناعي وثيقة تاريخية

طلب التوظيف في أنثروبيك: لا مساعدين للذكاء الاصطناعي مسموح بهم

2025-02-03

يُحظر نموذج طلب التوظيف في أنثروبيك صراحة استخدام مساعدي الذكاء الاصطناعي أثناء عملية التقديم. ترغب الشركة في تقييم اهتمام المرشحين الحقيقي بأنثروبيك ومهاراتهم في التواصل دون وساطة من الذكاء الاصطناعي. وهذا يضمن تقييمًا عادلًا وموثوقًا لقدرات المرشحين وعمليات تفكيرهم.

اقرأ المزيد
الشركات الناشئة طلب التوظيف

o3-mini من OpenAI: نموذج لغة كبير قوي وبأسعار معقولة

2025-02-01

أصدرت OpenAI نموذج اللغة الكبير الجديد o3-mini، والذي يتفوق في معيار برمجة Codeforces التنافسي، متجاوزًا GPT-4o و o1 بشكل كبير. وعلى الرغم من أنه ليس متفوقًا في جميع الجوانب، إلا أن سعره المنخفض (1.10 دولارًا أمريكيًا لكل مليون رمز إدخال، و4.40 دولارًا أمريكيًا لكل مليون رمز إخراج) وحدّه العالي جدًا لإخراج الرموز (100,000 رمز) يجعله تنافسيًا للغاية. تخطط OpenAI لدمجه في ChatGPT للبحث على الويب والتلخيص، والدعم متاح بالفعل في LLM 0.21، ولكنه حاليًا محدود للمستخدمين من المستوى 3 (على الأقل 100 دولار أمريكي تم إنفاقها على واجهة برمجة التطبيقات). يوفر o3-mini للمطورين خيارًا قويًا واقتصاديًا من نماذج اللغة الكبيرة.

اقرأ المزيد
الذكاء الاصطناعي

llama.cpp WASM: زيادة السرعة بمقدار الضعف بفضل SIMD المُحسّن

2025-01-28

تسلط مدونة سايمون ويليسون الضوء على تحسين كبير في llama.cpp: زيادة في السرعة بمقدار الضعف لإصدار WASM، تم تحقيقه من خلال تحسين تعليمات SIMD. والمثير للدهشة أن 99% من التعليمات البرمجية تم إنشاؤها بواسطة أداة البرمجة بمساعدة الذكاء الاصطناعي DeepSeek R1. قضت DeepSeek R1 من 3 إلى 5 دقائق في "التفكير" في كل مطالبة، مما ساعد المطور في النهاية على تحسين البرنامج المساعد llm_groq.py وإزالة model_map بشكل أنيق، وبالتالي تبسيط التعليمات البرمجية. هذا يوضح الإمكانات الهائلة للذكاء الاصطناعي في تحسين التعليمات البرمجية وإعادة هيكلتها.

اقرأ المزيد

Qwen 2.5 من علي بابا: نموذج لغة كبير بسياق يصل إلى مليون رمز

2025-01-26

أصدرت علي بابا تحديثًا رئيسيًا لنموذج اللغة الكبير مفتوح المصدر الخاص بها، Qwen 2.5، والذي يتميز بنطاق سياق مذهل يصل إلى مليون رمز! تم تحقيق ذلك من خلال تقنية جديدة تسمى Dual Chunk Attention. يتوفر نموذجان على Hugging Face: إصداران بـ 7 مليار و 14 مليار معلمة، وكلاهما يتطلبان ذاكرة وصول عشوائي ضخمة (VRAM) - 120 جيجابايت على الأقل للنموذج ذي 7 مليارات معلمة و 320 جيجابايت على الأقل للنموذج ذي 14 مليار معلمة. على الرغم من إمكانية استخدامهما في المهام الأقصر، توصي علي بابا باستخدام إطار عمل vLLM المخصص الخاص بها. تظهر إصدارات مُكمّنة GGUF، والتي تقدم أحجامًا أصغر، ولكن قد توجد مشكلات توافق مع أطوال السياقات الكاملة. حاول أحد المدونين تشغيل الإصدار GGUF على جهاز Mac باستخدام Ollama، واجه بعض التحديات ووعد بتحديث مستقبلي.

اقرأ المزيد
الذكاء الاصطناعي سياق مليون رمز

توقعات الذكاء الاصطناعي/نماذج اللغات الكبيرة: خلال 1 و3 و6 سنوات

2025-01-11

شارك سايمون ويليسون توقعاته حول تطوير الذكاء الاصطناعي/نماذج اللغات الكبيرة خلال السنوات القادمة (1 و3 و6 سنوات) في بودكاست Oxide and Friends. يتوقع أن وكلاء الذكاء الاصطناعي متعددي الأغراض لن تظهر قريباً، لكن مساعدي البرمجة والبحث سيُزدهرون. خلال ثلاث سنوات، قد يفوز تقرير استقصائي بمساعدة الذكاء الاصطناعي بجائزة بوليتزر، بالإضافة إلى قوانين خصوصية أكثر صرامة. بعد ست سنوات، قد ينتج الذكاء الاصطناعي أعمالاً فنية مذهلة، لكنه قد يؤدي أيضاً إلى اضطرابات مدنية واسعة النطاق، اعتماداً على تطوير وتأثير AGI/ASI الاقتصادي. ويُشدد ويليسون على قلّة ثقته في هذه التوقعات، ويقدمها كنقطة انعكاس مثيرة للاهتمام للمستقبل.

اقرأ المزيد

نهجي في إدارة مدونة الروابط: أكثر من 7600 مشاركة!

2025-01-06
نهجي في إدارة مدونة الروابط: أكثر من 7600 مشاركة!

يتشارك سايمون ويليسون نهجه في إدارة مدونة روابط ناجحة على مدى أكثر من عقدين من الزمن. يُفصّل أساليبه في تنظيم وعرض الروابط، مُشدداً على أهمية إضافة تعليقات ثاقبة، وإعطاء الفضل المُستحق للمُبدعين، واستخدام التكنولوجيا (Django، Markdown، Claude) لتحسين التجربة. يُجادل بأن مدونة الروابط هي وسيلة قليلة الجهد وعالية العائد للمساهمة بشكلٍ مُؤثر في النقاش عبر الإنترنت، ويُشجع الآخرين على تبني هذه الممارسة.

اقرأ المزيد

تسوية آبل مع سيري بقيمة 95 مليون دولار: هل هي معلومات مضللة أكثر من التجسس عبر الميكروفون؟

2025-01-03

سوت آبل دعوى قضائية بمبلغ 95 مليون دولار بشأن ادعاءات بأن تسجيلات سيري استخدمت في الإعلانات المستهدفة، على الرغم من نفيها أي مخالفات. يجادل الكاتب بأن دقة استهداف الإعلانات ترجع على الأرجح إلى جمع بيانات التطبيق أكثر من التجسس عبر الميكروفون. ومع ذلك، فإن الأدلة القصصية للإعلانات التي تتطابق مع المحادثات ستؤجج على الأرجح نظريات المؤامرة حول مراقبة الميكروفون، بغض النظر عن الحقيقة.

اقرأ المزيد
التكنولوجيا الإعلانات المستهدفة

نماذج اللغات الكبيرة في عام 2024: اختراقات وتحديات

2024-12-31
نماذج اللغات الكبيرة في عام 2024: اختراقات وتحديات

شهد عام 2024 تطوراً ملحوظاً في نماذج اللغات الكبيرة (LLMs). تجاوزت العديد من المؤسسات أداء GPT-4، مما أدى إلى زيادة هائلة في الكفاءة، وحتى تمكين تشغيل LLMs على أجهزة الكمبيوتر المحمولة الشخصية. أصبحت النماذج متعددة الوسائط شائعة، مع ظهور قدرات الصوت والفيديو. أصبحت توليد التطبيقات القائمة على المطالبات سلعة، لكن الوصول الشامل إلى أفضل النماذج استمر لبضعة أشهر فقط. بينما ظلت "الوكلاء" بعيدة المنال، أصبحت أهمية التقييم ذات أهمية قصوى. برزت مكتبة MLX من Apple، على النقيض من ميزات "Apple Intelligence" المخيبة للآمال. ظهرت نماذج توسيع الاستدلال، وخفضت التكاليف، وحسنت التأثير البيئي، لكنها أثارت أيضًا مخاوف بشأن العواقب البيئية للبنى التحتية الجديدة. أثبتت بيانات التدريب الاصطناعية فعاليتها العالية، لكن سهولة استخدام LLMs ظلت تحديًا، وظلت توزيع المعرفة غير متساوٍ، وهناك حاجة إلى تقييمات نقدية أفضل.

اقرأ المزيد

علي بابا تكشف النقاب عن نموذج QvQ: نموذج جديد للاستدلال البصري

2024-12-25
علي بابا تكشف النقاب عن نموذج QvQ: نموذج جديد للاستدلال البصري

أصدرت علي بابا مؤخراً نموذج QvQ-72B-Preview، وهو نموذج جديد للاستدلال البصري برخصة Apache 2.0. صُمّم لتعزيز قدرات الاستدلال البصري للذكاء الاصطناعي، ويعتمد QvQ على نموذج QwQ القائم على توسيع الاستدلال بإضافة معالجة الصور. يقبل النموذج الصور والتعليمات، ويُنتج عمليات استدلال مفصلة خطوة بخطوة. قام المدوّن سيمون ويليسون باختبار QvQ، ووجد أنه ناجح في مهام مثل عد طيور البجع، لكنه أقل دقة في مسائل الاستدلال المعقدة. يتوفر النموذج حاليًا على Hugging Face Spaces، والخطط المستقبلية تشمل النشر المحلي ودعم منصات أوسع.

اقرأ المزيد

معيار LLM: طائر البجع على دراجة هوائية

2024-12-16

ابتكر سيمون ويليسون معيارًا فريدًا لـ LLM: وهو إنشاء صورة SVG لطائر بجع يركب دراجة هوائية. يهدف هذا الطلب غير المعتاد إلى اختبار قدرات النماذج الإبداعية دون الاعتماد على بيانات تدريب موجودة مسبقًا. قام باختبار 16 نموذجًا من OpenAI و Anthropic و Google Gemini و Meta (Llama على Cerebras) ، وكشف عن اختلافات كبيرة في جودة ملفات SVG الناتجة. أنتجت بعض النماذج نتائج جيدة بشكل مدهش ، بينما عانت نماذج أخرى.

اقرأ المزيد
الذكاء الاصطناعي توليد الصور

تخزين الأوقات للأحداث البشرية: أفضل الممارسات والتحديات

2024-12-12
تخزين الأوقات للأحداث البشرية: أفضل الممارسات والتحديات

تتناول هذه المدونة أفضل الممارسات لتخزين أوقات الأحداث في مواقع الويب الخاصة بالأحداث. يجادل الكاتب بأن تخزين وقت UTC مباشرةً يؤدي إلى فقدان معلومات بالغة الأهمية، مثل نية المستخدم الأصلية والموقع. والنهج الأفضل هو تخزين الوقت المقصود من قِبل المستخدم وموقع الحدث، ثم اشتقاق وقت UTC. أمثلة مثل خطأ المستخدم، وتعديلات المناطق الزمنية الدولية، وتحديث DST من Microsoft Exchange لعام 2007 توضح أهمية تخزين الوقت المقصود من قِبل المستخدم. يوصي الكاتب بتصميم واجهة مستخدم واضحة وسهلة الاستخدام لمساعدة المستخدمين على تحديد أوقات ومواقع الأحداث بدقة، مع التأكيد على أهمية الحفاظ على نية المستخدم الأصلية لتجنب الأخطاء الناتجة عن تغييرات المناطق الزمنية.

اقرأ المزيد
2 Next →