DALLA Launch Invitation | دعوة لتجربة دلّة
Englishنماذج المركز العربي (الدوحة) الضخمة للغة العربية
(محاولة بناء نماذج لغوية ضخمة واعية ثقافيا واجتماعيًا)
الزملاء والأصدقاء الأعزّاء،
يسعدنا أن ندعوكم لتجربة واستكشاف اطار دلّة؛ الذي يقدّم نماذج لغوية عربية طوِّرت لتكون واعية اجتماعيا وثقافيا في سياق العالم العربي. هذه النماذج نتاج مبادرة رائدة تثبت بالدليل أن فرقًا صغيرة بميزانيات بسيطة تملك كل ما يحتاجه بناء وفهم وتوليد نماذج لغوية عربية ضخمة لديها حساسية ثقافية واجتماعية.
القيمة المضافة لدلّة
نماذج دلّة تختلف عن النماذج الفائقة الضخامة المعروفة؛ فهي تتبنى الحجم الصغير مقارنة بحجم النماذج المشهورة. ومع ذلك، فإنها صُمّمت لتبرهن أنه بالإمكان تقديم أداء مقبول وفعّال في مهمات تهم المستخدم، من خلال عملية إعادة التدريب والتنقيح باستخدام بيانات عربية وتقنيات ذكية لتنقية ومعالجة البيانات. وهذا كله من دون الحاجة لمشاركة البيانات مع الشركات الضخمة، ما يحافظ على خصوصية المؤسسات والأفراد المستخدمين لأي من نماذج دلّة المفتوحة الأوزان.
يقدّم إطار دلة تقنية إعادة استخدام الرموز لتخفيض كلفة التدريب والتشغيل. نجحنا في تخفيض عدد الرموز المطلوبة لمعالجة النصوص العربية بمعدل أربع مرات إلى مرتين مقارنة بالنماذج الأصلية. مما يجعل نماذج دلّة المتقدّمة متاحة ومستديمة أكثر. بعض القدرات المتعلقة بالرموز المستخدمة قد تتأثر وبالتالي قد يستوجب ذلك بعض عمليات إعادة التدريب للاحتفاظ بهذه القدرات إن كانت مطلوبة.
ويمكن لفرق مطوّرين بحثية صغيرة نسبيًا استخدام البرامج المفتوحة المصدر لدلة لبناء وتنقيح نماذجهم الخاصة والمساهمة ببناء مستقبل الذكاء الاصطناعي العربي.
ملاحظات مهمّة حول سقف التوقعات عند استخدام نماذج دلة المفتوحة الأوزان
نماذج دلّة لا تزال في مراحل مبكرة. قد “تُهلوس” أحيانًا، أو تقدّم إجابات غير دقيقة، أو تسيء فهم السياق أحيانًا أخرى. وهنا يأتي دور تفاعلكم وتواصلكم مع النماذج ومع الفريق. حيث تشكل تفاعلاتكم وملاحظاتكم عناصر أساسية في تحسين النماذج، وتعزيز قدراتها، وتطويرها لتخدم المستخدمين العرب بصورة أفضل. الرجاء استخدام أدوات التعبير عن حالة الرضا عبر النجوم (stars)، والتعليق (comments)، والإبهام المرفوع والمقلوب (thumbs up/down) ليستطيع الفريق من الاستفادة من تعليقاتكم والاعتناء بها في النماذج القادمة.
لماذا نعتبر هذا المشروع مهمًا؟
يتضمّن هذا المشروع إطلاق منصّة مفتوحة المصدر (CC BY-NC-SA) تمكّن المجموعات العلمية العربية من:
- الاستفادة من نماذج مفتوحة الأوزان مع المحافظة على قواعدها المعرفية الأصلية. [dalla.acrps.ai]
- إعادة تدريب نماذج مفتوحة الأوزان بما يتوافق مع اللغة العربية وسياقاتها. [GitHub] [dalla-gemma-it] [dalla-llama-it]
- تخصيص النماذج لمهام محددة: مثلًا في الإعلام، والبحث العلمي، والتعليم، والخدمات العامة، وغير ذلك.
- تعزيز بناء بيئة عربية بحثية مفتوحة تُطوَّر فيها نماذج لغوية فعّالة، وحسّاسة اجتماعيًا وثقافيًا، ومنخفضة التكلفة.
ندعوكم لاستخدام النماذج، وانتقادها، وتقديم ملاحظاتكم على dalla.acrps.ai. بذلك تكونون مساهمين أساسيين في تشكيل الجيل القادم من تقنيات الذكاء الاصطناعي المبنية عربيًا ولأجل العالم العربي. ذكاء اصطناعي عربي أولًا، بجهود جماعية ذكيّة.
فلنصنع مستقبل الذكاء الاصطناعي العربي… معًا.
مع خالص التحية،
فريق عمل دلّة
وحدة أبحاث المجال الرقمي والاجتماعي العربي
المركز العربي للأبحاث ودراسة السياسات
الدوحة، قطر