مقارنة النماذج: Granite 4 مقابل Qwen 3 مقابل Gemma 4
يقدم هذا الدليل مقارنة وجهاً لوجه بين عائلات النماذج الثلاث الرائدة مفتوحة الأوزان للضبط الدقيق في AuroraSOC. نقيّم كل نموذج من حيث البنية والمعايير ومتطلبات VRAM والأداء في المجال الأمني والتكلفة.
لماذا نقارن النماذج؟
يستخدم AuroraSOC افتراضياً IBM Granite 4 لأنه صُمِّم خصيصاً للمهام الوكيلة في المؤسسات. لكن بحسب قيود النشر أو متطلبات الأجهزة أو المهام، قد يكون Qwen 3 أو Gemma 4 أكثر ملاءمةً لوكلاء بعينهم.
نظرة عامة على عائلات النماذج
IBM Granite 4 (الافتراضي)
| المتغير | المعاملات | البنية | طول السياق | الترخيص |
|---|---|---|---|---|
| granite-4.0-micro | ~1B | Transformer كثيف | 128K | Apache 2.0 |
| granite-4.0-h-micro | ~1B | هجين (Transformer + Mamba SSM) | 128K | Apache 2.0 |
| granite-4.0-h-tiny ⭐ | ~2B | هجين | 128K | Apache 2.0 |
| granite-4.0-h-small | ~8B | هجين | 128K | Apache 2.0 |
المميزات الرئيسية:
- البنية الهجينة — تجمع بين انتباه Transformer ونماذج حالة Mamba لمعالجة أفضل للسياق الطويل
- مصمم للمهام الوكيلة — استدعاء دوال أصلي، استخدام أدوات، ومخرجات JSON منظمة
- مصدر بيانات تدريب موثوق — IBM تضمن الامتثال القانوني لبيانات التدريب (Apache 2.0)
Qwen 3 (Alibaba Cloud)
نقاط القوة: استدلال قوي بـ "وضع التفكير" (<think> tags)، توليد كود ممتاز، دعم متعدد اللغات.
الأنسب لـ: Threat Hunter، Malware Analyst، Network Security، Web Security.
Google Gemma 4
نقاط القوة: قدرات متعددة الوسائط، سياق أطول، كتابة متسقة على النصوص الطويلة.
الأنسب لـ: Forensic Analyst، Incident Responder، Report Generator.
ملخص التوصيات
| الحالة | النموذج الموصى به |
|---|---|
| الإعداد الافتراضي | IBM Granite 4 H-Tiny (~2B) |
| أولوية جودة استدعاء الأدوات | IBM Granite 4 H-Small (8B) |
| أولوية توليد الكود والاستدلال | Qwen 3 8B |
| مهام الكتابة الطويلة والتحليل المعقد | Gemma 4 12B |
| موارد VRAM محدودة (12 GB) | Granite 4 H-Tiny (2B) مع QLoRA |
راجع الوثيقة الإنجليزية للحصول على بيانات المعايير التفصيلية ومقارنات VRAM وإعدادات التكوين الكاملة لكل عائلة نماذج.