1.5 Flash
النموذج الأكثر توازناً بين الوسائط المتعددة والذي يحقّق أداءً رائعًا لمعظم المهام
- إدخال الصوت والصور والفيديوهات والنصوص والحصول على ردود نصية
- إنشاء رموز واستخراج البيانات وتعديل النص وغير ذلك
- الأنسب للمهام التي توازن بين الأداء والتكلفة
خيارات المنتج
توفّر Gemini API نماذج مختلفة محسَّنة لحالات استخدام محدّدة. في ما يلي نظرة عامة موجزة على أنواع Gemini المتاحة:
خيار المنتج | الإدخالات | الناتج | محسَّن من أجل |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
الصوت والصور والفيديوهات والنصوص | نص | أداء سريع ومتعدد الاستخدامات في مجموعة متنوعة من المهام |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
الصوت والصور والفيديوهات والنصوص | نص | مهام كبيرة الحجم وذكاء أقل |
Gemini 1.5 Pro
gemini-1.5-pro |
الصوت والصور والفيديوهات والنصوص | نص | مهام التفكير المعقدة التي تتطلّب ذكاءً أكبر |
Gemini 1.0 Pro
gemini-1.0-pro |
نص | نص | المهام بلغة طبيعية ومحادثات متعددة النصوص والرموز البرمجية وإنشاء الرموز البرمجية |
تضمين النص
text-embedding-004 |
نص | تضمينات النص | قياس مدى صلة السلاسل النصية |
AQA
aqa |
نص | نص | توفير إجابات تستند إلى المصدر عن الأسئلة |
Gemini 1.5 Flash
Gemini 1.5 Flash هو نموذج سريع ومتعدِّد الوسائط يوسّع نطاق المهام على مختلف المهام.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-flash |
أنواع البيانات المتوافقة |
مصادر الإدخال الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لإدخال الرموز المميّزة 1,048,576 حد الرمز المميّز للإخراج 8,192 |
مواصفات الصوت/المرئي |
الحد الأقصى لعدد الصور لكل طلب 3,600 الحدّ الأقصى لمدة الفيديو ساعة واحدة الحد الأقصى لطول الصوت 9.5 ساعة تقريبًا |
[**] | حدود السرعة
|
قدرات |
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح |
الإصدارات |
|
آخر تعديل | سبتمبر 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B هو نموذج صغير مصمّم للمهام الأقل ذكاءً.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-flash-8b |
أنواع البيانات المتوافقة |
مصادر الإدخال الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 1,048,576 حد الرمز المميّز للإخراج 8,192 |
مواصفات الصوت/المرئي |
الحد الأقصى لعدد الصور لكل طلب 3,600 الحدّ الأقصى لمدة الفيديو ساعة واحدة الحد الأقصى لطول الصوت 9.5 ساعة تقريبًا |
[**] | حدود السعر
|
قدرات |
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح |
الإصدارات |
|
آخر تحديث | تشرين الأول (أكتوبر) 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro هو نموذج متوسط الحجم متعدد الوسائط محسَّن لتنفيذ مجموعة واسعة من المهام الاستنتاجية. يمكن لإصدار 1.5 Pro معالجة كميات كبيرة من البيانات في آنٍ واحد، بما في ذلك ساعتان من الفيديوهات أو 19 ساعة من المحتوى الصوتي أو قواعد الرموز البرمجية التي تضم 60,000 سطر من الرموز البرمجية أو 2,000 صفحة من النصوص.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-pro |
أنواع البيانات المتوافقة |
مصادر الإدخال الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 2,097,152 الحد الأقصى لرموز الإخراج 8,192 |
مواصفات الصوت/المرئي |
الحد الأقصى لعدد الصور لكل طلب 7,200 الحد الأقصى لمدة الفيديو ساعتان الحد الأقصى لطول الملف الصوتي 19 ساعة تقريبًا |
[**] | حدود السرعة
|
قدرات |
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط غير متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح |
Versions |
|
آخر تحديث | سبتمبر 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro هو نموذج معالجة لغة طبيعية يعالج مهامًا مثل المحادثات المتعدّدة الجولات التي تتضمّن نصًا و رمزًا برمجيًا وإنشاء رموز برمجية.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.0-pro |
أنواع البيانات المتوافقة |
الإدخال نص النتيجة نص |
[**] | حدود السرعة
|
تعليمات النظام غير متاح وضع JSON غير متاح مخطّط JSON غير متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت غير متاح الضبط متاح استدعاء الدالة متاح إعدادات استدعاء الدوالّ غير متاح تنفيذ الرمز البرمجي غير متاح |
|
Versions |
|
آخر تحديث | شباط (فبراير) 2024 |
تضمين النصوص
تضمين النص
تُستخدَم عمليات إدراج النصوص لقياس مدى صلة السلاسل ببعضها، وهي تُستخدَم على نطاق واسع في العديد من تطبيقات الذكاء الاصطناعي.
يحقّق text-embedding-004
أداءً أفضل في الاسترجاع ويتفوّق على النماذج الحالية
باستخدام سمات مشابهة، وذلك في مقاييس الأداء العادية لدمج MTEB.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال نص النتيجة تضمينات النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز الم��يّزة 2,048 حجم سمة الإخراج 768 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان قابلة للتعديل | غير متاح |
آخر تحديث | أبريل 2024 |
التضمين
يمكنك استخدام نموذج التضمين لإنشاء تضمينات نص لنص الإدخال.
تم تحسين نموذج "الترميز" لإنشاء نماذج ترميز تتضمّن 768 سمة للنص الذي يصل إلى 2,048 رمزًا.
تضمين تفاصيل النموذج
الموقع | الوصف |
---|---|
رمز الطراز |
models/embedding-001
|
أنواع البيانات المتوافقة |
الإدخال نص النتيجة عمليات تضمين النصوص |
[*] | حدود الرموز المميّزة
الحد الأقصى لإدخال الرموز المميّزة 2,048 حجم سمة الإخراج 768 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان قابلة للتعديل | غير متاح |
آخر تعديل | كانون الأول (ديسمبر) 2023 |
AQA
يمكنك استخدام نموذج AQA لتنفيذ مهام مرتبطة بميزة تحديد المصدر للإجابة عن السؤال (AQA) على مستند أو قاعدة بيانات أو مجموعة من المقاطع. يعرض نموذج AQA إجابات عن الأسئلة المستندة إلى المصادر المقدَّمة، بالإضافة إلى تقدير الاحتمالية التي يمكن الإجابة عنها.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/aqa |
أنواع البيانات المتوافقة |
الإدخال نص النتيجة نص |
اللغات المتاحة | الإنجليزية |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 7,168 الحد الأقصى لرموز الإخراج 1,024 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان | وقابلة للتعديلمتاح |
آخر تعديل | كانون الأول (ديسمبر) 2023 |
اطّلِع على الأمثلة للتعرّف على إمكانات هذه الأنواع من النماذج.
[*] يعادل الرمز المميّز 4 أحرف تقريبًا في نماذج Gemini. 100 رمز تُمثّل ما يقرب من 60 إلى 80 كلمة باللغة الإنجليزية.
[**] عدد الطلبات في الدقيقة (RPM):
الرموز المميّزة في الدقيقة (TPM):
الطلبات في اليوم (RPD):
الرموز المميّزة في اليوم (TPD):
بسبب القيود المفروضة على السعة، لا يمكن ضمان عدم تجاوز الحدود القصوى المحدّدة للمعدل.
أنماط أسماء إصدارات الطراز
تتوفّر نماذج Gemini إما في إصدار المعاينة أو الثابت. في الرمز البرمجي، يمكنك استخدام أحد تنسيقات أسماء الطُرز التالية لتحديد طراز والإصدار اللذين تريد استخدامهما.
أحدث: يشير إلى أحدث إصدار من النموذج لجيل ونوع محدّدَين. يتم تحديث النموذج الأساسي بانتظام وقد يكون إصدار معاينة. يجب استخدام هذا الاسم المعرِّف فقط مع التطبيقات والنماذج الأولية للاختبار الاستكشافي.
لتحديد أحدث إصدار، استخدِم النمط التالي:
<model>-<generation>-<variation>-latest
. على سبيل المثال،gemini-1.0-pro-latest
.أحدث إصدار ثابت: يشير إلى أحدث إصدار ثابت تم إصداره لجيل الموديل وطرازه المحدّدَين.
لتحديد أحدث إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>
. مثلاً:gemini-1.0-pro
مستقر: يشير إلى نموذج ثابت معيّن. لا تتغيّر النماذج الثابتة. يجب أن تستخدم معظم التطبيقات العلنية طرازًا ثابتًا محدّدًا.
لتحديد إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. على سبيل المثال،gemini-1.0-pro-001
.تجريبي: يشير إلى نموذج تجريبي متوفّر في "المعاينة"، كما هو محدّد في الأحكام، ما يعني أنّه غير مخصّص للاستخدام في مرحلة الإنتاج. نطرح نماذج تجريبية لجمع الملاحظات والآراء، وتقديم آخر التحديثات للمطوّرين بشكل سريع، وإبراز وتيرة الابتكار في Google. وتساعدنا المعلومات التي نكتسبها من عمليات الإطلاق التجريبية في تحديد كيفية طرح النماذج على نطاق أوسع. يمكن تبديل نموذج تجريبي إلى آخر دون إشعار مسبق. لا نضمن أن يصبح النموذج التجريبي نموذجًا ثابتًا في المستقبل.
لتحديد إصدار تجريبي، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. مثلاً:gemini-1.5-pro-exp-0827
اللغات المتاحة
تم تدريب نماذج Gemini للعمل باللغات التالية:
- العربية (
ar
) - البنغالية (
bn
) - البلغارية (
bg
) - الصينية المبسّطة والتقليدية (
zh
) - الكرواتية (
hr
) - التشيكية (
cs
) - الدانمركية (
da
) - الهولندية (
nl
) - الإنجليزية (
en
) - الإستونية (
et
) - الفنلندية (
fi
) - الفرنسية (
fr
) - الألمانية (
de
) - اليونانية (
el
) - العبرية (
iw
) - الهندية (
hi
) - المجرية (
hu
) - الإندونيسية (
id
) - الإيطالية (
it
) - اليابانية (
ja
) - الكورية (
ko
) - اللات��ية (
lv
) - الليتوانية (
lt
) - النرويجية (
no
) - البولندية (
pl
) - البرتغالية (
pt
) - الرومانية (
ro
) - الروسية (
ru
) - الصربية (
sr
) - السلوفاكية (
sk
) - السلوفينية (
sl
) - الإسبانية (
es
) - السواحيلية (
sw
) - السويدية (
sv
) - التايلاندية (
th
) - التركية (
tr
) - الأوكرانية (
uk
) - الفيتنامية (
vi
)