2.5 Pro
हमारा सबसे बेहतर थिंकिंग मॉडल, जो ज़्यादा सटीक जवाब देता है और बेहतरीन परफ़ॉर्म करता है
- ऑडियो, इमेज, वीडियो, और टेक्स्ट डालें और टेक्स्ट के तौर पर जवाब पाएं
- मुश्किल समस्याओं को हल करना, बड़े डेटाबेस का विश्लेषण करना वगैरह
- मुश्किल कोडिंग, रीज़निंग, और अलग-अलग तरह के इनपुट को समझने के लिए सबसे सही
2.5 Flash
कीमत और परफ़ॉर्मेंस के हिसाब से, हमारा सबसे अच्छा मॉडल. इसमें कई तरह की सुविधाएं मिलती हैं.
- ऑडियो, इमेज, वीडियो, और टेक्स्ट डालें और टेक्स्ट के तौर पर जवाब पाएं
- मॉडल ज़रूरत के हिसाब से काम करता है. इसके अलावा, आपके पास 'सोचने वाला बजट' कॉन्फ़िगर करने का विकल्प भी होता है
- कम इंतज़ार के समय और ज़्यादा संख्या में ऐसे टास्क के लिए सबसे अच्छा है जिनमें सोचने की ज़रूरत होती है
मॉडल के वैरिएंट
Gemini API, अलग-अलग मॉडल उपलब्ध कराता है. ये मॉडल, इस्तेमाल के अलग-अलग उदाहरणों के लिए ऑप्टिमाइज़ किए जाते हैं. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:
मॉडल का वैरिएंट | इनपुट | आउटपुट | इनके लिए ऑप्टिमाइज़ किया गया |
---|---|---|---|
Gemini 2.5 Pro gemini-2.5-pro | ऑडियो, इमेज, वीडियो, टेक्स्ट, और PDF | टेक्स्ट | बेहतर तरीके से सोचने-समझने की क्षमता, मल्टीमोडल तरीके से जानकारी समझने की सुविधा, ऐडवांस कोडिंग वगैरह |
Gemini 2.5 Flash gemini-2.5-flash | ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | अडैप्टिव थिंकिंग, लागत के हिसाब से ज़्यादा असरदार |
Gemini 2.5 Flash-Lite की झलक gemini-2.5-flash-lite-preview-06-17 | टेक्स्ट, इमेज, वीडियो, ऑडियो | टेक्स्ट | ज़्यादा थ्रूपुट के साथ काम करने वाला सबसे किफ़ायती मॉडल |
Gemini 2.5 Flash नेटिव ऑडियो gemini-2.5-flash-preview-native-audio-dialog & gemini-2.5-flash-exp-native-audio-thinking-dialog | ऑडियो, वीडियो, और टेक्स्ट | टेक्स्ट और ऑडियो, इंटरलीव किया गया | अच्छी क्वालिटी के ऑडियो आउटपुट, जो बातचीत की भावना को बनाए रखते हैं. इनमें सोच-विचार करने की सुविधा भी हो सकती है और नहीं भी |
Gemini 2.5 Flash Preview TTS gemini-2.5-flash-preview-tts | टेक्स्ट | ऑडियो | कम इंतज़ार, कंट्रोल करने की सुविधा, एक और कई स्पीकर के लिए लिखाई को बोली में बदलने की सुविधा |
Gemini 2.5 Pro में टीटीएस की सुविधा की झलक gemini-2.5-pro-preview-tts | टेक्स्ट | ऑडियो | कम इंतज़ार, कंट्रोल करने की सुविधा, एक और कई स्पीकर के लिए लिखाई को बोली में बदलने की सुविधा |
Gemini 2.0 Flash gemini-2.0-flash | ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | अगली पीढ़ी की सुविधाएं, तेज़ स्पीड, और रीयल-टाइम स्ट्रीमिंग. |
Gemini 2.0 में फ़्लैश की झलक दिखाने वाली इमेज जनरेट करने की सुविधा gemini-2.0-flash-preview-image-generation | ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट, इमेज | बातचीत के ज़रिए इमेज जनरेट करने और उनमें बदलाव करने की सुविधा |
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite | ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | कम लागत और कम लेटेंसी |
Gemini 1.5 Flash gemini-1.5-flash | ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस |
Gemini 1.5 Flash-8B gemini-1.5-flash-8b | ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | ज़्यादा वॉल्यूम और कम इंटेलिजेंस वाले टास्क |
Gemini 1.5 Pro gemini-1.5-pro | ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | ऐसे जटिल काम जिनमें ज़्यादा बुद्धिमत्ता की ज़रूरत होती है |
Gemini को एम्बेड करना gemini-embedding-exp | टेक्स्ट | टेक्स्ट एम्बेड करना | टेक्स्ट स्ट्रिंग की आपस में मिलती-जुलती होने की डिग्री का आकलन करना |
Imagen 3 imagen-3.0-generate-002 | टेक्स्ट | इमेज | इमेज जनरेट करने वाला हमारा सबसे ऐडवांस मॉडल |
Veo 2 veo-2.0-generate-001 | टेक्स्ट, इमेज | वीडियो | अच्छी क्वालिटी का वीडियो जनरेट करना |
Gemini 2.5 Flash Live gemini-live-2.5-flash-preview | ऑडियो, वीडियो, और टेक्स्ट | टेक्स्ट, ऑडियो | कम इंतज़ार के साथ, दोनों तरफ़ से आवाज़ और वीडियो के ज़रिए इंटरैक्ट करना |
Gemini 2.0 Flash Live gemini-2.0-flash-live-001 | ऑडियो, वीडियो, और टेक्स्ट | टेक्स्ट, ऑडियो | कम इंतज़ार के साथ, दोनों तरफ़ से आवाज़ और वीडियो के ज़रिए इंटरैक्ट करना |
रेट की सीमाओं वाले पेज पर जाकर, हर मॉडल के लिए रेट की सीमाएं देखी जा सकती हैं.
Gemini 2.5 Pro
Gemini 2.5 Pro, हमारा सबसे बेहतर थिंकिंग मॉडल है. यह कोड, गणित, और विज्ञान, प्रौद्योगिकी, इंजीनियरिंग, और गणित (STEM) से जुड़ी मुश्किल समस्याओं को हल कर सकता है. साथ ही, लंबे कॉन्टेक्स्ट का इस्तेमाल करके, बड़े डेटासेट, कोडबेस, और दस्तावेज़ों का विश्लेषण कर सकता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | gemini-2.5-pro |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, इमेज, वीडियो, टेक्स्ट, और PDF आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 65,536 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम करता है Search पर भरोसेमंद स्रोतों से जानकारी पाना काम करता है इमेज जनरेट करना काम नहीं करता है ऑडियो जनरेट करना काम नहीं करता है लाइव एपीआई काम नहीं करता है सोचना काम करता है |
वर्शन |
|
का नया अपडेट | जून 2025 |
नॉलेज कट्सऑफ़ | जनवरी 2025 |
Gemini 2.5 Flash
कीमत और परफ़ॉर्मेंस के हिसाब से, हमारा सबसे अच्छा मॉडल. इसमें कई तरह की सुविधाएं मिलती हैं. 2.5 Flash, बड़े पैमाने पर प्रोसेसिंग, कम इंतज़ार, ऐसे ज़्यादा कामों के लिए सबसे अच्छा है जिनमें सोच-विचार की ज़रूरत होती है. साथ ही, यह एजेंटिक इस्तेमाल के उदाहरणों के लिए भी सबसे अच्छा है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.5-flash |
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट, इमेज, वीडियो, ऑडियो आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 65,536 |
की सुविधाएं | ऑडियो जनरेट करना काम नहीं करता है कैश मेमोरी में सेव होना काम करता है कोड चलाना काम करता है फ़ंक्शन कॉलिंग काम करता है इमेज जनरेट करना काम नहीं करता है Search पर भरोसेमंद स्रोतों से जानकारी पाना काम करता है स्ट्रक्चर्ड आउटपुट काम करता है सोचना काम करता है ट्यून करना काम नहीं करता है |
वर्शन |
|
का नया अपडेट | जून 2025 |
नॉलेज कट्सऑफ़ | जनवरी 2025 |
Gemini 2.5 Flash-Lite की झलक
Gemini 2.5 Flash मॉडल, कम लागत और कम इंतज़ार के लिए ऑप्टिमाइज़ किया गया है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.5-flash-lite-preview-06-17 |
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट, इमेज, वीडियो, और ऑडियो आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,000,000 आउटपुट टोकन की सीमा 64,000 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम करता है यूआरएल का कॉन्टेक्स्ट काम करता है Search पर भरोसेमंद स्रोतों से जानकारी पाना काम करता है इमेज जनरेट करना काम नहीं करता है ऑडियो जनरेट करना काम नहीं करता है लाइव एपीआई काम नहीं करता है सोचना काम करता है |
वर्शन |
|
का नया अपडेट | जून 2025 |
नॉलेज कट्सऑफ़ | जनवरी 2025 |
Gemini 2.5 Flash नेटिव ऑडियो
Live API के ज़रिए, हमारे नेटिव ऑडियो डायलॉग मॉडल, सोच-विचार के साथ और बिना सोच-विचार के उपलब्ध हैं. ये मॉडल, स्टाइल और कंट्रोल के लिए प्रॉम्प्ट के साथ, इंटरैक्टिव और बिना स्ट्रक्चर वाली बातचीत के अनुभव देते हैं.
Google AI Studio में नेटिव ऑडियो की सुविधा आज़माएं
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.5-flash-preview-native-audio-dialog औरmodels/gemini-2.5-flash-exp-native-audio-thinking-dialog |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, वीडियो, टेक्स्ट आउटपुट ऑडियो और टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,28,000 आउटपुट टोकन की सीमा 8,000 |
की सुविधाएं | ऑडियो जनरेट करना काम करता है कैश मेमोरी में सेव होना काम नहीं करता है कोड चलाना काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है इमेज जनरेट करना काम नहीं करता है Search पर भरोसेमंद स्रोतों से जानकारी पाना काम करता है स्ट्रक्चर्ड आउटपुट काम नहीं करता है सोचना काम करता है ट्यून करना काम नहीं करता है |
वर्शन |
|
का नया अपडेट | मई 2025 |
नॉलेज कट्सऑफ़ | जनवरी 2025 |
Gemini 2.5 Flash में लिखाई को बोली में बदलने की सुविधा का डेमो
Gemini 2.5 Flash Preview TTS, टेक्स्ट को बोली में बदलने वाला एक ऐसा मॉडल है जो कम कीमत में बेहतरीन परफ़ॉर्म करता है. यह मॉडल, व्यवस्थित वर्कफ़्लो के लिए ज़्यादा कंट्रोल और पारदर्शिता देता है. जैसे, पॉडकास्ट जनरेशन, ऑडियो बुक, ग्राहक सहायता वगैरह. Gemini 2.5 Flash की दर से जुड़ी सीमाएं ज़्यादा हैं, क्योंकि यह एक्सपेरिमेंट के तौर पर उपलब्ध/झलक वाला मॉडल है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.5-flash-preview-tts |
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट आउटपुट ऑडियो |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 8,000 आउटपुट टोकन की सीमा 16,000 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम नहीं करता है कैश मेमोरी में सेव होना काम नहीं करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम नहीं करता है कोड चलाना काम नहीं करता है खोजें काम नहीं करता है ऑडियो जनरेट करना काम करता है लाइव एपीआई काम नहीं करता है सोचना काम नहीं करता है |
वर्शन |
|
का नया अपडेट | मई 2025 |
Gemini 2.5 Pro में लिखाई को बोली में बदलने की सुविधा की झलक
Gemini 2.5 Pro Preview TTS, टेक्स्ट को बोली में बदलने वाला हमारा सबसे बेहतर मॉडल है. यह स्ट्रक्चर्ड वर्कफ़्लो के लिए ज़्यादा कंट्रोल और पारदर्शिता देता है. जैसे, पॉडकास्ट जनरेशन, ऑडियो बुक, ग्राहक सहायता वगैरह. Gemini 2.5 Pro की दर से जुड़ी सीमाएं ज़्यादा हैं, क्योंकि यह एक्सपेरिमेंट के तौर पर उपलब्ध/झलक वाला मॉडल है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.5-pro-preview-tts |
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट आउटपुट ऑडियो |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 8,000 आउटपुट टोकन की सीमा 16,000 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम नहीं करता है कैश मेमोरी में सेव होना काम नहीं करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम नहीं करता है कोड चलाना काम नहीं करता है खोजें काम नहीं करता है ऑडियो जनरेट करना काम करता है लाइव एपीआई काम नहीं करता है सोचना काम नहीं करता है |
वर्शन |
|
का नया अपडेट | मई 2025 |
Gemini 2.0 Flash
Gemini 2.0 Flash, अगली पीढ़ी की सुविधाओं और बेहतर सुविधाओं के साथ काम करता है. जैसे, बेहतर स्पीड, नेटिव टूल का इस्तेमाल, और 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.0-flash |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 8,192 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम करता है खोजें काम करता है इमेज जनरेट करना काम नहीं करता है ऑडियो जनरेट करना काम नहीं करता है लाइव एपीआई काम करता है सोचना एक्सपेरिमेंटल |
वर्शन |
|
का नया अपडेट | फ़रवरी 2025 |
नॉलेज कट्सऑफ़ | अगस्त 2024 |
Gemini 2.0 Flash की मदद से, झलक वाली इमेज जनरेट करना
Gemini 2.0 Flash की झलक वाली इमेज जनरेशन सुविधा, इमेज जनरेट करने की बेहतर सुविधाएं देती है. इनमें, बातचीत के दौरान इमेज जनरेट करना और उनमें बदलाव करना शामिल है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.0-flash-preview-image-generation |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट और इमेज |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 32,000 आउटपुट टोकन की सीमा 8,192 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम नहीं करता है कोड चलाना काम नहीं करता खोजें काम नहीं करता इमेज जनरेट करना काम करता है ऑडियो जनरेट करना काम नहीं करता है लाइव एपीआई काम नहीं करता सोचना काम नहीं करता |
वर्शन |
फ़िलहाल, यूरोप, मध्य पूर्व, और अफ़्रीका के कई देशों में gemini-2.0-flash-preview-image-generation का इस्तेमाल नहीं किया जा सकता |
का नया अपडेट | मई 2025 |
नॉलेज कट्सऑफ़ | अगस्त 2024 |
Gemini 2.0 Flash-Lite
Gemini 2.0 Flash मॉडल, जिसे कम लागत और कम इंतज़ार के लिए ऑप्टिमाइज़ किया गया है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.0-flash-lite |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 8,192 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम नहीं करता है खोजें काम नहीं करता है इमेज जनरेट करना काम नहीं करता है ऑडियो जनरेट करना काम नहीं करता है लाइव एपीआई काम नहीं करता है |
वर्शन |
|
का नया अपडेट | फ़रवरी 2025 |
नॉलेज कट्सऑफ़ | अगस्त 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash, अलग-अलग टास्क के लिए तेज़ और बेहतर मल्टीमॉडल मॉडल है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.5-flash |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की खास जानकारी | हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या 3,600 वीडियो की ज़्यादा से ज़्यादा अवधि 1 घंटा ऑडियो की ज़्यादा से ज़्यादा अवधि करीब 9.5 घंटे |
की सुविधाएं | सिस्टम से जुड़े निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम करता है सुरक्षा सेटिंग में बदलाव करना काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम करता है लाइव एपीआई काम नहीं करता है |
वर्शन |
|
का नया अपडेट | सितंबर 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B एक छोटा मॉडल है. इसे कम बुद्धि वाले टास्क के लिए डिज़ाइन किया गया है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.5-flash-8b |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की खास जानकारी | हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या 3,600 वीडियो की ज़्यादा से ज़्यादा अवधि 1 घंटा ऑडियो की ज़्यादा से ज़्यादा अवधि करीब 9.5 घंटे |
की सुविधाएं | सिस्टम से जुड़े निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम करता है सुरक्षा सेटिंग में बदलाव करना काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम करता है लाइव एपीआई काम नहीं करता है |
वर्शन |
|
का नया अपडेट | अक्टूबर 2024 |
Gemini 1.5 Pro
Gemini 2.5 Pro Preview आज़माएं. यह अब तक का सबसे ऐडवांस Gemini मॉडल है.
Gemini 1.5 Pro, एक मिड-साइज़ वाला मल्टीमोडल मॉडल है. इसे कई तरह के रिज़निंग टास्क के लिए ऑप्टिमाइज़ किया गया है. 1.5 Pro, एक साथ बहुत ज़्यादा डेटा प्रोसेस कर सकता है. जैसे, दो घंटे का वीडियो, 19 घंटे का ऑडियो,60, 000 लाइनों वाला कोडबेस या 2,000 पेजों का टेक्स्ट.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.5-pro |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 2,097,152 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की खास जानकारी | हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या 7,200 वीडियो की ज़्यादा से ज़्यादा अवधि 2 घंटे ऑडियो की ज़्यादा से ज़्यादा अवधि करीब 19 घंटे |
की सुविधाएं | सिस्टम से जुड़े निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम करता है सुरक्षा सेटिंग में बदलाव करना काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम करता है लाइव एपीआई काम नहीं करता है |
वर्शन |
|
का नया अपडेट | सितंबर 2024 |
Imagen 3
Imagen 3, टेक्स्ट से इमेज जनरेट करने वाला हमारा सबसे शानदार मॉडल है. यह हमारे पिछले मॉडल की तुलना में, बेहतर बारीकियों वाली, ज़्यादा रोशनी वाली, और ध्यान भटकाने वाले कम आर्टफ़ैक्ट वाली इमेज जनरेट कर सकता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | Gemini API
|
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट आउटपुट इमेज |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा लागू नहीं आउटपुट इमेज ज़्यादा से ज़्यादा चार |
का नया अपडेट | फ़रवरी 2025 |
Veo 2
Veo 2, टेक्स्ट और इमेज को वीडियो में बदलने वाला हमारा मॉडल है. यह अच्छी क्वालिटी के वीडियो जनरेट कर सकता है. साथ ही, आपके प्रॉम्प्ट में मौजूद बारीकियों को कला के साथ कैप्चर कर सकता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | Gemini API
|
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट, इमेज आउटपुट वीडियो |
की सीमाएं | टेक्स्ट इनपुट लागू नहीं इमेज इनपुट इमेज का कोई भी रिज़ॉल्यूशन और आसपेक्ट रेशियो. फ़ाइल का साइज़ 20 एमबी से ज़्यादा नहीं होना चाहिए आउटपुट वीडियो ज़्यादा से ज़्यादा दो |
का नया अपडेट | अप्रैल 2025 |
Gemini 2.5 Flash Live
Gemini 2.5 Flash Live मॉडल, Live API के साथ काम करता है. इससे Gemini के साथ कम इंतज़ार के साथ, दोनों तरफ़ से आवाज़ और वीडियो के ज़रिए इंटरैक्ट किया जा सकता है. यह मॉडल, टेक्स्ट, ऑडियो, और वीडियो इनपुट को प्रोसेस कर सकता है. साथ ही, यह टेक्स्ट और ऑडियो आउटपुट भी दे सकता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-live-2.5-flash-preview |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट और ऑडियो |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 8,192 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम करता है खोजें काम करता है इमेज जनरेट करना काम नहीं करता है ऑडियो जनरेट करना काम करता है सोचना काम नहीं करता है |
वर्शन |
|
का नया अपडेट | जून 2025 |
नॉलेज कट्सऑफ़ | जनवरी 2025 |
Gemini 2.0 Flash Live
Gemini 2.0 Flash Live मॉडल, Live API के साथ काम करता है. इससे Gemini के साथ कम इंतज़ार के साथ, दोनों तरफ़ से आवाज़ और वीडियो के ज़रिए इंटरैक्ट किया जा सकता है. यह मॉडल, टेक्स्ट, ऑडियो, और वीडियो इनपुट को प्रोसेस कर सकता है. साथ ही, यह टेक्स्ट और ऑडियो आउटपुट भी दे सकता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-2.0-flash-live-001 |
के साथ काम करने वाले डेटा टाइप | इनपुट ऑडियो, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट और ऑडियो |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 8,192 |
की सुविधाएं | स्ट्रक्चर्ड आउटपुट काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है कोड चलाना काम करता है खोजें काम करता है इमेज जनरेट करना काम नहीं करता है ऑडियो जनरेट करना काम करता है सोचना काम नहीं करता है |
वर्शन |
|
का नया अपडेट | अप्रैल 2025 |
नॉलेज कट्सऑफ़ | अगस्त 2024 |
Gemini को एम्बेड करने की सुविधा, एक्सपेरिमेंट के तौर पर उपलब्ध है
Gemini embedding
कोड, कई भाषाओं, और जानकारी वापस पाने जैसे कई अहम डाइमेंशन में बेहतरीन परफ़ॉर्मेंस मिलती है. Gemini में एम्बेड करने की दर की सीमाएं ज़्यादा सीमित हैं, क्योंकि यह एक्सपेरिमेंट के तौर पर शुरू किया गया मॉडल है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | Gemini API
|
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 8,192 आउटपुट डाइमेंशन का साइज़ इलास्टिक, इनमें से किसी एक साइज़ में काम करता है: 3072, 1536 या 768 |
का नया अपडेट | मार्च 2025 |
टेक्स्ट एम्बेड करना और एम्बेड करना
टेक्स्ट एम्बेड करना
एक्सपेरिमेंट के तौर पर उपलब्ध Gemini का नया एम्बेडिंग मॉडल आज़माएं. यह मॉडल, सबसे बेहतर परफ़ॉर्मेंस देता है.
टेक्स्ट एम्बेड का इस्तेमाल, स्ट्रिंग के बीच के संबंध को मेज़र करने के लिए किया जाता है. साथ ही, इनका इस्तेमाल कई एआई ऐप्लिकेशन में किया जाता है.
text-embedding-004
, स्टैंडर्ड MTEB एम्बेडिंग मानदंडों पर, तुलना किए जा सकने वाले डाइमेंशन के साथ बेहतर तरीके से जानकारी को वापस लाता है और मौजूदा मॉडल की तुलना में बेहतर परफ़ॉर्म करता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | Gemini API
|
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 2,048 आउटपुट डाइमेंशन का साइज़ 768 |
[**] | रेटिंग की सीमाएंहर मिनट 1,500 अनुरोध |
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है | काम नहीं करता है |
का नया अपडेट | अप्रैल 2024 |
एम्बेड करना
इनपुट टेक्स्ट के लिए, टेक्स्ट एम्बेड जनरेट करने के लिए, एम्बेड मॉडल का इस्तेमाल किया जा सकता है.
एम्बेडिंग मॉडल को 2,048 टोकन तक के टेक्स्ट के लिए, 768 डाइमेंशन वाले एम्बेड बनाने के लिए ऑप्टिमाइज़ किया गया है.
मॉडल की जानकारी एम्बेड करना
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/embedding-001 |
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 2,048 आउटपुट डाइमेंशन का साइज़ 768 |
[**] | रेटिंग की सीमाएंहर मिनट 1,500 अनुरोध |
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है | काम नहीं करता है |
का नया अपडेट | दिसंबर 2023 |
AQA
किसी दस्तावेज़, कॉर्पस या पैसेज के सेट पर, एट्रिब्यूट किए गए सवाल-जवाब (एक्यूए) से जुड़े टास्क करने के लिए, एक्यूए मॉडल का इस्तेमाल किया जा सकता है. AQA मॉडल, दिए गए सोर्स के आधार पर सवालों के जवाब देता है. साथ ही, जवाब मिलने की संभावना का अनुमान भी लगाता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/aqa |
के साथ काम करने वाले डेटा टाइप | इनपुट टेक्स्ट आउटपुट टेक्स्ट |
इस्तेमाल की जा सकने वाली भाषा | अंग्रेज़ी |
[*] | टोकन की सीमाएं इनपुट टोकन की सीमा 7,168 आउटपुट टोकन की सीमा 1,024 |
[**] | रेटिंग की सीमाएंहर मिनट 1,500 अनुरोध |
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है | काम करता है |
का नया अपडेट | दिसंबर 2023 |
मॉडल के इन वैरिएशन की सुविधाओं के बारे में जानने के लिए, उदाहरण देखें.
[*] Gemini मॉडल के लिए, एक टोकन चार वर्णों के बराबर होता है. 100 टोकन, अंग्रेज़ी के करीब 60 से 80 शब्दों के बराबर होते हैं.
मॉडल के वर्शन के नाम के पैटर्न
Gemini मॉडल, स्टैबल, झलक या एक्सपेरिमेंटल वर्शन में उपलब्ध हैं. अपने कोड में, मॉडल के नाम के इनमें से किसी एक फ़ॉर्मैट का इस्तेमाल करके यह तय किया जा सकता है कि आपको किस मॉडल और वर्शन का इस्तेमाल करना है.
सबसे नया स्टेबल वर्शन
यह किसी मॉडल के जनरेशन और वैरिएशन के लिए, रिलीज़ किए गए सबसे नए स्टेबल वर्शन की जानकारी देता है.
सबसे नए स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>
. उदाहरण के लिए, gemini-2.0-flash
.
स्थिर रुझान
किसी खास स्टेबल मॉडल की जानकारी देता है. आम तौर पर, स्टेबल मॉडल में बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.
स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>
. उदाहरण के लिए, gemini-2.0-flash-001
.
झलक देखें
यह ऐसे झलक मॉडल की जानकारी देता है जो शायद प्रोडक्शन के लिए सही न हो. साथ ही, इसमें बिलिंग की सुविधा चालू हो सकती है, लेकिन दर से जुड़ी पाबंदियां ज़्यादा हो सकती हैं.
झलक का वर्शन तय करने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>
. उदाहरण के लिए, gemini-2.5-pro-preview-06-05
.
एक्सपेरिमेंट के तौर पर उपलब्ध
यह किसी ऐसे एक्सपेरिमेंटल मॉडल की जानकारी देता है जो शायद प्रोडक्शन के लिए सही न हो और जिस पर किराये की ज़्यादा पाबंदियां लागू हों. हम एक्सपेरिमेंट के तौर पर मॉडल रिलीज़ करते हैं, ताकि हमें सुझाव/राय/शिकायत मिल सके और डेवलपर को हमारे नए अपडेट जल्द से जल्द मिल सकें.
एक्सपेरिमेंट के लिए बने वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>
. उदाहरण के लिए, gemini-2.0-pro-exp-02-05
.
एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल
Gemini API, स्टैबल मॉडल के अलावा एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल भी उपलब्ध कराता है. ये मॉडल, प्रोडक्शन के लिए सही नहीं हो सकते. साथ ही, इन पर दर से जुड़ी पाबंदियां ज़्यादा होती हैं.
हम एक्सपेरिमेंट के तौर पर मॉडल रिलीज़ करते हैं, ताकि हमें सुझाव/राय/शिकायत मिल सके. साथ ही, डेवलपर को हमारे नए अपडेट तुरंत मिल सकें और Google में हो रहे इनोवेशन की रफ़्तार को हाइलाइट किया जा सके. एक्सपेरिमेंट के तौर पर लॉन्च करने से, हमें यह जानकारी मिलती है कि इन्हें ज़्यादा से ज़्यादा लोगों के लिए कैसे उपलब्ध कराया जा सकता है. एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल को, बिना किसी सूचना के किसी दूसरे मॉडल से बदला जा सकता है. हम इस बात की गारंटी नहीं देते कि एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल, आने वाले समय में एक स्थिर मॉडल बन जाएगा.
एक्सपेरिमेंट के तौर पर उपलब्ध पिछले मॉडल
नए वर्शन या स्टेबल रिलीज़ उपलब्ध होने पर, हम एक्सपेरिमेंटल मॉडल हटा देते हैं और उन्हें बदल देते हैं. यहां दिए गए सेक्शन में, बदले गए वर्शन के साथ-साथ, एक्सपेरिमेंट के तौर पर रिलीज़ किए गए पिछले मॉडल देखे जा सकते हैं:
मॉडल कोड | बेस मॉडल | बदले जाने वाला वर्शन |
---|---|---|
gemini-2.5-flash-preview-04-17 | Gemini 2.5 Flash | gemini-2.5-flash-preview-05-20 |
gemini-2.0-flash-exp-image-generation | Gemini 2.0 Flash | gemini-2.0-flash-preview-image-generation |
gemini-2.5-pro-preview-05-06 | Gemini 2.5 Pro | gemini-2.5-pro-preview-06-05 |
gemini-2.5-pro-preview-03-25 | Gemini 2.5 Pro | gemini-2.5-pro-preview-05-06 |
gemini-2.0-flash-thinking-exp-01-21 | Gemini 2.5 Flash | gemini-2.5-flash-preview-04-17 |
gemini-2.0-pro-exp-02-05 | Gemini 2.0 Pro Experimental | gemini-2.5-pro-preview-03-25 |
gemini-2.0-flash-exp | Gemini 2.0 Flash | gemini-2.0-flash |
gemini-exp-1206 | Gemini 2.0 Pro | gemini-2.0-pro-exp-02-05 |
gemini-2.0-flash-thinking-exp-1219 | Gemini 2.0 Flash Thinking | gemini-2.0-flash-thinking-exp-01-21 |
gemini-exp-1121 | Gemini | gemini-exp-1206 |
gemini-exp-1114 | Gemini | gemini-exp-1206 |
gemini-1.5-pro-exp-0827 | Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-pro-exp-0801 | Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-flash-8b-exp-0924 | Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
gemini-1.5-flash-8b-exp-0827 | Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
इस्तेमाल की जा सकने वाली भाषाएं
Gemini मॉडल को इन भाषाओं के साथ काम करने के लिए ट्रेन किया गया है:
- ऐरेबिक (
ar
) - बांग्ला (
bn
) - बुल्गेरियन (
bg
) - चाइनीज़ सिंप्लिफ़ाइड और ट्रेडिशनल (
zh
) - क्रोएशियन (
hr
) - चेक (
cs
) - डेनिश (
da
) - डच (
nl
) - अंग्रेज़ी (
en
) - एस्टोनियन (
et
) - फ़िनिश (
fi
) - फ़्रेंच (
fr
) - जर्मन (
de
) - ग्रीक (
el
) - हिब्रू (
iw
) - हिन्दी (
hi
) - हंगेरियन (
hu
) - इंडोनेशियन (
id
) - इटैलियन (
it
) - जैपनीज़ (
ja
) - कोरियन (
ko
) - लैटवियन (
lv
) - लिथुएनियन (
lt
) - नॉर्वीजन (
no
) - पोलिश (
pl
) - पॉर्चुगीज़ (
pt
) - रोमेनियन (
ro
) - रशियन (
ru
) - सर्बियाई (
sr
) - स्लोवाक (
sk
) - स्लोवेनियन (
sl
) - स्पैनिश (
es
) - स्वाहिली (
sw
) - स्वीडिश (
sv
) - थाई (
th
) - तुर्किश (
tr
) - यूक्रेनियन (
uk
) - वियतनामीज़ (
vi
)