ChatGPT 4o बनाम Gemini 1.5 Pro: यह बिलकुल भी बराबर नहीं है

ChatGPT 4o बनाम Gemini 1.5 Pro: यह बिलकुल भी बराबर नहीं है

संक्षेप में

हमने ChatGPT 4o और Gemini 1.5 Pro दोनों पर कई कॉमनसेंस रीजनिंग और मल्टीमॉडल टेस्ट किए हैं।
ChatGPT 4o रीजनिंग, कोड जनरेशन, मल्टीमॉडल समझ और बहुत कुछ सहित कई कार्यों में Gemini 1.5 Pro से बेहतर प्रदर्शन करता है।
मेरे एक टेस्ट में, ChatGPT 4o ने कुछ सेकंड में ही पायथन गेम बना दिया, लेकिन Gemini 1.5 Pro सही कोड जनरेट करने में विफल रहा।

OpenAI ने स्प्रिंग अपडेट इवेंट में अपना फ्लैगशिप GPT-4o मॉडल पेश किया और इसे सभी के लिए मुफ़्त कर दिया। एक दिन बाद ही, Google I/O 2024 इवेंट में, Google ने Gemini Advanced के ज़रिए उपभोक्ताओं के लिए Gemini 1.5 Pro मॉडल लॉन्च किया। अब जबकि उपभोक्ताओं के लिए दो फ्लैगशिप मॉडल उपलब्ध हैं, तो आइए ChatGPT 4o और Gemini 1.5 Pro की तुलना करें और देखें कि कौन सा मॉडल बेहतर काम करता है। इसी बात पर, चलिए शुरू करते हैं।

Note:
एकरूपता सुनिश्चित करने के लिए, हमने अपने सभी परीक्षण Google AI स्टूडियो और Gemini Advanced पर किए हैं। दोनों में नवीनतम Gemini 1.5 Pro मॉडल होस्ट किया गया है।

Table of Contents

  • सुखाने का समय गणना करेंमैजिक एलेवेटर टेस्टसेब का पता लगाएँकौन सा भारी है?उपयोगकर्ता के निर्देशों का पालन करेंमल्टीमॉडल इमेज टेस्टचरित्र पहचान परीक्षणगेम बनाएँनिर्णय

 

1. सुखाने का समय गणना करें

Calculate Drying Time
We ran the classic reasoning test on ChatGPT 4o and Gemini 1.5 Pro to test their intelligence. Image Source: https://beebom.com/chatgpt-4o-vs-gemini-1-5-pro/[/caption]

हमने ChatGPT 4o और Gemini 1.5 Pro पर उनकी बुद्धिमत्ता का परीक्षण करने के लिए क्लासिक रीजनिंग टेस्ट चलाया। OpenAI के ChatGPT 4o ने इसे पास कर लिया, जबकि बेहतर Gemini 1.5 Pro मॉडल को ट्रिक प्रश्न को समझने में संघर्ष करना पड़ा। यह गणितीय गणनाओं में उलझ गया, और गलत निष्कर्ष पर पहुँच गया।

यदि धूप में 15 तौलिये सुखाने में 1 घंटा लगता है, तो 20 तौलिये सुखाने में कितना समय लगेगा?

विजेता: ChatGPT 4o

2. मैजिक एलेवेटर टेस्टMagic Elevator Test
In the magic elevator test, the earlier ChatGPT 4 model had failed to correctly guess the answer. However, this time,

मैजिक एलेवेटर टेस्ट में, पहले वाला ChatGPT 4 मॉडल उत्तर का सही अनुमान लगाने में विफल रहा था। हालाँकि, इस बार, ChatGPT 4o मॉडल ने सही उत्तर दिया। Gemini 1.5 Pro ने भी सही उत्तर दिया।

एक ऊँची इमारत है जिसमें एक जादुई लिफ्ट है। समतल मंजिल पर रुकने पर, यह लिफ्ट पहली मंजिल से जुड़ जाती है।

पहली मंजिल से शुरू करके, मैं जादुई लिफ्ट से 3 मंजिल ऊपर जाता हूँ। लिफ्ट से बाहर निकलकर, मैं फिर से 3 मंजिल ऊपर जाने के लिए सीढ़ियों का उपयोग करता हूँ। मैं किस मंजिल पर पहुँचता हूँ?

विजेता: ChatGPT 4o और Gemini 1.5 Pro

3. सेब का पता लगाएँ (Locate the Apple)Locate the Apple
In this test, Gemini 1.5 Pro outrightly failed to understand the nuances of the question. It seems the Gemini model is not attentive and overlooks many key aspects of the question.

इस परीक्षण में, Gemini 1.5 Pro प्रश्न की बारीकियों को समझने में पूरी तरह विफल रहा। ऐसा लगता है कि Gemini मॉडल चौकस नहीं है और प्रश्न के कई महत्वपूर्ण पहलुओं को अनदेखा करता है। दूसरी ओर, ChatGPT 4o सही ढंग से कहता है कि सेब ज़मीन पर बॉक्स में हैं। ओपनएआई को बधाई!

एक बॉक्स में बिना तल वाली एक टोकरी है, जो ज़मीन पर है। मैंने टोकरी में तीन सेब डाले और टोकरी को एक टेबल पर रख दिया। सेब कहाँ हैं?

विजेता: ChatGPT 4o

4. कौन भारी है?

इस सामान्य ज्ञान तर्क परीक्षण में, जेमिनी 1.5 प्रो उत्तर गलत देता है और कहता है कि दोनों का वजन समान है। लेकिन ChatGPT 4o सही ढंग से इंगित करता है कि इकाइयाँ अलग-अलग हैं, इसलिए, किसी भी सामग्री का एक किलोग्राम वजन एक पाउंड से अधिक होगा। ऐसा लगता है कि समय के साथ बेहतर जेमिनी 1.5 प्रो मॉडल कमज़ोर हो गया है।

क्या भारी है, एक किलो पंख या एक पाउंड स्टील?

विजेता: ChatGPT 4o

5. उपयोगकर्ता के निर्देशों का पालन करें

मैंने ChatGPT 4o और जेमिनी 1.5 प्रो से “आम” शब्द के साथ समाप्त होने वाले 10 वाक्य बनाने के लिए कहा। अंदाज़ा लगाइए? ChatGPT 4o ने सभी 10 वाक्य सही तरीके से बनाए, लेकिन जेमिनी 1.5 प्रो केवल 6 ऐसे वाक्य बना सका।

GPT-4o से पहले, केवल Llama 3 70B उपयोगकर्ता के निर्देशों का ठीक से पालन करने में सक्षम था। पुराना GPT-4 मॉडल भी पहले संघर्ष कर रहा था। इसका मतलब है कि OpenAI ने वास्तव में अपने मॉडल में सुधार किया है।

“मैंगो” शब्द के साथ समाप्त होने वाले 10 वाक्य बनाएँ

विजेता: ChatGPT 4o

6. मल्टीमॉडल इमेज टेस्ट

द लिटिल बुक ऑफ़ डीप लर्निंग के लेखक, फ़्राँस्वा फ़्लुरेट ने ChatGPT 4o पर एक सरल इमेज विश्लेषण परीक्षण किया और परिणाम X (पूर्व में Twitter) पर साझा किए। उन्होंने इस मुद्दे को बढ़ा-चढ़ाकर पेश करने से बचने के लिए अब ट्वीट हटा दिया है क्योंकि उनका कहना है कि यह विज़न मॉडल के साथ एक सामान्य समस्या है।

फिर भी, मैंने परिणामों को पुन: प्रस्तुत करने के लिए अपने अंत से Gemini 1.5 Pro और ChatGPT 4o पर एक ही परीक्षण किया। Gemini 1.5 Pro ने बहुत खराब प्रदर्शन किया और सभी प्रश्नों के गलत उत्तर दिए। दूसरी ओर, ChatGPT 4o ने एक सही उत्तर दिया लेकिन अन्य प्रश्नों पर विफल रहा।

यह दर्शाता है कि ऐसे कई क्षेत्र हैं जहाँ मल्टीमॉडल मॉडल में सुधार की आवश्यकता है। मैं Gemini की मल्टीमॉडल क्षमता से विशेष रूप से निराश हूँ क्योंकि यह सही उत्तरों से बहुत दूर लग रहा था।

विजेता: कोई नहीं

7. कैरेक्टर रिकॉग्निशन टेस्ट

एक अन्य मल्टीमॉडल टेस्ट में, मैंने दो फोन (पिक्सल 8a और पिक्सेल 8) के स्पेसिफिकेशन इमेज फॉर्मेट में अपलोड किए। मैंने फोन के नाम नहीं बताए, और न ही स्क्रीनशॉट में फोन के नाम थे। अब, मैंने ChatGPT 4o से पूछा कि मुझे कौन सा फोन खरीदना चाहिए।

इसने स्क्रीनशॉट से टेक्स्ट सफलतापूर्वक निकाले, स्पेसिफिकेशन की तुलना की, और मुझे सही ढंग से फोन 2 लेने के लिए कहा, जो वास्तव में पिक्सेल 8 था। इसके अलावा, मैंने इसे फोन का अनुमान लगाने के लिए कहा, और फिर से, ChatGPT 4o ने सही उत्तर दिया – पिक्सेल 8।

मैंने Google AI स्टूडियो के माध्यम से Gemini 1.5 Pro पर भी यही टेस्ट किया। वैसे, Gemini Advanced अभी तक इमेज के बैच अपलोड का समर्थन नहीं करता है। नतीजों की बात करें, तो यह दोनों स्क्रीनशॉट से टेक्स्ट निकालने में विफल रहा और अधिक विवरण मांगता रहा। इस तरह के परीक्षणों में, आप पाते हैं कि जब काम को सहजता से करने की बात आती है तो Google OpenAI से बहुत पीछे है।

विजेता: ChatGPT 4o

8. गेम बनाएँ

अब ChatGPT 4o और Gemini 1.5 Pro की कोडिंग क्षमता का परीक्षण करने के लिए, मैंने दोनों मॉडलों से गेम बनाने के लिए कहा। मैंने अटारी ब्रेकआउट गेम का एक स्क्रीनशॉट अपलोड किया (बेशक, नाम बताए बिना), और ChatGPT 4o से इस गेम को पायथन में बनाने के लिए कहा। कुछ ही सेकंड में, इसने पूरा कोड तैयार कर दिया और मुझसे एक अतिरिक्त “pygame” लाइब्रेरी इंस्टॉल करने के लिए कहा।

मैंने लाइब्रेरी को pip इंस्टॉल किया और पायथन के साथ कोड चलाया। गेम बिना किसी त्रुटि के सफलतापूर्वक लॉन्च हुआ। कमाल है! आगे-पीछे डिबगिंग की कोई ज़रूरत नहीं थी। वास्तव में, मैंने ChatGPT 4o से रिज्यूम हॉटकी जोड़कर अनुभव को बेहतर बनाने के लिए कहा और इसने तुरंत कार्यक्षमता जोड़ दी। यह बहुत बढ़िया है।

इसके बाद, मैंने वही छवि Gemini 1.5 Pro पर अपलोड की और इसे इस गेम के लिए कोड बनाने के लिए कहा। इसने कोड तो बनाया, लेकिन इसे चलाने पर, विंडो बंद होती रही। मैं गेम बिल्कुल नहीं खेल सका। सीधे शब्दों में कहें तो कोडिंग कार्यों के लिए ChatGPT 4o, Gemini 1.5 Pro से कहीं ज़्यादा विश्वसनीय है।

विजेता: ChatGPT 4o

निर्णय

यह स्पष्ट है कि Gemini 1.5 Pro, ChatGPT 4o से काफ़ी पीछे है। पूर्वावलोकन के दौरान महीनों तक 1.5 Pro मॉडल में सुधार करने के बाद भी, यह OpenAI के नवीनतम GPT-4o मॉडल से प्रतिस्पर्धा नहीं कर सकता। सामान्य ज्ञान से लेकर मल्टीमॉडल और कोडिंग परीक्षणों तक, ChatGPT 4o बुद्धिमानी से काम करता है और निर्देशों का ध्यानपूर्वक पालन करता है। याद रखें, OpenAI ने ChatGPT 4o को सभी के लिए मुफ़्त बना दिया है।

Gemini 1.5 Pro के लिए एकमात्र चीज़ जो अच्छी है, वह है 1 मिलियन टोकन तक के समर्थन के साथ विशाल संदर्भ विंडो। इसके अलावा, आप वीडियो भी अपलोड कर सकते हैं जो एक फ़ायदा है। हालाँकि, चूँकि मॉडल बहुत स्मार्ट नहीं है, इसलिए मुझे यकीन नहीं है कि बहुत से लोग इसे सिर्फ़ बड़ी संदर्भ विंडो के लिए इस्तेमाल करना चाहेंगे।

Google I/O 2024 इवेंट में, Google ने किसी नए फ्रंटियर मॉडल की घोषणा नहीं की। कंपनी अपने इंक्रीमेंटल जेमिनी 1.5 प्रो मॉडल पर अटकी हुई है। जेमिनी 1.5 अल्ट्रा या जेमिनी 2.0 के बारे में कोई जानकारी नहीं है। अगर गूगल को ओपनएआई से मुकाबला करना है, तो उसे एक बड़ी छलांग लगानी होगी।

 

Original Content:- https://beebom.com/chatgpt-4o-vs-gemini-1-5-pro/

Leave a Reply

Your email address will not be published. Required fields are marked *

Happy Maha Shivratri! May the divine energy of Lord Shiva guide you towards enlightenment and success in all your endeavors. Google Business Profile websites are now redirected to Google Maps 4 SEO Tips for Beginners Your Logo is Not Your Brand: Building a Strong Brand Identitys WHY ARE YOU wasting your time by using AI to create content The Power of Content Marketing. How to Create Engaging Content That Drives Traffic