ઓપનએઆઈએ ગુરુવારે GPT-5.2 રજૂ કર્યું, જે પ્રોફેશનલ નોલેજ વર્ક માટે કંપનીની સૌથી સક્ષમ મોડેલ શ્રેણી છે.
Photo Credit: OpenAI
આ અપડેટ એન્ટરપ્રાઇઝમાં ChatGPT ને સતત ઉપયોગ કર્યા પછી રજૂ કરવામાં આવ્યું છે
ઓપનએઆઈએ ગુરુવારે GPT-5.2 રજૂ કર્યું, જે પ્રોફેશનલ નોલેજ વર્ક માટે કંપનીની સૌથી સક્ષમ મોડેલ શ્રેણી છે. આ અપડેટ એન્ટરપ્રાઇઝમાં ChatGPT ને સતત અપનાવ્યા પછી આવ્યું છે, જ્યાં સામાન્ય વપરાશકર્તાઓ દરરોજ 40-60 મિનિટ બચાવે છે અને મોટાભાગના વપરાશકર્તાઓ દર અઠવાડિયે 10 કલાક બચાવી શકે છે.
GPT-5.2 ઉત્પાદકતા પર આ અસરને મહત્તમ બનાવવા માટે રચાયેલ છે. તે અગાઉના મોડેલ કરતાં વધુ ઝડપી, સ્માર્ટ અને ચોકસાઈ દર્શાવશે. આ મોડેલ સ્પ્રેડશીટ્સ બનાવવા, પ્રેઝન્ટેશન બનાવવા, કોડ લખવા, ઇમેજને સમજવા, લાંબા દસ્તાવેજોને હેન્ડલ કરવા, ટૂલ્સનો ઉપયોગ કરવા અને જટિલ મલ્ટી-સ્ટેપ વર્કફ્લોનું સંચાલન કરવાની કામગીરીમાં સુધારો કરે છે. આ પ્રકાશન NVIDIA અને Microsoft ના સહયોગથી વિકસાવવામાં આવ્યું હતું, જેમાં H100, H200 અને GB200-NVL72 GPU દ્વારા સંચાલિત Azure ડેટા સેન્ટરનો ઉપયોગ કરવામાં આવ્યો હતો. GPT-5.2 આવવાથી AI ની સ્પીડ બમણી થઈ જશે
યુઝર્સને ત્રણેય GPT-5.2 એક્સપીરિયન્સમાં વધુ સંરચિત અને સુસંગત વર્તનનો અનુભવ થવો જોઈએ:
GPT-5.2 ઇન્સ્ટન્ટ: માહિતી શોધવી, ટેકનિકલ લેખન, અનુવાદ અને સ્ટેપ બાય સ્ટેપ માર્ગદર્શનમાં સુધારા સાથે ઝડપથી રિસ્પોન્સ.
GPT-5.2 થિંકિંગ: કોડિંગ, લાંબા ડોક્યુમેન્ટનો સારાંશ, મેથ અને લોજિક અને મળતી સ્ટેજ ધરાવતા કાર્યોને સારીરીતે કરવા બનાવાયું છે.
GPT-5.2 પ્રો: જટિલ પ્રશ્નો માટે રચાયેલ છે જ્યાં વધુ સારા તર્ક લાંબા પ્રતિભાવ સમય માટે યોગ્ય છે.
ઓપનએઆઈ વપરાશકર્તાઓને મહત્વપૂર્ણ કાર્યો માટે આઉટપુટને બે વાર તપાસવાનું યાદ અપાવે છે.
GPT-5.2 GDPval સહિત અનેક મૂલ્યાંકનોમાં નવા અત્યાધુનિક પરિણામો સ્થાપિત કરે છે, જ્યાં તે 44 વ્યવસાયોમાં સારીરીતે બતાવેલા નોલેજ ટાસ્કમાં ઉદ્યોગ વ્યાવસાયિકોને પાછળ છોડી આગળ નીકળી ગયું છે.
નોશન, બોક્સ, શોપાઇફ, હાર્વે અને ઝૂમ જેવા ભાગીદારોએ મજબૂત લોંગ હોરિઝોન રીઝનીંગ અને ટૂલ-કોલિંગ પ્રદર્શનનો અહેવાલ આપ્યો. ડેટાબ્રિક્સ, હેક્સ અને ટ્રિપલ વ્હેલે એજન્ટ-સંચાલિત ડેટા સાયન્સ અને દસ્તાવેજ વિશ્લેષણમાં સુધારા નોંધ્યા. કોગ્નિશન, વાર્પ, ચાર્લી લેબ્સ, જેટબ્રેન્સ અને ઓગમેન્ટ કોડે ઉચ્ચ એજન્ટિક કોડિંગ પ્રદર્શનનું અવલોકન કર્યું.
GPT-5.2 થિંકિંગે GDPval પર OpenAI નું અત્યાર સુધીનું સર્વોચ્ચ પ્રદર્શન હાંસલ કર્યું છે, જે હ્યુમન એક્સપર્ટ સાથે મેળ ખાતું અથવા તેનાથી વધુ પ્રદર્શન કરતું કંપનીનું પ્રથમ મોડેલ બન્યું છે. તે 70.9% સરખામણીમાં ટોચના વ્યાવસાયિકોને સમકક્ષ અથવા તેનાથી આગળ નીકળી જાય છે. ઐતિહાસિક મેટ્રિક્સના આધારે, મોડેલે GDPval આઉટપુટ 11x કરતા વધુ ઝડપી અને નિષ્ણાત વ્યાવસાયિકોના ખર્ચના 1% કરતા ઓછા સમયમાં આપ્યું છે.
GDPval મૂલ્યાંકનકારે એક આઉટપુટને "આઉટપુટ ગુણવત્તામાં નોંધપાત્ર છલાંગ... સ્ટાફ ધરાવતી વ્યાવસાયિક કંપની દ્વારા કરવામાં આવે છે" તરીકે વર્ણવ્યું હતું, જ્યારે નાની ભૂલો રહી ગઈ હોવાનું નોંધ્યું હતું.
જુનિયર ઇન્વેસ્ટમેન્ટ-બેંકિંગ મોડેલિંગ કાર્યો માટે ઓપનએઆઈના આંતરિક બેન્ચમાર્ક પર - જેમ કે ત્રણ-સ્ટેટમેન્ટ મોડેલ બનાવવા અથવા લીવરેજ્ડ બાયઆઉટ મોડેલ બનાવવા - મોડેલનો સરેરાશ સ્કોર 59.1% થી વધીને 68.4% થયો, જે GPT-5.1 કરતાં 9.3% નો સુધારો છે.
GPT-5.2 થિંકિંગે SWE-Bench Pro પર 55.6% નો નવો ઉચ્ચ સ્કોર સેટ કર્યો છે, જે ચાર પ્રોગ્રામિંગ ભાષાઓમાં વાસ્તવિક દુનિયાના એન્જિનિયરિંગ કાર્યોનું મૂલ્યાંકન કરે છે. SWE-Bench વેરિફાઇડ બેન્ચમાર્ક પર, તે 80% પ્રાપ્ત કરે છે, જે OpenAI તરફથી અત્યાર સુધીનો સૌથી વધુ છે.
આ મોડેલ ડિબગીંગ, ફીચર અમલીકરણ, કોડ રિફેક્ટરિંગ અને એન્ડ-ટુ-એન્ડ ફિક્સમાં વધુ મજબૂત પ્રદર્શન દર્શાવે છે. શરૂઆતના પરીક્ષકોએ જટિલ UI કાર્ય અને 3D ઇન્ટરફેસ કાર્યો સહિત ફ્રન્ટ-એન્ડ ડેવલપમેન્ટમાં પણ વધુ સારા પરિણામો દર્શાવ્યા હતા.
GPT-5.2 થિંકિંગ, ઓળખ ન કરાયેલ ChatGPT ક્વેરીઝના આધારે, GPT-5.1 થિંકિંગની તુલનામાં ભ્રામકતા દર 30% ઘટાડે છે. આ સંશોધન, લેખન, વિશ્લેષણ અને નિર્ણય સપોર્ટ માટે વિશ્વસનીયતામાં સુધારો કરે છે.
લોંગ કોન્ટેકસ્ટ રિઝનિંગ
GPT-5.2 થિંકિંગ MRCRv2 પર નવા અત્યાધુનિક પરિણામો પ્રદાન કરે છે, જે લાંબા દસ્તાવેજોમાં માહિતીને એકીકૃત કરવાની મોડેલની ક્ષમતાનું પરીક્ષણ કરવા માટે રચાયેલ છે.
તે 256k ટોકન્સ સુધીના 4-નીડલ MRCR કાર્ય પર લગભગ સંપૂર્ણ ચોકસાઈ સુધી પહોંચે છે, જે રિપોર્ટ્સ, કરારો, સંશોધન પત્રો, ટ્રાન્સક્રિપ્ટ્સ અને મલ્ટી-ફાઇલ પ્રોજેક્ટ્સ સાથે સંકળાયેલા વર્કફ્લો માટે સુસંગતતા અને ચોકસાઈમાં સુધારો કરે છે.
આ મોડેલ OpenAI ના નવા પ્રતિભાવો/કોમ્પેક્ટ એન્ડપોઇન્ટને પણ સપોર્ટ કરે છે, જે ટૂલ-હેવી અને લાંબા સમયથી ચાલતા કાર્યો માટે અસરકારક સંદર્ભને વિસ્તૃત કરે છે.
GPT-5.2 થિંકિંગ અગાઉના મોડેલોની તુલનામાં ચાર્ટ રિઝનિંગ અને સોફ્ટવેર-ઇન્ટરફેસ સમજણ પર ભૂલ દરને અડધો કરે છે. તે છબીઓમાં અવકાશી સંબંધો અને તત્વ સ્થિતિની સુધારેલી જાગૃતિ દર્શાવે છે, જે ડેશબોર્ડ્સ, આકૃતિઓ, ઉત્પાદન સ્ક્રીનશોટ અને તકનીકી દ્રશ્યોનું વધુ સચોટ અર્થઘટન સક્ષમ કરે છે.
OpenAI નોંધે છે કે ઓછી-ગુણવત્તાવાળી ઇમેજ પર બાઉન્ડિંગ-બોક્સ પરીક્ષણોમાં, GPT-5.2 એ GPT-5.1 કરતાં વધુ સારા અવકાશી જૂથ સાથે વધુ ઘટકોને યોગ્ય રીતે ઓળખ્યા, જોકે બંને મોડેલોએ હજુ પણ ભૂલો કરી છે.
GPT-5.2 થિંકિંગ Tau2-બેન્ચ ટેલિકોમ પર 98.7% સુધી પહોંચે છે, જે લાંબા, મલ્ટી-ટર્ન ટૂલ-ઉપયોગ વર્કફ્લોમાં વધુ મજબૂત વિશ્વસનીયતા દર્શાવે છે. તે reasoning.effort='none' સાથે પણ નોંધપાત્ર રીતે વધુ સારું પ્રદર્શન કરે છે, જે લેટન્સી-સંવેદનશીલ ઉપયોગના કેસોમાં સુધારો કરે છે.
ગ્રાહક-સહાય જેવા મલ્ટિ-એજન્ટ સેટઅપ્સમાં, GPT-5.2 એ સંપૂર્ણ વર્કફ્લોનું સંકલન કર્યું - જેમાં રિબુકિંગ, સ્પેશિયલ-સહાય બેઠક અને વળતરનો સમાવેશ થાય છે - જ્યાં GPT-5.1 એ આંશિક પરિણામો આપ્યા.
GPT-5.2 Pro અને GPT-5.2 Thinking એ OpenAI ના અત્યાર સુધીના સૌથી મજબૂત વૈજ્ઞાનિક મોડેલ તરીકે સ્થાન મેળવ્યું છે.
GPQA ડાયમંડ: GPT-5.2 Pro એ 93.2% સ્કોર કર્યો છે, જેમાં GPT-5.2 Thinking એ 92.4% સ્કોર કર્યો છે.
FrontierMath (ટાયર 1–3): GPT-5.2 Thinking એ 40.3% નિષ્ણાત-સ્તરની સમસ્યાઓનું નિરાકરણ લાવે છે, જે એક નવી સ્થિતિ સ્થાપિત કરે છે.
GPT-5.2 Pro એ ARC-AGI-1 (ચકાસાયેલ) પર 90% ને વટાવી જનાર પ્રથમ મોડેલ છે, જે ગયા વર્ષના o3-પૂર્વાવલોકન સ્કોર 87% થી સુધર્યું છે જ્યારે તે કામગીરી પ્રાપ્ત કરવાની કિંમત લગભગ 390× ઘટાડે છે.
ARC-AGI-2 (ચકાસાયેલ) પર, GPT-5.2 વિચારસરણી 52.9% પ્રાપ્ત કરે છે, જ્યારે GPT-5.2 Pro 54.2% સુધી પહોંચે છે, જે મજબૂત મલ્ટીસ્ટેપ રીઝનિંગ અને અમૂર્ત સમસ્યા-નિરાકરણ દર્શાવે છે.
GPT-5.2, GPT-5 સાથે રજૂ કરાયેલા સલામતી સુધારાઓ પર આધારિત છે, જે સ્વ-નુકસાન, માનસિક-સ્વાસ્થ્ય તકલીફ અને AI પર ભાવનાત્મક વધુ પડતી નિર્ભરતા ધરાવતી સંવેદનશીલ વાતચીતોમાં વધુ વિશ્વસનીય પ્રતિભાવોને લક્ષ્ય બનાવે છે. GPT-5.2 ઇન્સ્ટન્ટ અને થિંકિંગ બંને GPT-5.1 મોડેલો કરતાં ઓછા અનિચ્છનીય આઉટપુટ દર્શાવે છે.
ઓપનએઆઈ 18 વર્ષથી ઓછી ઉંમરના વપરાશકર્તાઓ માટે કન્ટેન્ટ સુરક્ષા આપમેળે લાગુ કરવા માટે એજ પ્રિડિક્શન મોડેલ પણ રજૂ કરી રહ્યું છે, જે હાલની પેરેંટલ-કંટ્રોલ સિસ્ટમ્સની સાથે છે. કંપની સલામતી અને વિશ્વસનીયતામાં સુધારો કરવાનું ચાલુ રાખતી હોવાથી વધુ પડતા ઇનકાર જેવા મુદ્દાઓ પર ચાલી રહેલા કાર્યની નોંધ લે છે.
GPT-5.2 (ઇન્સ્ટન્ટ, થિંકિંગ અને પ્રો) આજે ચેટજીપીટીમાં પ્લસ, પ્રો, ગો, બિઝનેસ અને એન્ટરપ્રાઇઝ વપરાશકર્તાઓ માટે રોલઆઉટ કરવાનું શરૂ કરાયું છે. GPT-5.1 પેઇડ વપરાશકર્તાઓ માટે લેગસી મોડેલ હેઠળ ત્રણ મહિના સુધી ઉપલબ્ધ રહેશે.
GPT-5.2 Pro અને થિંકિંગ હવે નવા xhigh reasoning-effort સ્તરને સપોર્ટ કરે છે. સ્પ્રેડશીટ અને પ્રેઝન્ટેશન ટૂલ્સને પ્લસ, પ્રો, બિઝનેસ અથવા એન્ટરપ્રાઇઝ પ્લાન પર GPT-5.2 થિંકિંગ અથવા પ્રોની જરૂર છે.
GPT-5.2: પ્રતિ 1 મિલિયન ઇનપુટ ટોકન માટે $1.75; પ્રતિ 1 મિલિયન આઉટપુટ ટોકન માટે $14
OpenAI કહે છે કે GPT-5.2 ની ઊંચી પ્રતિ-ટોકન કિંમત મલ્ટિ-એજન્ટ મૂલ્યાંકન પર વધુ ટોકન કાર્યક્ષમતા દ્વારા સરભર કરવામાં આવે છે. API માં GPT-5.1, GPT-5, અથવા GPT-4.1 માટે હાલમાં કોઈ ડેપ્રિકેશન યોજનાઓ નથી. કોડેક્સ-ઓપ્ટિમાઇઝ્ડ GPT-5.2 વેરિઅન્ટ ટૂંક સમયમાં અપેક્ષિત છે.
જાહેરાત
જાહેરાત
Astronomers Observe Star’s Wobbling Orbit, Confirming Einstein’s Frame-Dragging
Chandra’s New X-Ray Mapping Exposes the Invisible Engines Powering Galaxy Clusters