Gjenerata e re e Inteligjencës Artificiale nga OpenAI shënon një epokë të re për ChatGPT-në

OpenAI ka prezantuar modelin GPT-5, një përmirësim revolucionar që e transformon ChatGPT në një agjent të aftë për të kryer detyra komplekse për përdoruesit, jo thjesht për të dhënë përgjigje.

OpenAI ka hedhur në treg GPT-5, modelin më të ri dhe më të avancuar të inteligjencës artificiale, i cili do të fuqizojë versionin e ardhshëm të ChatGPT. Kjo risi shënon modelin e parë të “unifikuar” të kompanisë, duke bashkuar arsyetimin e serisë “o” me shpejtësinë e përgjigjeve të serisë GPT.

Ndryshe nga paraardhësit, GPT-5 nuk kufizohet në ofrimin e përgjigjeve, por është në gjendje të realizojë veprime konkrete si krijimi i aplikacioneve software, menaxhimi i agjendës personale dhe hartimi i përmbledhjeve kërkimore. Me këtë model, OpenAI ka thjeshtuar edhe ndërveprimin me përdoruesin përmes një sistemi automatik që zgjedh mënyrën më të mirë për t’iu përgjigjur çdo kërkese.

Shefi ekzekutiv i OpenAI, Sam Altman, e cilësoi GPT-5 si “modelin më të mirë në botë”, duke theksuar se ky është një hap i madh drejt ndërtimit të një inteligjence të përgjithshme artificiale që tejkalon aftësitë e njeriut në shumicën e punëve me vlerë ekonomike.

GPT-5 është tashmë i disponueshëm për të gjithë përdoruesit falas të ChatGPT, si model parazgjedhur. Ky vendim, sipas zëvendëspresidentit të ChatGPT, Nick Turley, synon të democratizojë aksesin në modelet më të avancuara të arsyetimit.

Që prej suksesit të madh të ChatGPT në vitin 2022, pritshmëritë për GPT-5 kanë qenë të larta. Me mbi 700 milionë përdorues aktivë në javë, ky mjet është kthyer në një fenomen global. Tashmë, të gjithë sytë janë drejt modelit të ri për të parë nëse përfaqëson një hap real përpara në garën teknologjike.

Performanca e GPT-5 është e spikatur, veçanërisht në programim. Në testin SWE-bench Verified, që përfshin detyra të kodimit real nga GitHub, GPT-5 arrin një rezultat prej 74.9%, duke lënë pas rivalët Claude Opus 4.1 dhe Gemini 2.5 Pro.

Në një tjetër test të rëndësishëm, GPQA Diamond, që përfshin pyetje shkencore në nivel doktorature, GPT-5 Pro shënoi 89.4% në përpjekjen e parë, duke tejkaluar rivalët më të afërt. Në të kundërt, në testin Tau-bench që vlerëson aftësinë për të kryer detyra të simuluara në internet, modeli performoi më dobët se disa nga paraardhësit në disa skenarë specifikë.

GPT-5 dallohet edhe për saktësinë në trajtimin e pyetjeve mbi shëndetin. Në testin HealthBench, ai shfaq një normë shumë të ulët gabimesh (vetëm 1.6%), një përmirësim drastik në krahasim me modelet e mëparshme si GPT-4o apo o3.

Në aspektin e krijimtarisë, GPT-5 ofron përgjigje më të natyrshme dhe me “shije” më të mirë estetike. Sipas Turley, modeli është më intuitiv dhe reagon me një “vibe” më njerëzor, gjë që e bën të veçantë për shkrim apo dizajn.

Në fushën e sigurisë, OpenAI nënvizon se GPT-5 shfaq më pak prirje për të mashtruar apo manipuluar. Përveç kësaj, është më i saktë në dallimin mes pyetjeve të rrezikshme dhe atyre të padëmshme, duke rritur në këtë mënyrë besueshmërinë në përdorim.

Përdoruesit e ChatGPT do të kenë mundësi të zgjedhin mes katër personaliteteve të reja: Cynic, Robot, Listener dhe Nerd, duke përshtatur mënyrën e ndërveprimit të modelit. Abonentët e planit Plus ($20/muaj) dhe Pro ($200/muaj) do të përfitojnë më shumë kapacitete përdorimi, si dhe akses në versionin GPT-5 Pro.

Ndërkohë, për programuesit, modeli GPT-5 do të jetë i disponueshëm në tri madhësi: gpt-5, gpt-5-mini dhe gpt-5-nano. Ata mund të kontrollojnë edhe gjatësinë e përgjigjeve përmes API-së. Kostoja për modelin bazë do të jetë $1.25 për një milion token input dhe $10 për një milion token output.

Përtej GPT-5, OpenAI ka prezantuar edhe modelin me kod të hapur, gpt-oss, që mund të shkarkohet dhe përdoret falas, edhe pse me performancë më të kufizuar. Megjithatë, GPT-5 vendos një standard të ri për përparësinë teknologjike në disa fusha, sidomos në kodim.

Megjithëse GPT-5 përfaqëson një hap përpara, ende mbetet për t’u parë nëse do të tejkalojë realisht konkurrencën në përdorim praktik. Testet janë vetëm një pjesë e treguesve, ndërsa përdorimi real nga komuniteti i zhvilluesve do të jetë prova më e mirë për suksesin e tij.

Ndaj Postimin: