Tahlillarga ko‘ra, yangi sun’iy intellekt haqiqatan ham yolg‘on faktlarni kamroq ko‘rsatadi, ammo aniqlik bo‘yicha ortda qolmoqda.

OpenAI kompaniyasi ChatGPT-5 ni taqdim etib, uni gallyutsinatsiyalardan himoyasi yaxshilangan, eng tezkor, aqlli va ishonchli sun’iy intellekt deb atadi. Ammo aslida hali unday emasligi oydinlashmoqda.

Modellarning xatolar chastotasi bo‘yicha reytingini yurituvchi Vectara platformasi ma’lumotlariga ko‘ra, yangi sun’iy intellekt haqiqatan ham GPT-4 ga qaraganda yolg‘on faktlarni kamroq ko‘rsatadi (1,8 foizga nisbatan 1,4 foiz), ammo GPT-4o dan biroz oldinda (1,49 foiz).

Qizig‘i shundaki, ChatGPT-4.5 Preview yanada pastroq ko‘rsatkichga ega – 1,2 foiz, eng kam xato o3-mini High Reasoning modelida – 0,79 foiz.

Yaxshilanishlarga qaramay, GPT-5 hali ham aniqlik bo‘yicha 4.5 modelidan ortda qolmoqda, garchi u Gemini-2.5-pro (2,6 foiz) va Grok-4 (4,8 foiz) kabi raqobatchilardan ancha oldinda bo‘lsa ham.

GPT-5 ishga tushirilganida OpenAI Plus obunalaridan eski GPT-4, 4o va 4o-mini modellari ogohlantirishsiz olib tashlandi, bu esa mojaroga sabab bo‘ldi. Ko‘plab foydalanuvchilar an’anaviy funksiyalarni yo‘qotganidan shikoyat qildi, ba’zilari esa buni «yagona do‘stni yo‘qotish» deb baholadi.

Kompaniya rahbari Sem Altman eski versiyalarning auditoriya uchun ahamiyatini yetarlicha baholamaganini tan oldi va obunachilar uchun GPT-4o ni vaqtincha qaytarishga va’da berdi.