ГПТ-4, најновија верзија робота за ћаскање са вештачком интелигенцијом (АИ), ЦхатГПТ, може да положи средњошколске тестове и испите на правним факултетима са резултатима рангираним у 90. перцентилу и има нове могућности обраде које нису биле могуће са претходном верзијом.
Бројке из тестних резултата ГПТ-4 поделио је 14. марта његов креатор ОпенАИ откривајући да он такође може да конвертује слике, аудио и видео уносе у текст поред тога што креативније и поузданије рукује „много нијансиранијим упутствима“.
„Полаже симулирани правосудни испит са резултатом око 10% најбољих испитаника,“ додао је ОпенАИ. „Насупрот томе, резултат ГПТ-3.5 је био око доњих 10%.“
Бројке показују да је ГПТ-4 постигао резултат од 163 у 88. перцентилу на ЛСАТ испиту — студенти теста које треба да положе у Сједињеним Државама да би били примљени на правни факултет.
Резултат ГПТ4 би га ставио у добру позицију да буде примљен у 20 најбољих правних факултета и само је неколико марака мање од пријављених резултата потребних за пријем у престижне школе као што су Харвард, Станфорд, Принцетон или Иале.
Претходна верзија ЦхатГПТ-а имала је само 149 поена на ЛСАТ-у, што га ставља у доњих 40%.
ГПТ-4 је такође постигао 298 од 400 на Униформ правосудном испиту — тесту који су урадили недавно дипломирани студенти права који им омогућава да раде као адвокати у било којој јурисдикцији САД.
Стара верзија ЦхатГПТ-а имала је проблеме у овом тесту, завршивши у доњих 10% са оценом 213 од 400.
Што се тиче САТ испита из читања и писања заснованог на доказима и САТ испита из математике које су полагали средњошколци у САД да би измерили своју спремност за факултет, ГПТ-4 је постигао резултат у 93. односно 89. перцентилу.
ГПТ-4 је такође бриљирао у „тврдим“ наукама, дајући знатно изнад просечних процената у АП биологији (85-100%), хемији (71-88%) и физици 2 (66-84%).
Међутим, његов АП рачун је био прилично просечан, рангирајући се од 43 до 59 процената.
Још једна област у којој је недостајао ГПТ-4 је испит из енглеске књижевности, објављивање резултата у 8. до 44. перцентилу на два одвојена теста.
ОпенАИ је рекао да су ГПТ-4 и ГПТ-3.5 полагали ове тестове са практичних испита 2022-2023, и да алати за обраду језика нису полагали никакву посебну обуку:
„Нисмо имали посебну обуку за ове испите. Мањи број проблема на испитима модел је уочио током обуке, али верујемо да су резултати репрезентативни.”
Резултати су изазвали страх и у Твитер заједници.
Релатед: Како ће ЦхатГПТ утицати на Веб3 простор? Одговори индустрије
Ник Алмонд, оснивач ФацториДАО Рекао његових 14,300 пратилаца на Твитеру 14. марта да ће ГПТ4 „уплашити људе“ и да ће „урушити“ глобални образовни систем.
Теорија процене је била велики део мог живота неколико година. Размишљао сам о овом дану који ће доћи пре много година. У то време сам буквално звучао као становник.
Али... то заиста значи да је све осим будне процене завршено од ове тачке.
— дрницк ² (@ДрНицкА) Март КСНУМКС, КСНУМКС
Бивши директор Цоинбасе-а, Цонор Гроган, рекао је да је уметнуо живи Етхереум паметни уговор у ГПТ-4 и одмах указао на неколико „сигурносних слабости“ и навео како се код може искористити:
Убацио сам живи Етхереум уговор у ГПТ-4.
У тренутку је истакла бројне безбедносне пропусте и указала на површине на којима би се уговор могао искористити. Затим је потврдио конкретан начин на који могу да искористим уговор пиц.твиттер.цом/итс5пуакУВ
— Конор (@јцоноргроган) Март КСНУМКС, КСНУМКС
Раније ревизије паметних уговора на ЦхатГПТ-у откриле су да је његова прва верзија такође била способна да открије грешке кода у разумној мери.
Рован Цхеунг, оснивач АИ билтена „Тхе Рундовн“, поделио је видео ГПТ који преписује ручно нацртану лажну веб страницу на комаду папира у код.
Управо сам гледао како ГПТ-4 претвара ручно нацртану скицу у функционалну веб страницу.
Ово је лудо. пиц.твиттер.цом/П5нСјрк7Вн
— Рован Цхеунг (@рованцхеунг) Март КСНУМКС, КСНУМКС
Извор: хттпс://цоинтелеграпх.цом/невс/цхатгпт-в4-ацес-тхе-бар-сатс-анд-цан-идентифи-екплоитс-ин-етх-цонтрацтс