ЦхатГПТ В4 надмашује стандарде, САТ-ове и може да идентификује експлоатације у ЕТХ уговорима

ГПТ-4, најновија верзија робота за ћаскање са вештачком интелигенцијом (АИ), ЦхатГПТ, може да положи средњошколске тестове и испите на правним факултетима са резултатима рангираним у 90. перцентилу и има нове могућности обраде које нису биле могуће са претходном верзијом.

Бројке из тестних резултата ГПТ-4 поделио је 14. марта његов креатор ОпенАИ откривајући да он такође може да конвертује слике, аудио и видео уносе у текст поред тога што креативније и поузданије рукује „много нијансиранијим упутствима“.

„Полаже симулирани правосудни испит са резултатом око 10% најбољих испитаника,“ додао је ОпенАИ. „Насупрот томе, резултат ГПТ-3.5 је био око доњих 10%.“

Бројке показују да је ГПТ-4 постигао резултат од 163 у 88. перцентилу на ЛСАТ испиту — студенти теста које треба да положе у Сједињеним Државама да би били примљени на правни факултет.

*Резултати испита ГПТ-4 и ГПТ-3.5 на низу недавних испита у САД. Извор:* *ОпенАИ*

Резултат ГПТ4 би га ставио у добру позицију да буде примљен у 20 најбољих правних факултета и само је неколико марака мање од пријављених резултата потребних за пријем у престижне школе као што су Харвард, Станфорд, Принцетон или Иале.

Претходна верзија ЦхатГПТ-а имала је само 149 поена на ЛСАТ-у, што га ставља у доњих 40%.

ГПТ-4 је такође постигао 298 од 400 на Униформ правосудном испиту — тесту који су урадили недавно дипломирани студенти права који им омогућава да раде као адвокати у било којој јурисдикцији САД.

*УБЕ бодови су морали бити примљени да се баве адвокатуром у свакој америчкој јурисдикцији. Извор:* *Национална конференција правосудних испитивача*

Стара верзија ЦхатГПТ-а имала је проблеме у овом тесту, завршивши у доњих 10% са оценом 213 од 400.

Што се тиче САТ испита из читања и писања заснованог на доказима и САТ испита из математике које су полагали средњошколци у САД да би измерили своју спремност за факултет, ГПТ-4 је постигао резултат у 93. односно 89. перцентилу.

ГПТ-4 је такође бриљирао у „тврдим“ наукама, дајући знатно изнад просечних процената у АП биологији (85-100%), хемији (71-88%) и физици 2 (66-84%).

Међутим, његов АП рачун је био прилично просечан, рангирајући се од 43 до 59 процената.

Још једна област у којој је недостајао ГПТ-4 је испит из енглеске књижевности, објављивање резултата у 8. до 44. перцентилу на два одвојена теста.

ОпенАИ је рекао да су ГПТ-4 и ГПТ-3.5 полагали ове тестове са практичних испита 2022-2023, и да алати за обраду језика нису полагали никакву посебну обуку:

„Нисмо имали посебну обуку за ове испите. Мањи број проблема на испитима модел је уочио током обуке, али верујемо да су резултати репрезентативни.”

Резултати су изазвали страх и у Твитер заједници.

Релатед: Како ће ЦхатГПТ утицати на Веб3 простор? Одговори индустрије

Ник Алмонд, оснивач ФацториДАО Рекао његових 14,300 пратилаца на Твитеру 14. марта да ће ГПТ4 „уплашити људе“ и да ће „урушити“ глобални образовни систем.

Теорија процене је била велики део мог живота неколико година. Размишљао сам о овом дану који ће доћи пре много година. У то време сам буквално звучао као становник.
Али... то заиста значи да је све осим будне процене завршено од ове тачке.
— дрницк ² (@ДрНицкА) Март КСНУМКС, КСНУМКС

Бивши директор Цоинбасе-а, Цонор Гроган, рекао је да је уметнуо живи Етхереум паметни уговор у ГПТ-4 и одмах указао на неколико „сигурносних слабости“ и навео како се код може искористити:

Убацио сам живи Етхереум уговор у ГПТ-4.
У тренутку је истакла бројне безбедносне пропусте и указала на површине на којима би се уговор могао искористити. Затим је потврдио конкретан начин на који могу да искористим уговор пиц.твиттер.цом/итс5пуакУВ
— Конор (@јцоноргроган) Март КСНУМКС, КСНУМКС

Раније ревизије паметних уговора на ЦхатГПТ-у откриле су да је његова прва верзија такође била способна да открије грешке кода у разумној мери.

Рован Цхеунг, оснивач АИ билтена „Тхе Рундовн“, поделио је видео ГПТ који преписује ручно нацртану лажну веб страницу на комаду папира у код.

Управо сам гледао како ГПТ-4 претвара ручно нацртану скицу у функционалну веб страницу.
Ово је лудо. пиц.твиттер.цом/П5нСјрк7Вн
— Рован Цхеунг (@рованцхеунг) Март КСНУМКС, КСНУМКС