ChatGPT V4 е на ниво, SATs и може да идентифицира експлойти в ETH договори

GPT-4, най-новата версия на чатбота за изкуствен интелект (AI), ChatGPT, може да издържа тестове в гимназията и изпити по право с резултати, класирани в 90-ия персентил, и има нови възможности за обработка, които не бяха възможни с предишната версия.

Цифрите от тестовите резултати на GPT-4 бяха споделени на 14 март от неговия създател OpenAI, разкривайки, че може също така да конвертира изображения, аудио и видео входове в текст в допълнение към обработката на „много по-нюансирани инструкции“ по-креативно и надеждно.

„Издържа симулиран адвокатски изпит с резултат около 10% от най-добрите участници в теста“, добави OpenAI. „За разлика от тях резултатът на GPT-3.5 беше около долните 10%.“

Цифрите показват, че GPT-4 е постигнал резултат от 163 в 88-ия процентил на изпита LSAT — тестът, който студентите трябва да издържат в Съединените щати, за да бъдат приети в юридическо училище.

*Резултати от изпити GPT-4 и GPT-3.5 на редица скорошни изпити в САЩ. източник:* *OpenAI*

Резултатът на GPT4 би го поставил в добра позиция за приемане в топ 20 на юридическите училища и е само с няколко точки по-малко от докладваните резултати, необходими за приемане в престижни училища като Харвард, Станфорд, Принстън или Йейл.

Предишната версия на ChatGPT отбеляза само 149 на LSAT, което я поставя в най-долните 40%.

GPT-4 също така отбеляза 298 от 400 точки на Единния адвокатски изпит – тест, извършен от наскоро завършили студенти по право, който им позволява да практикуват като адвокат във всяка юрисдикция на САЩ.

*Резултатите от UBE са необходими за допускане до практикуване на право във всяка юрисдикция на САЩ. източник:* *Национална конференция на адвокатските изпитващи*

Старата версия на ChatGPT се затрудни в този тест, завършвайки в долните 10% с резултат 213 от 400.

Що се отнася до изпитите SAT Evidence-Based Reading & Writing и SAT Math, взети от гимназисти в САЩ за измерване на готовността им за колеж, GPT-4 отбеляза съответно 93-ия и 89-ия процентил.

GPT-4 се отличи и в „твърдите“ науки, публикувайки доста над средните персентилни резултати в AP Biology (85-100%), Chemistry (71-88%) и Physics 2 (66-84%).

Въпреки това резултатът му от AP Calculus беше сравнително среден, класирайки се в 43-ия до 59-ия персентил.

Друга област, в която GPT-4 липсваше, бяха изпитите по английска литература, публикуващи резултати от 8-ия до 44-ия персентил на два отделни теста.

OpenAI каза, че GPT-4 и GPT-3.5 са взели тези тестове от практическите изпити 2022-2023 г. и че „не е взето специално обучение“ от инструментите за езикова обработка:

„Нямахме специално обучение за тези изпити. Малка част от проблемите на изпитите бяха забелязани от модела по време на обучението, но ние вярваме, че резултатите са представителни.“

Резултатите предизвикаха страх и в общността на Twitter.

Свързани: Как ChatGPT ще повлияе на пространството Web3? Отговорите на индустрията

Ник Алмънд, основателят на FactoryDAO каза неговите 14,300 14 последователи в Twitter на 4 март, че GPTXNUMX ще „изплаши хората“ и ще „срине“ глобалната образователна система.

Теорията за оценяване беше голяма част от живота ми в продължение на няколко години. Блъсках се за този ден преди много години. Буквално звучах като манивела по това време.
Но... всъщност това означава, че от този момент нататък всичко, освен наблюдението, е приключило.
— drnick ️² (@DrNickA) Март 14, 2023

Бившият директор на Coinbase, Конър Гроган, каза, че е вмъкнал интелигентен договор на Ethereum на живо в GPT-4 и незабавно посочи няколко „уязвимости в сигурността“ и очерта как може да се използва кодът:

Изхвърлих жив договор за Ethereum в GPT-4.
За миг той подчерта редица уязвимости в сигурността и посочи повърхностни области, където договорът може да бъде експлоатиран. След това провери конкретен начин, по който мога да използвам договора pic.twitter.com/its5puakUW
— Конър (@jconorgrogan) Март 14, 2023

По-ранни одити на интелигентни договори на ChatGPT установиха, че първата му версия също е способна да открива грешки в кода в разумна степен.

Роуън Чеунг, основателят на бюлетина за изкуствен интелект „The Rundown“, сподели видеоклип на GPT, който транскрибира ръчно нарисуван фалшив уебсайт на лист хартия в код.

Току-що гледах как GPT-4 превръща ръчно нарисувана скица във функционален уебсайт.
Това е лудост. pic.twitter.com/P5nSjrk7Wn
— Роуън Чунг (@rowancheung) Март 14, 2023