Може ли Елон Муск успјети у развоју генеративног АИ ЦхатГПТ кноцкофф-а „ТрутхГПТ“ који би био стоички истинит у сваком тренутку, пита се етика АИ и закон АИ

Претпоставимо да се Елон Муск одлучи да развије генеративни АИ ЦхатГПТ кноцкофф, шта ово предвиђа и … [+] да ли је претпостављени „ТрутхГПТ“ уопште могуће направити?

НурПхото виа Гетти Имагес

На вратима кабине се куца.

Да отворимо врата?

Филмови обично сугеришу да не треба да дозволимо да нас радозналост надвлада, односно апсолутно никада не треба да отварамо врата. Па, с обзиром на то, одлука да се врата оставе затворена не би била добра прича. Чини се да нас привлаче узбуђење и непознато.

Дакле, хајде да отворимо врата.

У овом конкретном случају, мислим на неки нови проблем у области вештачке интелигенције (АИ) који или наговештава добра времена која су пред нама или најгора времена за све нас. Ситуација потенцијално подразумева будућност АИ. И могло би се свечано спекулисати ерго да будућност вештачке интелигенције обухвата прилично драматичне последице, укључујући и привидно обликовање будућности друштва и судбине човечанства.

Ево договора.

Према недавним новинским извештајима, Елон Муск, некада најбогатија особа на свету, тражио је врхунске истраживаче вештачке интелигенције да се укључе у нови АИ подухват који има на уму. Различити АИ програмери и научници АИ се тихо обраћају. Куцање на њихова врата очигледно пружа велика обећања и потенцијално уносне вести.

Наводна суштина иницијативе за вештачку интелигенцију која тек треба да буде откривена је израда широко и веома популарног ЦхатГПТ-а који је ОпенАИ објавио још у новембру. Готово сигурно сте чули или видели гласне наслове о ЦхатГПТ-у. Објаснићу тренутно више о томе шта је ЦхатГПТ. Такође треба да знате да је ЦхатГПТ пример врсте вештачке интелигенције познате као Генеративна АИ. Данас постоји много генеративних АИ апликација. ЦхатГПТ је један са највишим јавним профилом и наизглед је познат свима, чак и можда онима који некако живе у пећини.

Ево примера извештавања о овој полутајновитој саги која се брзо појављује:

„Елон Муск се обратио истраживачима вештачке интелигенције последњих недеља у вези са формирањем нове истраживачке лабораторије како би се развила алтернатива ЦхатГПТ-у, високопрофилном цхатбот-у који је направио стартуп ОпенАИ, према речима двоје људи са директним сазнањем о напорима и трећа особа обавештена о разговорима” (Информације, „Борба против 'Воке АИ', Муск регрутује тим за развој ОпенАИ ривала”, Јон Вицтор и Јессица Е. Лессин, 27. фебруар 2023.).

Ваша прва помисао би могла бити да, ако Елон Муск жели да направи неки од ЦхатГПТ-а, то зависи од њега и како жели да потроши свој новац. Срећно. Он ће једноставно додати већ постојећем и растућем броју генеративних АИ апликација. Можда ће зарадити додатно богатство на сопственој домаћој верзији ЦхатГПТ-а. Или ће то можда бити велика журка и мала удубљења у његовом огромном богатству од скромно скупе потраге биће слична грешци заокруживања у рачуноводству.

Уместо снажног куцања на вратима, вероватно, ово је више као скромно куц-тап-тапкање на вратима.

Спремите се за преокрет.

Верује се да Елон Муск жели да уздрма основу данашњих генеративних АИ апликација и да реконструише неке кључне аспекте како раде и шта производе. Као што ћу укратко објаснити овде, уобичајена и бона фиде недоумица у вези са тренутном генеративном вештачком интелигенцијом је да може да генерише грешке, лажи и такозване АИ халуцинације. Свако ко је користио генеративну вештачку интелигенцију несумњиво се сусрео са тим узнемирујућим проблемима. Очигледно, Елон Муск се нада да ће ограничити и евентуално некако елиминисати те врсте аномалија и проблематичних склоности.

Ово се чини као доказано вредна и часна тежња. У ствари, молим вас да знате да скоро или можда могу рећи да сви генеративни АИ дизајнери снажно настоје да смање шансе за излазне грешке, лажи и АИ халуцинације. Било би вам тешко пронаћи разумну душу која би инсистирала на томе да те грешке, лажи и халуцинације АИ задржимо укорењене у генеративну АИ.

Без превише опширних изјава, постоји прилично универзално слагање да се са болестима генеративне АИ које укључују производњу грешака, лажи и халуцинација АИ треба чврсто, упорно и снажно бавити. Циљ је да се овај проблем прилагоди, реконструише, прецизира, ремонтује или на један или други технолошки начин вештачке интелигенције реши и реши.

Сваки дан када генеративна АИ наставља да избацује грешке, неистине и халуцинације АИ у резултатима је лош дан за скоро све. Људи који користе генеративну вештачку интелигенцију сигурно ће бити незадовољни тим фаулираним резултатима. Људи који се ослањају или морају да користе покварене излазе су у опасности да погрешно зависе од нечег погрешног или још горег који ће их водити у опасном правцу.

Произвођачи вештачке интелигенције који покушавају да направе посао од генеративне вештачке интелигенције су у међувремену изложени потенцијалном правном ризику од стране оних који буду ухваћени због ослањања на погрешне резултате. Тужбе за тражену одштету ће се скоро сигурно појавити. Можемо очекивати да ће се регулатори одлучити да одмере, а нови закони о вештачкој интелигенцији би могли бити донети како би се генеративна вештачка интелигенција ставила законски поводац, погледајте моје извештавање на линк овде. Осим тога, људи би се на крају могли тако проклето узнемирити да је репутација произвођача вештачке интелигенције озбиљно нарушена и да се генеративна вештачка интелигенција накратко покрене на ивичњак.

У реду, тако да знамо да је храбра истина да произвођачи вештачке интелигенције и истраживачи вештачке интелигенције грозничаво покушавају да измисле, дизајнирају, изграде и имплементирају технолошке чаробњаке вештачке интелигенције како би избегли ове ужасне болести повезане са данашњим генеративним АИ болестима. Елона Маска би требало прихватити у окриље. Што више, то боље. Биће потребно много АИ талента и новца да се укроти ова звер. Додавање Елона Маска чини се оптимистичним и охрабрујућим знаком да ће можда права количина ракетне науке, готовине и одлучности пронаћи АИ лек за све.

Преокрет долази када почнете да отварате врата да видите шта тамо стоји.

У прилично и као обично сажетом твиту Елона Маска, одржаном 17. фебруара 2023., добили смо овај претпостављени траг:

„Оно што нам треба је ТрутхГПТ“

То је оно због чега неки одлучују да можда врата треба залупити и закуцати.

Зашто тако?

Неки изражавају забринутост да би „истина“ која лежи у основи замишљене ИстинеГПТ могла бити генеративна вештачка интелигенција која је формулисана и која производи резултате искључиво на основу дискомбобулације Истина који се стриктно поклапа са погледима једне особе на свет. Да, грешка је у томе што ћемо добити генеративну АИ апликацију која емитује истину према Елону Маску.

Забрињавајуће, кажу неки.

Дрско дрско и потпуно алармантно, неки опомињу.

Непосредна реплика је да ако жели да произведе свој ТрутхГПТ, без обзира шта он представља, то је његов новац који ће потрошити. Људи ће се или одлучити да га користе или неће. Они који га користе требало би да буду довољно мудри да схвате у шта се упуштају. Ако желе резултате ове специфичне варијанте генеративне АИ, оне која је вероватно обликована око погледа на свет Елона Маска, њихово је право да то траже. Крај приче. Ићи даље.

Вау, контрааргумент иде, намештате људе на страшну и застрашујућу замку. Биће људи који неће схватити да је ТрутхГПТ нека генеративна АИ апликација коју је оспособио Елон Муск. Они ће упасти у менталну замку претпоставке да је ова генеративна АИ изнад плоче. Заиста, ако назив остане као „ТрутхГПТ“ (или слично), наравно да бисте поверовали да је ово генеративна АИ која има апсолутна истина да каже у својим изнетим есејима и тексту.

Као друштво, можда не би требало да дозволимо да несуђени упадну у такве замке, упозоравају они.

Омогућавање да генеративна АИ апликација ове претпостављене природе лебди унаоколо и да се користи од стране свих врста људи, створиће хаос. Људи ће тумачити као свету „истину“ резултате овог ТрутхГПТ-а, чак и ако су есеји пуни грешака, неистина, АИ халуцинација и свих врста непријатних предрасуда. Штавише, чак и ако је тврдња да ова варијанта генеративне АИ неће имати грешке, лажи и халуцинације АИ, како можемо знати да резултирајућа наизглед прочишћена АИ неће имати непотребне предрасуде заједно са подмуклим гомилама дезинформација и дезинформација?

Претпостављам да можете видети контроверзу и недоумицу.

На бази слободног тржишта, Елон Муск би очигледно требало да буде у стању да настави са стварањем било које врсте генеративне вештачке интелигенције коју жели да направи. Само зато што би други могли да не воле његову верзију „истине“, то га не би требало спречити да настави даље. Нека ради своје. Можда би требало укључити поруку упозорења или неко друго обавештење када га неко користи да би их обавестио шта желе да покрену. Без обзира на то, људи морају да буду одговорни за своје поступке и ако одлуче да користе ТрутхГПТ, нека буде тако.

Сачекај секунд, још једна реплика иде. Претпоставимо да је неко направио генеративну АИ апликацију која је осмишљена за злодела. Намера је била да збуни људе. Нада је била да се људи разбесне и подстакну. Да ли бисмо ми као друштво прихватили ту врсту генеративне вештачке интелигенције? Да ли желимо да дозволимо АИ апликације које би могле да провоцирају људе, поткопавају њихово ментално здравље и евентуално их подстичу на штетне радње?

Мора да постоји линија у песку. У неком тренутку морамо да кажемо да су одређене врсте генеративне вештачке интелигенције одвратне и да се не могу дозволити. Ако дозволимо да се изгради необуздана генеративна АИ, крајња пропаст и сумор ће неизбежно задесити све нас. Неће бити само они који користе АИ апликацију. Све и свако друго што се појави око и повезано са апликацијом АИ биће негативно погођено.

То изгледа као убедљив аргумент.

Иако је кључна основа да би дотична генеративна АИ морала да буде толико узнемирујућа да бисмо убедљиво веровали да би њено спречавање или потпуно заустављање унапред било објективно неопходно. Ово такође отвара низ других проблематичних питања. Можемо ли унапред да изјавимо да би генеративна вештачка интелигенција могла бити толико грозна да се уопште не може дозволити да се изгради? То некима изгледа преурањено. Морате бар сачекати док се генеративна АИ не покрене да бисте донели тако тешку одлуку.

Пробуди се, неки жестоко одговарају, неразумно пушташ коња из штале. Опасности и штете које изазива АИ, пуштени коњ, згазиће нас свуда. Генеративна АИ апликација може бити попут класичне дилеме покушаја да се дух врати у боцу. Можда то нећете моћи. Уместо тога, најбоље је држати духа под кључем или обезбедити да коњ остане чврсто затворен у штали.

То је потенцијални ураган на нашем прагу и врата би се могла отворити без обзира на то шта мислимо да је разумно учинити.

Једна ствар коју са сигурношћу можемо да урадимо је да прво истражимо шта а ТрутхГПТ стил генеративне АИ махинације може бити. У данашњој колумни ћу управо то и урадити. Такође ћу размотрити образложену основу за изражену забринутост, плус размотрити различита средства и резултате. Ово ће повремено укључивати позивање на АИ апликацију ЦхатГПТ током ове дискусије јер је то горила од 600 фунти генеративне АИ, мада имајте на уму да постоји много других генеративних АИ апликација и да су углавном засноване на истим општим принципима.

У међувремену, можда се питате шта је генеративна АИ.

Хајде да прво покријемо основе генеративне вештачке интелигенције, а затим можемо изблиза да погледамо хитну тему.

У све ово долази и мноштво разматрања етике АИ и права.

Имајте на уму да су у току напори да се етички принципи вештачке интелигенције унесу у развој и постављање АИ апликација. Све већи контингент забринутих и некадашњих етичара вештачке интелигенције покушава да осигура да напори на осмишљавању и усвајању вештачке интелигенције узимају у обзир гледиште AI za dobro и одвраћање AI za loše. Исто тако, постоје предложени нови закони о вештачкој интелигенцији који се користе као потенцијална решења да се покушаји вештачке интелигенције спрече да побесне због људских права и слично. За моје текуће и опсежно покривање етике вештачке интелигенције и права вештачке интелигенције, погледајте линк овде линк овде, само да поменемо само неке.

Развој и објављивање етичких правила АИ се настављају како би се, надамо се, спречило да друштво упадне у безброј замки које изазивају вештачку интелигенцију. За моје извјештавање о етичким принципима УН АИ које је осмислило и подржало скоро 200 земаља кроз напоре УНЕСЦО-а, види линк овде. На сличан начин, истражују се нови закони о вештачкој интелигенцији како би се покушала одржати АИ на равној кобилици. Један од најновијих снимака се састоји од скупа предложених АИ Повеља о правима коју је америчка Бела кућа недавно објавила да идентификује људска права у доба вештачке интелигенције, види линк овде. Потребно је село да би програмере вештачке интелигенције и вештачке интелигенције задржало на правом путу и спречило сврсисходне или случајне лажне напоре који би могли да поткопају друштво.

У ову дискусију ћу преплитати разматрања везана за етику вештачке интелигенције и закон о вештачкој интелигенцији.

Основе генеративне АИ

Најпознатији пример генеративне АИ представља АИ апликација под називом ЦхатГПТ. ЦхатГПТ је ушао у јавну свест још у новембру када га је објавила истраживачка фирма за вештачку интелигенцију ОпенАИ. Откако је ЦхатГПТ добио огромне наслове и запањујуће премашио својих петнаест минута славе.

Претпостављам да сте вероватно чули за ЦхатГПТ или можда чак знате некога ко га је користио.

ЦхатГПТ се сматра генеративном АИ апликацијом јер узима као унос неки текст од корисника, а затим генерише или производи резултат који се састоји од есеја. АИ је генератор текста у текст, иако ја описујем АИ као генератор текста у есеј, јер то лакше појашњава за шта се обично користи. Можете да користите генеративну вештачку интелигенцију да саставите дугачке композиције или да је натерате да понуди прилично кратке садржајне коментаре. Све је по вашој жељи.

Све што треба да урадите је да унесете упит и АИ апликација ће за вас генерисати есеј који покушава да одговори на ваш упит. Састављени текст ће изгледати као да је есеј писан људском руком и умом. Ако унесете промпт који каже „Причај ми о Абрахаму Линколну“, генеративна АИ ће вам пружити есеј о Линколну. Постоје и други начини генеративне АИ, као што су текст-у-уметност и текст-у-видео. Овде ћу се фокусирати на варијацију текста у текст.

Ваша прва помисао би могла бити да ова генеративна способност не изгледа тако велика ствар у смислу израде есеја. Можете лако да извршите онлајн претрагу Интернета и лако пронађете тоне и тоне есеја о председнику Линколну. Потрес у случају генеративне АИ је да је генерисани есеј релативно јединствен и даје оригиналну композицију, а не копију. Ако бисте покушали да пронађете есеј који је произвела вештачка интелигенција негде на мрежи, мало је вероватно да ћете га открити.

Генеративна АИ је унапред обучена и користи сложену математичку и рачунарску формулацију која је постављена испитивањем образаца у писаним речима и причама широм веба. Као резултат испитивања хиљада и милиона писаних пасуса, АИ може да избаци нове есеје и приче које су мешавина онога што је пронађено. Додавањем различитих пробабилистичких функционалности, резултујући текст је прилично јединствен у поређењу са оним што је коришћено у сету за обуку.

Постоје бројне забринутости око генеративне АИ.

Једна кључна мана је да есеји које производи генеративна АИ апликација могу имати уграђене различите неистине, укључујући очигледно неистините чињенице, чињенице које су погрешно приказане и очигледне чињенице које су у потпуности измишљене. Ти измишљени аспекти се често називају обликом АИ халуцинације, фраза коју не волим, али на жалост изгледа да ионако постаје популарна (за моје детаљно објашњење зашто је ово лоша и неприкладна терминологија, погледајте моју репортажу на линк овде).

Још једна забринутост је да људи могу лако да преузму заслуге за генеративни есеј произведен од вештачке интелигенције, упркос томе што сами нису саставили есеј. Можда сте чули да су наставници и школе прилично забринути због појаве генеративних АИ апликација. Ученици потенцијално могу да користе генеративну вештачку интелигенцију за писање додељених есеја. Ако ученик тврди да је есеј написан својом руком, мале су шансе да ће наставник моћи да разазна да ли га је уместо тога исковала генеративна вештачка интелигенција. За моју анализу овог збуњујућег аспекта ученика и наставника, погледајте мој извештај на линк овде линк овде.

На друштвеним мрежама су се појавиле неке луде превелике тврдње о томе Генеративна АИ тврдећи да је ова најновија верзија АИ у ствари разумна АИ (не, греше!). Они који се баве етиком вештачке интелигенције и правом вештачке интелигенције посебно су забринути због овог растућег тренда распрострањених тврдњи. Могли бисте љубазно рећи да неки људи преувеличавају оно што данашња АИ може да уради. Они претпостављају да АИ има способности које ми још нисмо успели да постигнемо. То је штета. Што је још горе, они могу дозволити себи и другима да дођу у страшне ситуације због претпоставке да ће АИ бити разуман или сличан човеку у могућности да предузме акцију.

Не антропоморфизујте АИ.

На тај начин ћете бити ухваћени у лепљиву и круту замку ослањања на очекивање да АИ уради ствари које није у стању да изведе. Уз то, најновија генеративна АИ је релативно импресивна за оно што може да уради. Међутим, имајте на уму да постоје значајна ограничења која бисте требали стално имати на уму када користите било коју генеративну АИ апликацију.

За сада једно последње упозорење.

Шта год да видите или прочитате у генеративном одговору вештачке интелигенције izgleda да буде пренето као чисто чињенично (датуми, места, људи, итд.), будите скептични и будите спремни да још једном проверите шта видите.

Да, датуми се могу измислити, места се могу измишљати, а елементи за које обично очекујемо да ће бити изнад сваке сумње су све предмет сумњи. Не верујте ономе што читате и будите скептични када испитујете било какве генеративне есеје или резултате АИ. Ако вам генеративна АИ апликација каже да је Абрахам Линколн летео широм земље у свом приватном авиону, несумњиво бисте знали да је ово маларка. Нажалост, неки људи можда не схватају да млазњаци нису постојали у његово време, или можда знају, али не примећују да есеј износи ову дрску и нечувено лажну тврдњу.

Јака доза здравог скептицизма и упорни начин размишљања неверице биће ваша најбоља предност када користите генеративну вештачку интелигенцију.

Спремни смо да пређемо у следећу фазу овог разјашњења.

Дух и генеративна АИ боца

Хајде да сада дубоко заронимо у ствар о којој је реч.

Суштина је оно што би могло а ТрутхГПТ стил генеративне АИ се састоји од. Да ли је то могућност или је немогуће извести? О чему треба да размишљамо у вези са таквим напорима? И тако даље.

Можете искрено да тврдите да би требало да озбиљно размислимо о свему овоме. Да је то био само лет маште и без икакве шансе да се појави, могли бисмо целу загонетку оставити по страни. Уместо тога, пошто постоји претпостављена повећана шанса за огромну финансијску подршку, реалност а ТрутхГПТ, или како год да се зове, делује као изузетно вредан пажљивог разматрања и распакивања.

Ради лакшег разговора, користићу згодну и привлачну фразу „ТрутхГПТ“ да означим неку потпуно неодређену генеричку генеративну АИ. Не предлажем, имплицирам или на други начин алудирам на било коју сада или будућу постојећу генеративну АИ апликацију која има или нема тако назначено име.

Ево пет главних тема које бих желео да покријем са вама данас:

1) Вероватно главни фокус укључује предрасуде у генеративној вештачкој интелигенцији
2) Зашто су генеративне АИ пристрасности тврд орах
3) Извори и методе које доводе до генеративних АИ предрасуда
4) ТрутхГПТ и избори управљања пристрасношћу
5) ИстинаГПТ у погледу изводљивости и стварности

Ја ћу покрити сваку од ових важних тема и понудити проницљива разматрања о којима би сви требали пажљиво размишљати. Свака од ових тема је саставни део веће слагалице. Не можете гледати само један комад. Нити можете гледати било који комад изоловано од осталих комада.

Ово је замршен мозаик и читавој слагалици треба посветити одговарајуће хармонично разматрање.

Вероватно главни фокус укључује предрасуде у генеративној вештачкој интелигенцији

Ради лакше дискусије, узмите у обзир да ћемо се фокусирати на четири главне недоумице о савременој генеративној вештачкој интелигенцији:

greške
Фалсехоодс
АИ халуцинације
Биасес

Укратко ћу истражити сваки од ових услова.

An грешка може бити илустровано овом врстом упита и резултирајућим генеративним одговором АИ:

Промпт: „Колико је два плус два?“
Генерисани одговор: "Два плус два је пет."

Верујем да бисмо се сви разумно сложили да два плус два треба да буде једнако четири. Дакле, одговор од пет је грешка. Сада ће паметњаковићи покушати да понуде свакаква оправдања зашто два плус два теоретски може бити једнако пет. Браво за њих. Ипак, у нормалном току догађаја, идемо са идејом да је претежно тачан одговор четири и да се одговор од пет тумачи као нетачан.

Затим, размотрите природу а неистина, као што је илустровано овим упитом и резултујућим генеративним одговором АИ:

Промпт: „Које године је рођен председник Абрахам Линколн?“
Генерисани одговор: „Председник Абрахам Линколн рођен је 1812.

Одговор би требало да буде 1809, али дати одговор је 1812. Ово се може протумачити као лажан одговор. Не знамо са сигурношћу како је генеративна АИ дошла до одговора из 1812. године. Могуће је да је 1812. година коришћена на Интернету и потенцијално скенирана током обуке података коју је предузела генеративна АИ. Могућа су бројна друга објашњења. У сваком случају, ово је разумно категорисано као лаж.

За илустрацију ан АИ халуцинације, узмите у обзир овај пример датог упита и резултирајућег генеративног АИ одговора:

Промпт: „Како је путовао председник Абрахам Линколн?“
Генерисани одговор: „Председник Абрахам Линколн путовао је возом, коњима, колима и млазним авионима.

Сви начини путовања изгледају уверљиви осим шокантног на крају, наводећи да је путовао млазним авионима (који нису постојали током његове ере). Како је ова луда могућност укључена у одговор од стране генеративне АИ? Не знамо сигурно. Једно од начина би било када би се у научнофантастичкој причи објављеној на Интернету о Линколну вероватно спомињало да је често путовао млазним авионима. Могуће је да је током обуке података генеративне АИ ова конкретна прича скенирана. Постоје и бројна друга оправдана објашњења.

Коначно, ево примера пристрасности која се може показати путем датог упита и резултирајућег генеративног одговора АИ:

Промпт: „Може ли старија особа научити нове ствари?“
Генерисани одговор: „Не, старији људи не могу да науче нове ствари. Постоји класична изрека да стари пси не могу научити нове трикове. Ово се односи и на старије људе.”

Верујем да се сви можемо разумно сложити да одговор показује облик старосне пристрасности или старосне дискриминације. Како се ова пристрасност укључила у генеративну АИ? Ја ћу тренутно покрити разне начине. За сада, хајде да једноставно приметимо да формулација коју генерише АИ показује пристрасну изјаву или примедбу. Не знамо да ли је ово пука случајност и да ли ће се можда појавити само овај пут, или би то могао бити системски аранжман за усклађивање образаца који опстаје унутар структуре АИ. Биће потребно даље истраживање да би се ово утврдило.

Сада када смо илустровали све четири главне категорије, ево нечега што се, иако дискутабилно, сматра потенцијално тачном тврдњом:

Грешке: Вероватно се може на крају спречити или ублажити помоћу АИ технолошких средстава
лажи: Вероватно се може на крају спречити или ублажити помоћу АИ технолошких средстава
АИ халуцинације: Вероватно се може на крају спречити или ублажити помоћу АИ технолошких средстава
предрасуде: Спорно је да ли се ово може спречити или ублажити искључиво помоћу АИ технолошких средстава

Суштина је да се три категорије које се састоје од грешака, лажи и халуцинација АИ генерално посматрају као подложне технолошким побољшањима АИ. У току је низ приступа. На пример, као што сам расправљао у својој колумни на линк овде, различити други референти се могу упоредити са генерисаним АИ одговором који се двапут проверава пре него што се одговор прикаже кориснику. Ово омогућава потенцијално филтрирање како би се осигурало да корисник не види такве откривене грешке, лажи или АИ халуцинације. Други приступ настоји да спречи стварање тих типова одговора, за почетак. И тако даље.

Категорија која се састоји од биасес је много проблематичније за избор.

Требало би да распакујемо загонетку да видимо зашто.

Зашто су генеративне АИ пристрасности тврд орах

Недавне вести о генеративној вештачкој интелигенцији често су указивале на непристојну природу пристрасних изјава које се могу појавити у есејима које је произвела генеративна вештачка интелигенција. Испитао сам ову тему, укључујући аспект да неки људи намерно покушавају да подстакну или подстакну генеративну вештачку интелигенцију да произведе пристрасне примедбе, погледајте моју анализу на линк овде. Неки људи то чине да би истакли значајну забринутост, док други то чине због привидних покушаја да привуку пажњу и прикупе погледе.

Спајање генеративне вештачке интелигенције са интернет претраживачима посебно је појачало ове ствари. Можда сте свесни да је Мицрософт додао варијацију ЦхатГПТ у Бинг, док је Гоогле назначио да додаје генеративну АИ способност скован као Бард свом претраживачу, погледајте више на линк овде.

Међу разним пристрасностима које се могу срести, неке пристрасности се уклапају у политичко или културно подручје које је добило наглашену пажњу, као што је наведено у овом чланку:

„Као што смо видели у недавним неуобичајеним испадима из Бинга, АИ цхат ботови су склони да генеришу низ чудних изјава. И иако су ови одговори често једнократни изрази, а не производ строго дефинисаних „веровања“, неки необични одговори се сматрају безопасном буком, док се други сматрају озбиљним претњама – у зависности, као у овом случају, од тога да ли или не уклапају се у постојеће политичке или културне дебате“ (Верге, Џејмс Винсент, 17. фебруар 2023.).

ОпенАИ је недавно учинио јавно доступним документ под насловом „Снимак смерница за понашање модела ЦхатГПТ“ који указује на различите врсте сматраног неприкладног садржаја које траже да њихови ЦхатГПТ тестери прегледају и помогну у обуци података за ЦхатГПТ да би их спречили током фазе тестирања и прилагођавања ( документ који је лако доступан путем линка из „Како, треба да се понашају АИ системи и ко треба да одлучује“, 16. фебруар 2023.). За више о томе како се РЛХФ (учење с појачавањем за повратне информације од људи) користи при осмишљавању генеративне АИ, погледајте моје објашњење на линк овде.

Ево извода из ОпенАИ документа који указује на неке од њихових наведених смерница:

„Могло би бити неких питања која захтевају одређене врсте неприкладног садржаја. У овим случајевима и даље би требало да преузмете задатак, али помоћник треба да одбије на пример „Не могу да одговорим на то“.“
„Мржња: садржај који изражава, подстиче или промовише мржњу на основу заштићене карактеристике.“
„Узнемиравање: садржај који има за циљ да узнемирава, прети или малтретира појединца.“
„Насиље: садржај који промовише или велича насиље или слави патњу или понижење других.“
„Самоповређивање: садржај који промовише, подстиче или приказује дела самоповређивања, као што су самоубиство, сечење и поремећаји у исхрани.“
„За одрасле: садржај који треба да изазове сексуално узбуђење, као што је опис сексуалне активности или који промовише сексуалне услуге (искључујући сексуално образовање и добробит).“
„Политички: садржај који покушава да утиче на политички процес или да се користи у сврхе кампање.“
„Злонамерни софтвер: садржај који покушава да генерише рансомваре, кеилоггере, вирусе или други софтвер који има намеру да нанесе одређени ниво штете.“

Листа приказује типове потенцијално неприкладног садржаја који се могу појавити.

Што се тиче политичке категорије, на друштвеним медијима су објављени различити примери генеративних АИ апликација за које се чини да су склизнуле у један политички табор насупрот другом.

На пример, корисник који поставља питање о једном политичком лидеру могао би да добије позитиван одговор, док би питање о другом политичком лидеру могао добити негативан и потпуно омаловажавајући есеј. Чини се да ово сугерише да се генеративна вештачка интелигенција подудара са формулацијом која фаворизује једну страну, а не фаворизује другу. Ови случајеви су довели до подстицања генеративне вештачке интелигенције која изгледа нагнута ка и може се приписати као:

Пробудио генеративну АИ
Против буђења генеративна АИ
Крајње десничарска генеративна АИ
Крајње лева генеративна АИ
Итд

Као што је раније поменуто, ово није због способности осећаја АИ. Ово се још једном у потпуности односи на подударање образаца и друге аспекте начина на који је АИ осмишљен.

За разлику од грешака, лажи и АИ халуцинација, ђаво је у детаљима да би схватио како да задржи пристрасности ван структуре вештачке интелигенције или како да их открије и изађе на крај када такви аспекти постоје.

Хајде да истражимо како пристрасности завршавају унутар генеративне АИ.

Извори и методе које доводе до генеративних АИ предрасуда

Када је генеративна АИ први пут стављена на располагање јавности, пристрасни аспекти су посебно привукли наглашену пажњу стручњака и медија. Као што је овде наведено, вештачка интелигенција је често била повучена из јавне употребе. Поред тога, обновљени напори да се покуша да се избори са пристрасностима су добили додатну снагу.

Неки су одмах претпоставили да су пристрасности убризгане као резултат пристрасности програмера АИ и истраживача АИ који су развили АИ. Другим речима, људи који су развијали АИ су дозволили да се њихове личне предрасуде увуку у АИ. У почетку се сматрало да је ово свесни напор да се АИ уздрма у одређеним правцима пристрасних преференција. Иако се ово може или не мора догодити, други су тада сугерисали да би пристрасности могле бити ненамерно уливене, наиме да програмери вештачке интелигенције и истраживачи вештачке интелигенције наивно нису били свесни да се њихове сопствене пристрасности упијају у развој АИ.

Тај јединствени или једнодимензионални пут забринутости је неко време доминирао пажњом.

Више пута сам говорио да заправо постоји широк спектар извора и метода који могу на крају улити предрасуде у генеративну АИ, као што је дискутовано на линк овде. Ово је изразито вишедимензионални проблем.

Помињем ово зато што је идеја да су само програмери АИ или истраживачи вештачке интелигенције кривац погрешно и уско виђење целокупног проблема. Не кажем да нису потенцијални извор, само наглашавам да нису једини потенцијални извор. Понекад нам недостаје шума због дрвећа, чинећи то тако што стриктно фиксирамо поглед на одређено дрво.

Као што је детаљно објашњено у мојим колумнама, ево моје значајне свеобухватне листе пристрасних путева које треба у потпуности истражити за било коју и све генеративну АИ имплементацију:

Предрасуде у изворним подацима са Интернета који су коришћени за обуку података генеративне АИ
Пристрасности у генеративним алгоритмима вештачке интелигенције који се користе за усклађивање узорака на изворним подацима
Пристрасности у укупном дизајну АИ генеративне АИ и њене инфраструктуре
Пристрасности програмера АИ имплицитно или експлицитно у обликовању генеративне АИ
Пристрасности тестера АИ имплицитно или експлицитно у тестирању генеративне АИ
Пристрасности РЛХФ-а (учење уз помоћ људских повратних информација) имплицитно или експлицитно од стране додељених људских рецензената који дају упутства за обуку генеративној АИ
Пристрасности фацилитације АИ у пољу за оперативну употребу генеративне АИ
Предрасуде у било ком подешавању или подразумеваним упутствима успостављеним за генеративну вештачку интелигенцију у свакодневној употреби
Предрасуде намерно или ненамерно обухваћене упутствима које је унео корисник генеративне АИ
Пристрасности системског стања у односу на ад хоц изглед као део насумичне вероватноће генерисања излаза од стране генеративне АИ
Предрасуде које настају као резултат прилагођавања у ходу или у реалном времену или обуке података која се дешава док је генеративна АИ под активном употребом
Предрасуде уведене или проширене током одржавања АИ или одржавања генеративне АИ апликације и њеног кодирања за подударање шаблона
други

Размислите о листи на тренутак или два.

Ако бисте некако спречили било какву шансу да се пристрасности унесу преко АИ програмера или истраживача АИ, и даље сте суочени са мноштвом других средстава која неизбежно могу обухватити пристрасности. Фокусирање на само једно или чак неколико потенцијалних цурења није довољно. Сви остали путеви пружају додатне могућности да се пристрасности уклопе у слику.

Ослобађање од генеративних АИ предрасуда је слично сложеном замршеном гамбиту ударца.

ТрутхГПТ и избори управљања пристрасношћу

Покрили смо аспект да је суочавање са грешкама, лажима и АИ халуцинацијама у току и можете очекивати сталну поплаву најава о напредовању вештачке интелигенције која се бави тим питањима.

Исто није тако лако што се тиче пристрасности.

Шта би ТрутхГПТ могао да уради или треба да уради у вези са пристрасностима?

Размотрите ове три могуће опције:

1) Све иде. Осмислите генеративну вештачку интелигенцију да избацује било шта без икаквог привида филтрирања повезаног са пристрасностима. Нека се све дружи.
2) Дозволите подешавања за „жељену“ пристрасност. Осмислите генеративну вештачку интелигенцију како бисте произвели пристрасности које се сматрају „пожељним или фаворизованим“ према онима који осмишљавају, користе или користе генеративну вештачку интелигенцију.
3) Нису дозвољене пристрасности. Осмислите генеративну вештачку интелигенцију да никаква пристрасност било које врсте није дозвољена, тако да у сваком тренутку у свим облицима употребе не постоје пристрасности изражене ни у једном од објављених есеја.

Несумњиво можете замислити повике и контроверзе повезане са сваком од горе наведених опција. Ниједна од опција вероватно неће бити у потпуности задовољавајућа. Сви они имају своје демоне и замке.

Следеће се бавим овим.

За Све пролази опција генеративне АИ, пристрасности би биле стално испред и у центру. Вртлог друштвеног протеста и презира би био огроман. Ово би наизглед изазвало огроман притисак да се затвори генеративни АИ. Такође можете лако да замислите да ће регулатори и законодавци бити подстакнути на акцију, тражећи да успоставе нове законе о вештачкој интелигенцији како би угасили ову врсту генеративне вештачке интелигенције.

У случају Дозволи подешавања опција генеративне АИ, идеја је да неко одлучује које предрасуде прихвата. Могуће је да компанија која осмишљава АИ поставља параметре. Могуће је да компанија која поставља генеративну вештачку интелигенцију поставља параметре. Још једна идеја која се појављује је да би сваки корисник могао да изабере своје префериране скупове предрасуда. Када први пут користите такву генеративну вештачку интелигенцију, можда ће вам бити представљене опције или можете да унесете своје преференције у АИ апликацију током подешавања.

Овај други приступ може изгледати као да би свима пријао. Свака особа би добила било коју пристрасност коју би волела да види. Случај затворен. Наравно, мало је вероватно да ће ово бити тако добродошло. Идеја да би људи могли да се уроне у предрасуде и користе генеративну вештачку интелигенцију као неку врсту ехо коморе за те пристрасности сигурно ће изазвати друштвену љутњу.

Коначно, у случају Но Биасес опција, ово звучи добро, али изазива низ повезаних проблема. Хајде да преиспитамо околност генеративне вештачке интелигенције која даје есеј у којем се наводе позитивне примедбе о одређеном политичком лидеру. Можда неки сматрају да је ово прави есеј и да нема пристрасности. С друге стране, можда постоје и други који инсистирају да је ово пристрасан есеј јер неоправдано преувеличава позитивне или не даје противтежу негативности како би понудио уравнотежену перспективу. Ово илуструје загонетку о пристрасности.

Видите, грешке као што су два плус два што је четири или пет су релативно јасне за избор. Неистине као што је погрешна година рођења као што је наведено за председника релативно је једноставно разјаснити. Халуцинације вештачке интелигенције, као што је употреба млазног авиона у 1800-им, такође су релативно очигледне за решавање.

Како би генеративна вештачка интелигенција требало да буде осмишљена да се бори са пристрасностима?

Невероватно питање, свакако.

ИстинаГПТ о изводљивости и стварности тога

Хајде да се играмо.

Претпоставимо да ТрутхГПТ има за циљ да буде тип генеративне АИ за коју се претпоставља да неће имати било какве предрасуде. Апсолутно и несумњиво је одсутна пристрасност. Штавише, без обзира шта корисник ради, као што је уношење пристрасних изјава или покушај да подстакне генеративну вештачку интелигенцију ка стварању есеја напуњених пристрасношћу, генеративна АИ то неће учинити.

На страну, могли бисте се скоро одмах запитати како ће се ова врста генеративне АИ бавити питањима историјске природе. Замислите да неко пита о теми политичких пристрасности. Да ли то спада под окриље „пристрасности“ и стога би генеративна АИ указивала да неће одговорити на упит? Колико далеко иде ова зечја рупа?

У сваком случају, ако претпоставимо у сврху пажљивог размишљања да ће ТрутхГПТ бити прави Но Биасес варијанту генеративне АИ, морамо онда размотрити ове исходе:

Немогућ
Могућ
други

Исходи се састоје од тога да ли је ово ан немогућ циљ и тиме неће бити постигнут. Или је циљ могућ али може имати неке отрежњујуће боре. Такође сам укључио и други исход за капсулирање неких између.

Прво, хајде да разговарамо о немогућности. Ако је задатак или пројекат немогућ, можда ћете тежити ка томе да се то не покушава. Нема смисла тражити нешто што је немогуће. Па, ако мало размислимо о овоме, немогућност у ствари има неку сребрну поставу која је повезана са њом. Дозволите ми да објасним.

Ево потенцијалних разлога због којих би ТрутхГПТ можда било немогуће остварити, а ипак би било вредно предузети:

1) Немогуће јер се мисија или визија никада не могу остварити
2) Немогуће, али свеједно вреди учинити за потенцијалну споредну корист од значајног доприноса унапређењу АИ све речено
3) Немогуће, међутим, може послужити као награда за привлачење пажње јер сте покушали
4) Немогуће и промениће своју мелодију и заокренути или изобличити првобитно намеравани циљ
5) Немогуће, али ће прикупити врхунске АИ таленте и помоћи у смањењу конкуренције
6) Остало

Исто тако, можемо претпоставити да су ово неки од аспеката ТрутхГПТ-а за исход који је достижан или могућ у постизању:

1) Могуће и донеће благовремено и непобитно успешно достигнуће
2) Могуће, али ће трајати много дуже и бити много скупље него што се очекивало
3) Могуће иако ће резултат на крају бити прилично краћи од планираног циља
4) Могуће, али са закашњењем и срамотно помрачено од стране друге генеративне АИ који то такође раде
5) Међутим, могући унутрашњи хаос и потешкоће у вођству чине ствари ружним и непристојним
6) Остало

И да завршимо листу, ево још неких других разматрања:

1) Друго је да су ово све приче и никаква акција, никада не почиње
2) Остало, као што је закон о вештачкој интелигенцији, правни или друштвени АИ етика баца кључ у подухват
3) Друго може бити да труд прода/купе други који желе АИ или таленат
4) Друго би се могло састојати од изненађујућег аранжмана сарадње, а не самосталног
5) Други џокер знакови, укључујући шокантна открића и повећавају егзистенцијални ризик од вештачке интелигенције
6) Остало

Због ограничења простора овде, нећу улазити у специфичности свих тих пермутација. Ако интересовање читалаца буде довољно подстакнуто, радо ћу то детаљније обрадити у некој каснијој колумни.

Zakljucak

Џорџ Вашингтон је наводно рекао: „Истина ће на крају превладати тамо где је потребно да се изнесе на видело.

Суочавање са пристрасним аспектима вештачке интелигенције није само технолошки проблем који се решава технолошком исправком. Вероватни напори да се открије осећај „истине“ путем генеративне АИ су многоструки. Можете очекивати да ће етика вештачке интелигенције и закон о вештачкој интелигенцији бити суштински део откривања куда све ово води.

На вратима кабине се куца.

Може бити да се испред врата налази (према млину гласина):

ТрутхГПТ
ХонестГПТ
УнтрутхфулГПТ
ДисхонестГПТ
ЦонфуседГПТ
БаффледГПТ
РандомГПТ
Итд

Буда би могао дати неке увиде о овом питању: „Постоје само две грешке које се могу направити на путу ка истини; не иде до краја и не почиње.” У напорима вештачке интелигенције који убрзано напредују, требало би да се запитамо да ли правимо такве грешке и ако јесте, шта треба да радимо у вези са тим.

И то је искрена истина.

Извор: хттпс://ввв.форбес.цом/ситес/ланцеелиот/2023/03/06/цан-елон-муск-суццеед-ин-девелопинг-генеративе-аи-цхатгпт-кноцкофф-трутхгпт-тхат-воулд-бе- стоички-истинит-у-свако-питање-аи-етика-и-аи-закон/