Етика вештачке интелигенције која опрезно процењује да ли је нуђење АИ предрасуда за лов на награде за хватање и хватање етички злих потпуно аутономних система разборито или узалудно

Трази се: Ловци на АИ предрасуде.

То би могао да буде модеран оглас који ћете почети да видите како се појављује на каналима друштвених медија и појављује се у разним онлајн огласима за посао. Ово је релативно нов концепт или улога. Са собом носи контроверзу. Неки ватрени верници горљиво тврде да то има много смисла и да је требало да се дешава све време, док други прилично нервозно озбиљно чешу главу и нису баш сигурни да је то добра идеја.

Суштина улоге састоји се од откривања било каквих скривених предрасуда или уграђених дискриминаторних пракси из АИ. У помоћ прискачу жељни и дотадашњи ловци на пристрасне вештачке интелигенције. Они би вероватно били компјутерски упућени ловци на главе. Штавише, надамо се, уроњени у дубине АИ могућности.

Имајте пиштољ, путоваћете и можете помоћу вештог гађања вештог гађања успети да разоткрије те непријатне и непристрасне АИ предрасуде.

Ово поставља низ проблематичних питања о сензибилности спровођења такве тактике када је у питању откривање пристрасности вештачке интелигенције. Као што ћу кратко разговарати, имајте на уму да је појава АИ такође донела појаву АИ предрасуда. Бујица АИ предрасуда. За моје текуће и опсежно покривање етике вештачке интелигенције и етичке вештачке интелигенције, погледајте линк овде линк овде, само да поменемо само неке.

Како да откријемо да одређени систем вештачке интелигенције има предрасуде?

Можете поверити АИ програмерима који су осмислили АИ да то ураде. Ствар је у томе што су можда толико заглибљени у пристрасности да сами не могу препознати пристрасности унутар своје измишљене АИ. Све им то добро изгледа. Или би могли бити толико узбуђени због АИ и имају осећај самопоноса због тога да би морали да критички погледају да би га испитали да ли постоје пристрасности било би тешко и било би тешко. Многи други такви разлози могу изгледати као да поткопавају то што програмери вештачке интелигенције преузму овај задатак, укључујући недостатак вештина за откривање уграђених предрасуда, недостатак времена у пројекту да то ураде, итд.

У реду, само напред и унајмите спољне консултанте да ураде прљави посао уместо вас. Испоставило се да ће консултанти са задовољством испитати вашу вештачку интелигенцију због пристрасности, наплаћујући вам прилично пени за то (пуно и пуно пенија). Схватите да морате да платите за њих да би могли да убрзају ваш АИ систем. Затим морате да их натерате да претурају около, што би могло потрајати небројено много скупих и напорних сати. Коришћење консултаната је опција ако имате буџет за то.

У потенцијални „празник“ како пронаћи те подмукле АИ пристрасности долазе јуначки и полетни ловци на АИ пристрасности.

Обично их не плаћате унапред. Они покушавају да пронађу пристрасност вештачке интелигенције у своје време и морају сами да сносе своје рачуне док то раде. Само ако успешно пронађу пристрасности, биће плаћени. Претпостављам да бисте лако могли да тврдите да је на одговарајући начин размишљања то конвенционална дефиниција ловца на главе. Платите ако успете. Немојте бити плаћени ако нисте успешни. Тачка, крај приче.

Боунти програми постоје барем од времена Римљана и стога можемо претпоставити да они функционишу, пошто су се успешно издржали као пракса током свих ових година.

Ево једне фасцинантне историјске тривијалности за вас. Наводно, објављена порука за време Римског царства у граду Помпеји је објавила да су потребни ловци на главе да би пронашли бакарни лонац који је нестао из мале продавнице. Награда за враћање бакарног лонца била је импресивна награда од шездесет пет бронзаних новчића. Жао нам је што кажем да не знамо да ли је било који ловац на уцене пронашао бакарни лонац и узео бронзане новчиће, али знамо да се лов на уцене сигурно наставио од тих давних времена.

У модернијим временима, можда сте свесни да су 1980-их постојале неке значајне награде за проналажење рачунарских грешака или грешака у софтверским пакетима који су доступни на полици, а затим је 1990-их Нетсцапе значајно понудио награду за проналажење грешака у свом веб претраживачу. (постаје једна од најистакнутијих фирми тог дана која је то учинила). Гугл и Фејсбук су се определили за лов на бубице почев од 2010. и 2013. године, респективно. Неколико година касније, 2016. чак је и америчко Министарство одбране (ДоД) кренуло у акцију тако што је направило „Хацк тхе Пентагон“ награђивање (имајте на уму да је јавно фокусирана награда била за грешке пронађене на разним веб локацијама у вези са ДоД-ом, а не на одбрамбени критични системи).

Хајдемо дубље да копамо у тему о награди за бубе. Схватам да у овој дискусији углавном желим да говорим о пристрасности вештачке интелигенције у лову на главе, али постоје неке прилично релевантне паралеле са ареном за бубе.

Неки су очигледно збуњени да би било која фирма желела да понуди награду за проналажење грешака (или, у овом случају, АИ предрасуда) у њиховим системима.

На површини, ово изгледа као стратегија типа „ти то тражиш“. Ако дате до знања свету да поздрављате оне који би могли да покушају да пронађу рупе у вашем софтверу, чини се да је исто као да кажете провалницима да покушају да провале у вашу кућу. Чак и ако већ верујете да имате прилично добар противпровални алармни систем и да нико не би смео да уђе у ваш обезбеђени дом, замислите да питате и заиста преклињате провалнике да дођу у ваше место становања и виде да ли могу провалити у њега. О, невоље које сами себи плетемо.

Исто се може рећи и за тражење ловаца на главе да пронађу пристрасности у вашој АИ.

Прво, то можда имплицира да већ верујете или чак потпуно знате да ваша вештачка интелигенција има предрасуде. То је шокантно отворено имплицирано признање које би мало ко изгледа био спреман да учини и које би могло да се обори.

Друго, не знате са сигурношћу шта би ти ловци на главе могли да ураде. Могли би да одлуче да кажу целом свету да су пронашли предрасуде у вашој вештачкој интелигенцији. Претпоставља се да би ово могло да изгуби награду, мада би неки могли да уживају у пажњи или да имају за циљ да ојачају свој статус за добијање консултантских концерата и других могућности за генерисање прихода. Можда би то могло бити потпуно алтруистично. То би могао бити облик АИ активизма. Могу да наставим.

Треће, могло би доћи до прикривеног обрта у целој афери. Ловац на главе који тврди да тражи АИ предрасуде могао би ђаволски шврљати около да пронађе начине да нападне ваш АИ систем. Цела ствар је шарада да се на крају предузме озбиљан сајбер напад. Можда сте претпоставили да покушавају да помогну, док у својим срцима имају неправде. Тужно, али могуће.

Четврто, можемо се још лукавије искривити по овом питању. Ловац на главе проналази неке непријатне и потенцијално подстицање АИ пристрасности. Награда је нека количина долара коју ћемо назвати Кс. Уместо да тражи награду, ловац на главе ради неку врсту чудне провокације рансомваре-а. Ако ловцу на главе платите износ од десет пута Кс или можда више од границе, они ће вам рећи о пристрасности АИ. Имате рок до недеље увече у поноћ да одговорите. Након тог времена, пристрасност АИ ће бити откривена да сви виде. Ајме, ужасна невоља за бити.

Пето, најновији су они такозвани „хацк то ретурн” сајбер преваранти који након што су украли гомилу новца на мрежи, одлучују да се покају и врате део незаконито стеченог плена који су зграбили. Компанија којој је новац делимично враћен је тада спремна да преостали украдени износ сматра као накнадну награду која се награђује лоповима. Чини се да сви „побеђују“ у томе што се највећи део средстава враћа, а у међувремену сајбер преваре се не гоне по закону, плус добијају пиратску награду. Да ли је ово разборито или подмукло овековечавање кривичних дела?

Схватам да неки од вас можда кажу да нико не би требало да пушта вештачку интелигенцију која има било какве предрасуде у себи. Чини се да то решава целу дилему око тога да ли користити ловце на уцене за пристрасност вештачке интелигенције или не. Само немојте да се доводите у ситуацију за награду. Уверите се да ваши програмери вештачке интелигенције раде праву ствар и да не дозвољавају АИ пристрасности у своје АИ системе. Можда користите консултанте да извршите још једну проверу. У суштини, урадите све што је потребно како бисте избегли да икада размишљате о томе или да тражите од оних ловаца на главе пристрасне вештачке интелигенције да дођу за сто.

Да, то би изгледало сасвим разумно. Проблем је што је и помало сањив. Сложеност многих система вештачке интелигенције је толико велика да ће покушати да се осигура да се не појави ни једна унца пристрасности АИ неће бити тешко урадити. Поврх тога, неки системи вештачке интелигенције су намерно осмишљени да се прилагођавају и „уче“ како напредују. То значи да би у неком будућем тренутку АИ коју сте осмислили, а хајде да се у почетку претварамо да је била чисто чиста и без предрасуда, могла да гравитира ка отелотворењу предрасуда (не мислим на то на антропоморфан начин, као што ћу даље објаснити док наставите са овом темом).

Они који фаворизују лов на награде за софтверске грешке склони су да тврде да има смисла понудити такве награде. Можемо размотрити њихово образложење и видети да ли се то односи и на област пристрасности АИ.

Заговорници награђивања грешака наглашавају да уместо да покушавају да се претварају да у вашем систему нема рупа, зашто не бисте подстакли да се пронађу рупе, радећи то на „контролисани“ начин? Насупрот томе, без таквог труда за награду, могли бисте се само надати и молити се да случајно нико неће пронаћи рупу, али ако уместо тога нудите награду и говорите онима који пронађу рупу да ће бити награђени, то нуди прилика да сами покријете рупу и спречите друге да је потајно пронађу у неком каснијем тренутку.

Исто би се могло рећи у случају употребе пристрасности АИ. Ако понудите довољну награду, надамо се да ће вам ловци на главе скренути пажњу на откриће пристрасности вештачке интелигенције. Тада можете да се носите са предрасудама АИ на релативно тих и одмерен начин. Ово би касније могло да спречи много већи и застрашујући проблем, наиме да неко други пронађе АИ предрасуде у вашој АИ и вришти о томе до високих небеса.

Уопштено говорећи, фирма која жели да омогући тражење грешака ће увести Политику откривања рањивости (ВДП). ВДП указује на то како се грешке могу пронаћи и пријавити фирми, заједно са начином на који ће награда или награда бити обезбеђена ловцу. Обично ће ВДП захтевати да ловац на крају потпише Уговор о неоткривању података (НДА) тако да неће открити другима шта је пронашао.

Идеја коришћења НДА са ловцима на главе има неке контроверзе. Иако можда има смисла да компанија која нуди награду жели да прећути откривена излагања, такође се каже да гуши општу свест о таквим грешкама. Вероватно, ако се дозволи да се говори о софтверским грешкама, то би потенцијално помогло у безбедности других система у другим фирмама које би онда појачале њихову изложеност. Неки ловци на главе неће потписати НДА, делимично због жеље јавности, а делимично због покушаја да задрже свој идентитет скривеним. Такође, имајте на уму да се аспект НДА обично не појављује све док ловац не тврди да је пронашао грешку, уместо да је претходно захтева.

Неки ВДП-и предвиђају да је НДА само на ограничен временски период, омогућавајући фирми да прво пронађе решење за привидну рупу, а затим да омогући шире обелодањивање о томе. Када је рупа запушена, фирма тада дозвољава попуштање НДА како би остатак света могао да зна за грешку. Уобичајено време до решавања грешака у лову је око 15-20 дана када фирма жели да их одмах искључи, док се у другим случајевима може продужити на 60-80 дана. Што се тиче плаћања ловцу на главе, такозваног времена до плаћања, након што се потврди да рупа стварно постоји, исплате награда наводно имају тенденцију да буду у року од 15-20 дана за мање случајеве и око 50-60 дана. дана за веће примере (ово се стално мењају индикације индустрије и помињу се само као илустрација).

Да ли од ловаца на уцене такође треба тражити да учествују у ВДП-у и да се баве НДА?

На то питање можете добити и да и не. Да, неке фирме би требало да иду тим путем. Не, можда се нећете нужно одлучити да идете тим путем. Фактори укључују величину и природу АИ, потенцијал било које укључене изложености АИ пристрасности и гомилу других етичких, правних и пословних разматрања која долазе у обзир.

Могао бих да додам да је успостављање подухвата лова на главе за АИ предрасуде ваше АИ много већи налог него што бисте могли претпоставити на први поглед.

Почећемо са огромном могућношћу да ћете бити преплављени ловцима на уцене са пристрасношћу вештачке интелигенције.

Тренутно би вам било тешко пронаћи многе који би имали такву визит карту. Нема их много около. То су дани Дивљег запада у том погледу. Али ако се појам пристрасности вештачке интелигенције у лову на главе ухвати, посебно када су награде обилне и богато награђујуће, можете се кладити да ће сви заронити у базен за лов на пристрасности.

Да ли желите све врсте превара који се баве АИ предрасудама у вашем АИ систему? Добићете неке људе који су заиста стручњаци за овакве ствари. Добићете друге аматере који могу да направе неред или заплаче вука. Следеће што знате, свако ко може да напише „вештачка интелигенција“ ће доћи да копа у вашем златном руднику система вештачке интелигенције за те драгоцене АИ пристрасне грумене злата. Златна грозница је у току. То можда неће бити добро за тебе.

Мораћете да пажљиво прегледате поднеске ловаца на главе. Биће много „буке“ у пријављеним тврдњама, у смислу да многе од наводних пристрасности вештачке интелигенције не постоје, иако ловац на главе инсистира да су их пронашли. Замислите колико ће рада вашим АИ тимовима бити потребно да испитају тврдње о наградама, истраже валидност сваког од њих, а затим потенцијално разговарају са ловцем на главе о томе да ли је злато откривено или не.

Неки би тврдили да је то још један разлог да све урадите сами. Можда ћете неизбежно открити да је ствар са наградом више проблема него што је вредела.

Ево још једног питања за размишљање. Како ће ловци на главе знати како изгледа АИ пристрасност? У суштини, без неког привида онога што треба тражити, за било који сјајни камен би се могло тврдити да показује пристрасност АИ у запаженом руднику злата који се ископава.

У данима Старог Запада, претпоставимо да сте понудили награду за хватање Билија Кида (познатог одметника). Ако сте то урадили и нисте укључили слику како је Били изгледао, замислите број ловаца на главе који би могли да довуку у шерифову канцеларију некога за кога су се надали или су мислили да је Били Кид. Можда ћете бити преплављени лажним Билијем. Ово је лоше јер бисте вероватно морали да погледате сваког од њих, поставите пробна питања и покушате да утврдите да ли је та особа заиста Били или не.

Поента је у томе да би било мудро да покушате да разјасните од чега се, по вашем мишљењу, састоје пристрасности АИ, да бисте подесили напоре за АИ пристрасности. Ово захтева Златокосу врсту калибрације. Не желите да будете толико ограничени да ловци на главе превиде пристрасност вештачке интелигенције само зато што се не уклапају у вашу прописану дефиницију, нити желите да вичу „Еурека!“ на сваки залогај пристрасности вештачке интелигенције коју можда пронађу.

Биће вам потребан прави баланс Златокосе од чега се састоје пристрасности вештачке интелигенције и на тај начин пружите по могућности експлицитна упутства за то.

Велики део овог лова на награде за пристрасност вештачке интелигенције биће фокусиран на системе машинског учења (МЛ) и дубоког учења (ДЛ) засноване на вештачкој интелигенцији. Ово има смисла с обзиром на то да све више распрострањености МЛ/ДЛ-а расте, плус чини се да има неке од највероватнијих изазова обухватања непотребних АИ пристрасности.

Ови истраживачи идентификују колико значајан покушај лова на награде може бити АИ пристрасности, посебно у контексту МЛ/ДЛ: „Временом су софтверске и безбедносне заједнице развиле 'награде за грешке' у покушају да преокрену сличну динамику између програмера система и њихових критичара (или хакера) ка интерактивнијим и продуктивнијим циљевима. Надамо се да ће се намерним позивањем спољних страна да пронађу софтверске или хардверске грешке у својим системима, и често пружањем новчаних подстицаја за то, развити здравији екосистем који брже реагује. Природно је за МЛ заједницу да размотри сличан приступ „пристрасности“ благовременом откривању и поправљању модела и система са пристрасношћу или другим непожељним понашањем. Уместо да проналазе грешке у софтверу, спољне стране су позване да пронађу пристрасности – на пример, (демографске или друге) подгрупе улазних података на којима обучени модел не успева – и за то су награђене” (у раду „Ан алгоритамски оквир за пристрасност Боунтиес” Ира Глобус-Харрис, Мицхаел Кеарнс и Аарон Ротх).

У истраживачком раду, аутори наводе предложени приступ томе које врсте пристрасности АИ могу тражити ловци на главе. Такође постоји индикација о томе како проценити тврдње ловаца на главе повезане са тако откривеним наводним пристрасностима вештачке интелигенције. Према мојим ранијим напоменама овде, шансе су да ћете добити лажне тврдње и да ћете морати да одвојите пшеницу пристрасности АИ од кукоља.

Пре него што пређемо на нешто више о месу и кромпиру о дивљим и вунастим разматрањима која су у основи лова на пристрасност вештачке интелигенције, хајде да успоставимо неке додатне основе о дубоко интегралним темама. Морамо накратко да заронимо у етику вештачке интелигенције, а посебно у појаву машинског учења (МЛ) и дубоког учења (ДЛ).

Можда сте нејасно свесни да се један од најгласнијих гласова ових дана у пољу вештачке интелигенције, па чак и ван поља вештачке интелигенције, састоји у тражењу већег привида етичке вештачке интелигенције. Хајде да погледамо шта значи упућивање на етику вештачке интелигенције и етичку вештачку интелигенцију. Поврх тога, истражићемо шта мислим када говорим о машинском учењу и дубоком учењу.

Један посебан сегмент или део етике вештачке интелигенције који добија велику пажњу медија састоји се од вештачке интелигенције која показује непристрасне пристрасности и неједнакости. Можда сте свесни да је када је почела најновија ера вештачке интелигенције дошло до огромног налета ентузијазма за оно што неки сада називају AI za dobro. Нажалост, за петама тог бујног узбуђења, почели смо да свједочимо AI za loše. На пример, откривено је да различити системи за препознавање лица засновани на вештачкој интелигенцији садрже расне и родне предрасуде, о чему сам говорио на линк овде.

Напори за узврат AI za loše су активно у току. Поред гласног правни настојања да се обузда злодела, постоји и суштински подстицај ка прихватању етике вештачке интелигенције како би се исправила подлост АИ. Идеја је да треба да усвојимо и подржимо кључне етичке принципе вештачке интелигенције за развој и постављање АИ, чинећи то да поткопамо AI za loše и истовремено најављујући и промовишући пожељно AI za dobro.

У вези с тим, ја сам заговорник покушаја да се АИ користи као део решења за невоље АИ, борећи се са ватром ватром на тај начин размишљања. На пример, могли бисмо да уградимо компоненте етичке вештачке интелигенције у систем вештачке интелигенције који ће пратити како остатак АИ ради ствари и на тај начин потенцијално ухватити у реалном времену све дискриминаторске напоре, погледајте моју дискусију на линк овде. Такође бисмо могли да имамо посебан систем вештачке интелигенције који делује као врста монитора етике вештачке интелигенције. Систем вештачке интелигенције служи као надзорник за праћење и откривање када друга вештачка интелигенција иде у неетички понор (погледајте моју анализу таквих способности на линк овде).

За тренутак ћу поделити са вама неке свеобухватне принципе који су у основи етике вештачке интелигенције. Постоји много оваквих листа које лебде ту и тамо. Могло би се рећи да још увек не постоји јединствена листа универзалне привлачности и сагласности. То је несрећна вест. Добра вест је да барем постоје лако доступне листе етике вештачке интелигенције и да су обично прилично сличне. Све у свему, ово сугерише да путем неке врсте разумне конвергенције проналазимо пут ка општем заједништву онога од чега се састоји етика вештачке интелигенције.

Прво, хајде да укратко покријемо неке од укупних етичких правила вештачке интелигенције како бисмо илустровали шта би требало да буде од виталног значаја за свакога ко прави, користи или користи вештачку интелигенцију.

На пример, како наводи Ватикан у Рим позива на етику вештачке интелигенције и као што сам детаљно обрадио на линк овде, ово је њихових идентификованих шест примарних етичких принципа АИ:

  • Транспарентност: У принципу, АИ системи морају бити објашњиви
  • Укључење: Потребе свих људских бића морају се узети у обзир како би сви могли имати користи, а свим појединцима могу бити понуђени најбољи могући услови за изражавање и развој
  • Одговорност: Они који дизајнирају и примењују коришћење вештачке интелигенције морају да поступе са одговорношћу и транспарентношћу
  • Непристрасност: Не стварајте и не поступајте у складу са пристрасношћу, штитећи на тај начин правичност и људско достојанство
  • Поузданост: АИ системи морају бити у стању да поуздано раде
  • Безбедност и приватност: Системи вештачке интелигенције морају да раде безбедно и да поштују приватност корисника.

Како наводи Министарство одбране САД (ДоД) у свом Етички принципи за коришћење вештачке интелигенције и као што сам детаљно обрадио на линк овде, ово је њихових шест примарних етичких принципа АИ:

  • Одговорни: Особље Министарства одбране ће применити одговарајуће нивое расуђивања и бриге, док ће остати одговорно за развој, примену и коришћење способности вештачке интелигенције.
  • правичан: Одељење ће предузети намерне кораке да минимизира ненамерну пристрасност у способностима вештачке интелигенције.
  • следљиво: АИ способности Одељења ће бити развијене и распоређене тако да релевантно особље поседује одговарајуће разумевање технологије, развојних процеса и оперативних метода применљивих на АИ способности, укључујући транспарентне и проверљиве методологије, изворе података и процедуру и документацију дизајна.
  • Поуздано: АИ способности Одељења ће имати експлицитну, добро дефинисану употребу, а безбедност, безбедност и ефикасност таквих способности биће предмет тестирања и уверавања у оквиру тих дефинисаних употреба током читавог њиховог животног циклуса.
  • којим се може управљати: Одељење ће дизајнирати и конструисати АИ способности да испуне своје предвиђене функције, истовремено поседујући способност откривања и избегавања нежељених последица, као и способност да искључи или деактивира распоређене системе који показују ненамерно понашање.

Такође сам расправљао о различитим колективним анализама етичких принципа АИ, укључујући покривање скупа који су осмислили истраживачи који су испитивали и сажимали суштину бројних националних и међународних етичких начела АИ у раду под насловом „Глобални пејзаж етичких смерница АИ“ (објављен ин Природа), и које моје покривање истражује на линк овде, што је довело до ове кључне листе:

  • провидност
  • Правда и правичност
  • Не нашкодити
  • одговорност
  • приватност
  • Доброчинство
  • Слобода и аутономија
  • Поверење
  • Одрживост
  • Достојанство
  • Солидарност

Као што можете директно претпоставити, покушај да се утврде специфичности које леже у основи ових принципа може бити изузетно тежак. Штавише, напор да се ти широки принципи претворе у нешто сасвим опипљиво и довољно детаљно да се користи при изради АИ система такође је тврд орах. Лако је генерално мало рећи шта су етичка правила вештачке интелигенције и како их генерално треба поштовати, док је много компликованија ситуација у кодирању вештачке интелигенције да мора да буде права гума која излази на пут.

Принципе етике вештачке интелигенције треба да користе програмери вештачке интелигенције, заједно са онима који управљају развојним напорима вештачке интелигенције, па чак и онима који на крају обављају и одржавају АИ системе. Све заинтересоване стране током читавог животног циклуса АИ развоја и употребе се сматрају у оквиру поштовања устаљених норми Етичке АИ. Ово је важан нагласак пошто је уобичајена претпоставка да су „само кодери“ или они који програмирају АИ подложни придржавању појмова етике АИ. Као што је раније речено, потребно је село да осмисли и примени АИ, а за шта цело село мора да буде упознато и да се придржава етичких прописа АИ.

Хајде да се уверимо да смо на истој страни о природи данашње вештачке интелигенције.

Данас не постоји АИ која је разумна. Ми немамо ово. Не знамо да ли ће разумна АИ бити могућа. Нико не може тачно да предвиди да ли ћемо достићи осећајну АИ, нити да ли ће се осећајна АИ некако чудесно спонтано појавити у облику компјутерске когнитивне супернове (која се обично назива сингуларитет, погледајте моје извештавање на линк овде).

Тип вештачке интелигенције на коју се фокусирам састоји се од вештачке интелигенције коју данас имамо. Кад бисмо хтели да дивље спекулишемо о осетљив АИ, ова дискусија би могла да иде у радикално другом правцу. Разумна АИ би наводно била људског квалитета. Морали бисте узети у обзир да је разумна АИ когнитивни еквивалент човека. Штавише, пошто неки спекулишу да бисмо могли имати супер-интелигентну вештачку интелигенцију, могуће је да би таква вештачка интелигенција могла да буде паметнија од људи (за моје истраживање супер-интелигентне вештачке интелигенције као могућности, види покривеност овде).

Хајде да задржимо ствари на земљи и размотримо данашњу компјутерску неосетљиву вештачку интелигенцију.

Схватите да данашња вештачка интелигенција није у стању да „размишља” ни на који начин на нивоу људског размишљања. Када комуницирате са Алеком или Сири, конверзацијски капацитети могу изгледати слични људским капацитетима, али реалност је да су рачунарски и да им недостаје људска спознаја. Најновија ера АИ је у великој мери користила машинско учење (МЛ) и дубоко учење (ДЛ), који користе упаривање рачунарских образаца. Ово је довело до АИ система који изгледају као склоности налик људима. У међувремену, данас не постоји ниједна вештачка интелигенција која има привид здравог разума нити има било какво когнитивно чудо снажног људског размишљања.

МЛ/ДЛ је облик подударања рачунарских образаца. Уобичајени приступ је да прикупљате податке о задатку доношења одлука. Податке уносите у МЛ/ДЛ рачунарске моделе. Ти модели настоје да пронађу математичке обрасце. Након проналажења таквих образаца, ако су пронађени, АИ систем ће користити те обрасце када наиђе на нове податке. Након представљања нових података, обрасци засновани на „старим“ или историјским подацима се примењују да би се донела тренутна одлука.

Мислим да можете погодити куда ово води. Ако су људи који су доносили одлуке по узору на инкорпорирали нежељене предрасуде, шансе су да подаци то одражавају на суптилан, али значајан начин. Машинско учење или дубоко учење упаривање рачунарских образаца ће једноставно покушати да математички опонаша податке у складу са тим. Не постоји никакав привид здравог разума или других разумних аспеката моделирања направљеног од вештачке интелигенције.

Штавише, ни програмери вештачке интелигенције можда неће схватити шта се дешава. Тајна математика у МЛ/ДЛ-у може отежати откривање сада скривених предрасуда. С правом се надате и очекујете да ће програмери вештачке интелигенције тестирати потенцијално скривене предрасуде, иако је ово теже него што се чини. Постоји велика шанса да чак и уз релативно опсежна тестирања, постоје пристрасности и даље уграђене у моделе подударања образаца МЛ/ДЛ.

Могли бисте донекле користити чувену или злогласну изреку смеће-у-ђубре-ван. Ствар је у томе што је ово више слично предрасудама које се подмукло уносе као пристрасности потопљене у АИ. Алгоритам доношења одлука (АДМ) АИ аксиоматски постаје оптерећен неједнакостима.

Није добро.

Вратимо се сада на тему лова на пристрасност АИ.

За оне од вас који размишљају о покушају лова на уцјене са пристрасношћу АИ, ево мојих препоручених седам кључних корака о томе како најбоље поступити:

1) Проценити. Процијените прикладност АИ пристрасног лова на уцјене за ваше околности и према вашим системима АИ

2) Дизајн. Дизајнирајте одговарајући приступ АИ пристрасности у лову на главе

3) Имплементирај. Имплементирајте и објавите своје подухвате лова на главе у вези са АИ пристрасношћу

4) Поље. Упишите захтеве за награду за АИ пристрасност и обрадите у складу са тим

5) Поправити. Поправите или прилагодите своју вештачку интелигенцију у складу са овим откривеним изложеностима АИ пристрасности

6) подесити. Прилагодите АИ пристрасност лов на уцене по потреби

7) Прекини. Прекините АИ пристрасност лову на главе када више није потребна

У мом низу горњих корака, имајте на уму да помињем да ћете вероватно желети да поправите или прилагодите своју АИ на основу утврђивања да наводно АИ пристрасност заиста постоји у вашем АИ систему. Ово има пуно смисла. Готово сигурно бисте желели да подупрете све откривене пристрасности АИ. Размислите о правним (и етичким) последицама ако то не учините. Једна је ствар тврдити да нисте знали да постоји пристрасност АИ и да сте јој дозволили да постоји, док је много нестабилније имати у евиденцији да сте били свесни пристрасности АИ и да нисте ништа предузели по том питању.

Природа и степен исправке или прилагођавања АИ би наравно зависили од тога колико су значајне пристрасности вештачке интелигенције и колико су проблеми дубоко укорењени. Ако будете имали среће, можда ће скромна количина измена у АИ поправити ствари. Други потенцијал је да ћете можда морати да препишете АИ у потпуности. За МЛ/ДЛ тип АИ, ово би могло захтевати повратак на таблу за цртање и почетак испочетка са потпуно новим скупом података и очишћеним МЛ/ДЛ моделом. Разговарао сам о појављивању уништавања вештачке интелигенције или уништавања вештачке интелигенције као потенцијалног правног лека против неугодне вештачке интелигенције, види линк овде.

Једно питање које треба размотрити је да ли бисте желели да ловци на главе можда ураде више од само да идентификују постојање пристрасности вештачке интелигенције. На пример, можете засладити награду тако што ћете назначити да су и предложени поправци добродошли. АИ пристрасност фоунд од стране ловца на главе може бити исплаћена једна назначена награда или награда. Ако ловац на главе такође може да понуди одрживу поправити на пристрасност вештачке интелигенције, тада би им се могла доделити додатна награда.

Неки тврде да је ово мост предалеко. Кажу да би ловци на уцјене требало да буду искључиво фокусирани на проналажење пристрасности АИ. Створићете гомилу нежељених штетних последица позивајући их да такође предложе поправке. Нека ствари буду једноставне. Циљ је да се што више погледа на откривање АИ предрасуда, тако да можете одлучити шта даље. Немојте замутити воду.

Трновит аспект који треба да се открије подразумева величину награде или награде за ловце на главе који истински откривају пристрасност вештачке интелигенције. Желите да исплата буде демонстративна. Без довољно високе награде, нећете добити много ловаца на главе или они неће бити посебно жељни да траже АИ предрасуде у вашим АИ системима. Уместо тога, могли би да се концентришу на друге подухвате АИ пристрасности.

Штавише, као што је поменуто, желите да покушате да потиснете порив ловаца на главе да своја открића пристрасности вештачке интелигенције претворе у друге облике злата. Ако се награда чини слабашном, то би могло натерати ловце на главе да траже друге веће исплате. Они би могли да приступе рансомваре-у према вама. Они могу изјавити да имају сочну пристрасност АИ за коју би конкурент волео да зна и коју би могао да употреби против ваше фирме тако што ће рекламирати да АИ пристрасност постоји у вашој АИ. Тако они продају откривену АИ пристрасност понуђачу са највишом ценом. И тако даље.

Претпоставља се да ако поставите награду на изузетно висок распон, такође тражите потенцијалне проблеме. Ово би могло привући све врсте лудих ловаца на главе. Они би заузврат могли затрпати друштвене медије магловитим тврдњама да су открили мноштво пристрасности АИ, чинећи то ради сопствене самопромоције и без да су заправо проболи било какве пристрасности АИ. У извесном смислу, ваша повећана награда нехотице осветљава вашу вештачку интелигенцију и подстиче гомилу неотесаних мољаца да их, сходно томе, погубно привуче ужарени светлосни сноп.

Још једно разматрање укључује доступност вашој вештачкој интелигенцији.

Да би омогућили АИ могућност лова на главе, ловци на главе морају довољно да добију приступ вашој вештачкој интелигенцији. Неће имати много среће у проналажењу АИ предрасуда ако су потпуно закључани. Али не желите да одустанете од заштите од сајбер безбедности јер би то могло у потпуности да угрози ваш систем вештачке интелигенције.

Можете покушати да натерате ловце на главе да потпишу различите правно обавезујуће декларације, а затим им дате потребан приступ. Неки ловци на главе се неће допасти такав приступ. Њихово гледиште је да ће радити само оно што им дозволи било који јавно доступан и отворен пут. Они су, такорећи, слободни, и не воле да их седлају, такорећи. Ако их натерате да ставе свој потпис на застрашујуће правне документе, многи од њих ће избећи потрагу за АИ пристрасностима у вашој АИ. Или ће се можда наљутити на вашу правну рукавицу и одлучити да ће видети шта могу да пронађу путем јавних средстава, чинећи то са можда оштром жељом да вам покажу колико сте заиста рањиви.

Имам још један угао од којег би ти се могла завртјети глава.

Ловац на уцене који је упућен у вештачку интелигенцију могао би да одлучи да осмисли систем вештачке интелигенције који може да испита вашу вештачку интелигенцију и евентуално открије АИ пристрасности у вашој АИ. Ово је произвођач алата који се одлучује да направи алат за обављање посла, а не да сам обавља ручни рад. Уместо да мукотрпно испитује вашу вештачку интелигенцију, ловац на уцене који је упућен у вештачку интелигенцију троши своје време на смишљање АИ алата који ради исту ствар. Затим користе АИ алат на вашој АИ. Лепота је такође у томе што они вероватно могу поново да користе АИ алат на било коме другом који такође нуди прилику за лов на главе на њиховој АИ.

Знам шта вероватно мислите. Ако се АИ алат може осмислити да испита АИ за пристрасности, произвођач АИ који се испитује због пристрасности АИ треба или да направи такав алат АИ или да га купи за сопствену употребу. У теорији, они тада не морају да се боре са целим карневалом ловаца на главе, за почетак. Само користите АИ да пронађете њихове АИ пристрасности.

Да, ово је нешто што можете очекивати да ће се постепено појавити. У међувремену, главни ослонац ових напора ће се вероватно састојати од АИ програмера који раде на лову на главе. Они би могли да користе различите алате да помогну у својим напорима, али у блиској будућности, мало је вероватно да ће једноставно безумно аутоматски укључити АИ алат и одспавати тако да алатка ради у целости тражећи АИ пристрасност за њих.

Још нисмо тамо.

У овом тренутку ове тешке дискусије, кладим се да сте жељни неких илустративних примера који би могли показати ову тему. Постоји посебан и сигурно популаран скуп примера који су ми блиски. Видите, у мом својству стручњака за вештачку интелигенцију, укључујући етичке и правне последице, од мене се често тражи да идентификујем реалне примере који приказују дилеме етике вештачке интелигенције како би се донекле теоријска природа теме могла лакше схватити. Једна од најзанимљивијих области која живописно представља ову етичку дилему АИ је појава правих самовозећих аутомобила заснованих на вештачкој интелигенцији. Ово ће послужити као згодан случај употребе или пример за широку дискусију о овој теми.

Ево онда важног питања о којем вреди размислити: Да ли појављивање правих самовозећих аутомобила заснованих на вештачкој интелигенцији осветљава ишта о употреби АИ пристрасног лова на уцене, и ако јесте, шта ово показује?

Дозволите ми тренутак да распакујем питање.

Прво, имајте на уму да не постоји људски возач који је укључен у прави ауто који самостално вози. Имајте на уму да се истински самовозећи аутомобили возе преко АИ система за вожњу. Не постоји потреба за људским возачем за воланом, нити је предвиђено да човек управља возилом. За моју опсежну и сталну покривеност аутономних возила (АВ) и посебно аутомобила који се сами возе, погледајте линк овде.

Желео бих да додатно разјасним шта се мисли када говорим о правим самовозећим аутомобилима.

Разумевање нивоа самоуправних аутомобила

Као појашњење, истински самовозећи аутомобили су они у којима АИ вози аутомобил потпуно сам и нема никакве људске помоћи током задатка вожње.

Ова возила без возача се сматрају нивоом 4 и нивоом 5 (погледајте моје објашњење на овај линк овде), док се аутомобил за који је потребан људски возач да заједнички дели напор у вожњи обично сматра нивоом 2 или 3. Аутомобили који заједнички деле задатак вожње су описани као полуаутономни и обично садрже различите аутоматизовани додаци који се називају АДАADA
С (Напредни системи за помоћ возачу).

Још увек не постоји прави самовозећи аутомобил на нивоу 5, а ми још не знамо ни да ли ће то бити могуће постићи, нити колико ће времена требати да се стигне тамо.

У међувремену, напори Нивоа 4 постепено покушавају да стекну одређену вучу пролазећи кроз веома уска и селективна испитивања на јавном путу, иако постоје контроверзе око тога да ли ово тестирање треба дозволити само по себи (сви смо ми заморци на живот или смрт у експерименту који се дешавају на нашим аутопутевима и споредним путевима, неки тврде, погледајте моје извештавање на овај линк овде).

С обзиром да је за полуаутономне аутомобиле потребан људски возач, усвајање тих типова аутомобила неће се знатно разликовати од вожње конвенционалних возила, тако да нема много новог што би се само по себи могло покрити на ову тему (мада, као што ћете видјети у тренутку, следеће постављене тачке су углавном применљиве).

За полуаутономне аутомобиле важно је да јавност буде упозорена на узнемирујући аспект који се појављује у последње време, наиме да упркос оним људским возачима који стално објављују видео записе како заспају за воланом аутомобила нивоа 2 или нивоа 3 сви ми морамо да избегнемо да будемо заведени да верујемо да возач може да им одузме пажњу током вожње током вожње полуаутономног аутомобила.

Ви сте одговорна страна за радње у возилу, без обзира на то колико се аутоматизација може убацити у ниво 2 или ниво 3.

Самовозећи аутомобили и АИ пристрасност Лов на главе

За права возила са самосталним управљањем нивоа 4 и ниво 5 неће бити људског возача који је укључен у задатак вожње.

Сви путници биће путници.

АИ вози вожњу.

Један аспект о којем треба одмах разговарати подразумева чињеницу да АИ укључен у данашње системе АИ вожње није осећајан. Другим речима, АИ је у целини колектив рачунарског програмирања и алгоритама, и сигурно није у стању да расуђује на исти начин на који то могу људи.

Зашто овај додатни нагласак на томе да АИ није свестан?

Зато што желим да подвучем да, када расправљам о улози система за управљање АИ, не приписујем људске особине АИ. Имајте на уму да данас постоји стална и опасна тенденција антропоморфизације АИ. У суштини, људи данашњој уметничкој интелигенцији додељују осећај сличан човеку, упркос непорецивој и неспорној чињеници да још увек не постоји такав уметни интелигенција.

Уз то појашњење, можете да замислите да систем управљања уметном интелигенцијом неће некако „знати“ о аспектима вожње. Вожња и све што то подразумева мораће да се програмирају као део хардвера и софтвера самовозећег аутомобила.

Заронимо у безброј аспеката који се играју на ову тему.

Прво, важно је схватити да нису сви самовозећи аутомобили са вештачком интелигенцијом исти. Сваки произвођач аутомобила и технолошка фирма која се самостално вози користи свој приступ осмишљавању аутомобила који се самостално возе. Као такав, тешко је дати свеобухватне изјаве о томе шта ће АИ системи за вожњу учинити или не.

Штавише, кад год констатују да систем управљања АИ не ради неку посебну ствар, то касније могу преузети и програмери који у ствари програмирају рачунар да то уради. Корак по корак, системи вожње АИ се постепено побољшавају и проширују. Постојеће ограничење данас можда више неће постојати у будућој итерацији или верзији система.

Надам се да то пружа довољан низ упозорења у основи онога што ћу сада да кажем.

У својим колумнама, већ сам опширно расправљао о употреби ловаца на главе оријентисаних на бубе у области аутономних возила и аутомобила који се сами возе. Овај приступ се заиста догодио у овој ниши. Постоје уобичајене расправе о томе да ли је то добра идеја или не. Напори су обично били ограничене природе, често су били релативно тихи.

Слично томе, дискурс може да настане када се фокус помери ка тражењу пристрасности вештачке интелигенције, а не тражењу системских грешака саме по себи. Неки сугеришу да је проклетство ако се ради, проклетство ако не загонетка.

Ево зашто.

Прво, да буде јасно, постоје бројни начини на које ће аутономна возила и аутомобили који се сами возе бити подложни садржавању АИ предрасуда, погледајте моје извештавање на линк овде линк овде, само да поменемо само неке. Произвођачи аутомобила и компаније за самовозеће аутомобиле изгледало би мудро да покушају да спрече да се те пристрасности АИ појаве у њиховим системима АИ. Правна и етичка бура против таквих фирми ће несумњиво бити интензивна.

Да ли је коришћење покушаја лова на уцене са пристрасношћу вештачке интелигенције одговарајући приступ у овом специфичном контексту?

Један од одговора је да да, ово ће бити згодно и обезбедити обиље „бесплатних“ скупова нових очију како бисте покушали да ухватите све уграђене АИ предрасуде у аутомобилу који се самостално вози са АИ или слично. Већина програмера вештачке интелигенције који праве аутомобиле који се сами возе заузети су прављењем вештачке интелигенције која може безбедно да вози аутомобил од тачке А до тачке Б. Они су заокупљени том основном способношћу и немају ни времена ни пажње према било каквим предрасудама АИ које би могле бити негде у њихов АИ.

Други одговор је да не, дозвољавање лова на главе за аутономна возила и самовозеће аутомобиле по било којој основи, било због грешака или АИ предрасуда, само треба жестоко избегавати. Аргумент је да су ова возила и њихова вештачка интелигенција калибра живота или смрти. Петљање са АИ на било који начин може бити на неки начин погубно за АИ и утицати на оно што систем вожње АИ ради.

Контрааргумент овој последњој тачки је да ловци на главе не би требало да буду у стању да измене вештачку интелигенцију коју испитују. Дакле, не постоји опасност да се петљају са АИ и изазову да АИ у овом контексту изненада постане луди систем за управљање АИ. Ловци на главе имају приступ само за читање. Дозволити им да иду даље било би прилично глупо и велика грешка.

Контрааргумент том противаргументу је да дозвољавањем и охрабривањем ловаца на главе да испитају вашу вештачку интелигенцију, цела ствар постаје мучна. Ти ловци на главе би могли да смисле начине да искористе све пронађене грешке или предрасуде. Ти подвиги заузврат могу бити у лажне сврхе. Било би вам боље да не позивате „провалнике“ у свој дом, да тако кажем. Једном када изваде зглоб, на крају ћете бити у гомили невоља.

За оне који имају АИ системе мањег од величине живота или смрти, верују да су последице лова на уцене који пође по злу много мање ризичне. Може бити. С друге стране, ако је фирма уложила свој новац у систем вештачке интелигенције који ловци на главе успевају да узурпирају, можете претпоставити да ће репутација и друге потенцијалне штете и даље штетити.

Нема бесплатног ручка када је у питању АИ пристрасност лов на главе.

За сада брза завршна напомена.

Када је озлоглашени одметник Џеси Џејмс тражен током Старог Запада, штампан је постер „Тражи се“ на којем је понуђена награда од 5,000 долара за његово хватање (наводећи „мртав или жив“). Била је то прилично огромна сума новца у то време. Један од чланова његове банде одлучио је да убије Џесија и покупи награду. Претпостављам да то показује колико ефикасна може бити награда.

Да ли ће употреба ловаца на уцене бити добра ствар или ће бити лоша?

Ако одлучите да покренете подухват ловаца на уцене са пристрасношћу вештачке интелигенције, предлажем да држите очи широм отворене и да стално гледате преко рамена. Ово је мудро за вас и вашу вештачку интелигенцију. Никада не знате шта би се могло догодити, укључујући и то да поверљиви ловац на главе на неки начин кришом убацује пристрасност АИ у вашу АИ и виче свету да су пронашли бескрупулозну АИ пристрасност у вашој АИ. Можда чинећи то у дрском и огромном покушају тражења награде, плус проглашавање себе херојем који је у суштини добио хваљеног Џесија Џејмса.

Кад боље размислим, разумној вештачкој интелигенцији се вероватно неће свидети та идеја о узнемирујућој одредби живог или мртвог, могло би се тако маловољно спекулисати.

Извор: хттпс://ввв.форбес.цом/ситес/ланцеелиот/2022/07/16/аи-етхицс-цаутиоусли-ассессинг-вхетхер-офферинг-аи-биасес-хунтинг-боунтиес-то-цатцх-анд-наб- етички-опаки-потпуно-аутономни-системи-је-разборити-или-узалудни/