Generative AI ChatGPT може обезпокоително да погълне вашите лични и поверителни данни, предупреждава AI етиката и закона за AI

Знаете ли какво се случва с вашите поверителни данни, които въвеждате в генериращо AI приложение, като напр … [+] ChatGPT? Думи към мъдрите.

Гети

Сега виждате данните си, сега не.

Междувременно вашите ценни данни са станали част от колектива, така да се каже.

Имам предвид аспект, който може да е доста изненадващ за тези от вас, които нетърпеливо и сериозно използват най-новото в областта на изкуствения интелект (AI). Данните, които въвеждате в AI приложение, потенциално изобщо не са изцяло лични за вас и само за вас. Може да се окаже, че вашите данни ще бъдат използвани от производителя на AI, за да се предполага, че се стремят да подобрят своите AI услуги или могат да бъдат използвани от тях и/или дори от техните съюзни партньори за различни цели.

Вече сте предупредени.

Това предаване на вашите данни се случва по най-безобидния начин и от потенциално хиляди или от порядъка на милиони хора. Как така? Има вид AI, известен като генеративен AI, който наскоро привлече големи заглавия и прикова вниманието на широката общественост. Най-забележителното от съществуващите генеративни AI приложения е едно, наречено ChatGPT, което е създадено от фирмата OpenAI.

Предполага се, че има около милион регистрирани потребители за ChatGPT. Много от тези потребители изглежда се радват да изпробват това най-горещо и най-ново генеративно AI приложение. Процесът е изключително прост. Въвеждате някакъв текст като подкана и готово, приложението ChatGPT генерира текстов изход, който обикновено е под формата на есе. Някои наричат това текст към текст, въпреки че аз предпочитам да го обознача като текст към есе, тъй като това многословие има повече ежедневен смисъл.

В началото един начинаещ потребител вероятно ще въведе нещо забавно и безгрижно. Разкажете ми за живота и времето на Джордж Вашингтон, някой може да влезе като подкана. След това ChatGPT ще изготви есе за нашия легендарен първи президент. Есето ще бъде напълно свободно и ще ви е трудно да разберете, че е създадено от приложение с изкуствен интелект. Вълнуващо нещо да се случи.

Вероятностите са, че след като си играят известно време, сегмент от начинаещи потребители ще се наситят и евентуално ще изберат да спрат да си играят с ChatGPT. Сега те са преодолели своя FOMO (страх от пропускане), правейки го след експериментиране с приложението AI, за което изглежда почти всички говорят. Свършено дело.

Някои обаче ще започнат да мислят за други и по-сериозни начини за използване на генериращ AI.

Може би използвайте ChatGPT, за да напишете онази бележка, която шефът ви е карал да напишете. Всичко, което трябва да направите, е да предоставите подкана с точките, които имате предвид, и следващото нещо, което знаете, е генерирана цяла бележка от ChatGPT, която ще накара шефа ви да се гордее с вас. Копирате полученото есе от ChatGPT, поставяте го в официалния шаблон на компанията във вашия текстообработващ пакет и изпращате стилния меморандум по имейл на вашия мениджър. Вие струвате милион долара. И използвахте мозъка си, за да намерите удобен инструмент, който да свърши тежката работа вместо вас. Потупайте се по гърба.

Това не е всичко.

Да, има още.

Имайте предвид, че генеративният AI може да изпълнява множество други задачи, свързани с писането.

Да предположим например, че сте написали някакъв разказ за ценен клиент и много искате да направите преглед на материала, преди да излезе навън.

Лесна работа.

Поставяте текста на вашия разказ в подкана на ChatGPT и след това инструктирате ChatGPT да анализира текста, който сте съставили. Полученото изведено есе може да се задълбочи във вашата формулировка и за ваша приятна изненада ще се опита привидно да провери значението на това, което сте казали (надминавайки ролята на инструмент за проверка на правописа или граматичен анализатор). Приложението AI може да открие грешки в логиката на вашия разказ или може да открие противоречия, които не сте осъзнавали, че са в собственото ви писане. Това е почти все едно сте наели хитър човешки редактор, който да огледа черновата ви и да предостави литария от полезни предложения и забелязани притеснения (добре, искам категорично да заявя, че не се опитвам да антропоморфизирам приложението AI, особено че човешкият редактор е човек, докато приложението AI е просто компютърна програма).

Слава богу, че използвахте генеративното AI приложение, за да разгледате внимателно своя ценен писмен разказ. Вие несъмнено бихте предпочели AI да открие тези обезпокоителни писмени проблеми, а не след изпращане на документа до вашия ценен клиент. Представете си, че сте съставили разказа за някой, който ви е наел да измислите доста жизненоважно описание. Ако сте дали оригиналната версия на клиента, преди да направите преглед на приложението с изкуствен интелект, може да изпитате голям срам. Клиентът почти сигурно би таил сериозни съмнения относно вашите умения да вършите исканата работа.

Да вдигнем залога.

Помислете за създаването на правни документи. Това очевидно е особено сериозен въпрос. Думите и начина, по който са съставени, могат да означават енергична правна защита или мрачно правно бедствие.

В моите текущи изследвания и консултации, аз взаимодействам редовно с много адвокати, които са силно заинтересовани от използването на AI в областта на правото. Различни програми на LegalTech се свързват с възможностите на AI. Адвокатът може да използва генеративен AI, за да състави проект на договор или да състави други правни документи. Освен това, ако адвокатът сам е направил първоначална чернова, той може да предаде текста на генеративно AI приложение като ChatGPT, за да погледне и да види какви дупки или пропуски могат да бъдат открити. За повече относно това как адвокатите и правната сфера избират да използват AI, вижте дискусията ми на връзката тук.

Въпреки това сме готови да се борим с това.

Адвокат взема изготвен договор и копира текста в подкана за ChatGPT. Приложението AI прави преглед за адвоката. Оказва се, че няколко грешки са открити от ChatGPT. Адвокатът преразглежда договора. Те могат също така да поискат от ChatGPT да им предложи преформулиране или повторение на съставения текст. След това се произвежда нова и по-добра версия на договора от генериращото AI приложение. Адвокатът грабва изведения текст и го поставя във файл за текстообработка. Писмото отива при техния клиент. Мисията изпълнена.

Можете ли да познаете какво също се случи току-що?

Зад кулисите и под капака договорът може да е бил погълнат като риба в устата на кит. Въпреки че този използващ AI адвокат може да не го осъзнае, текстът на договора, поставен като подкана в ChatGPT, може потенциално да бъде погълнат от приложението AI. Сега е фураж за съвпадение на шаблони и други изчислителни тънкости на приложението AI. Това от своя страна може да се използва по различни начини. Ако има поверителни данни в черновата, това също потенциално вече е в границите на ChatGPT. Вашата подкана, предоставена на приложението AI, сега е привидно част от колектива по един или друг начин.

Освен това изведеното есе също се счита за част от колектива. Ако сте помолили ChatGPT да промени черновата вместо вас и да представи новата версия на договора, това се тълкува като изведено есе. Резултатите от ChatGPT също са вид съдържание, което може да бъде запазено или трансформирано по друг начин от приложението AI.

О, може невинно да сте издали лична или поверителна информация. Не е добре. Плюс това, вие дори няма да сте наясно, че сте го направили. Не бяха вдигнати знамена. Клаксон не изсвири. Никакви мигащи светлини не са изгаснали, за да ви шокират в реалността.

Можем да предвидим, че неюристите лесно могат да допуснат такава грешка, но опитен адвокат да направи същата грешка като новобранец е почти невъобразимо. Въпреки това вероятно в момента има юристи, които правят същата потенциална грешка. Те рискуват да нарушат забележителен елемент от привилегията адвокат-клиент и евентуално да нарушат моделните правила за професионално поведение (MRPC) на Американската адвокатска асоциация (ABA). По-специално: „Адвокатът няма право да разкрива информация, свързана с представителството на клиент, освен ако клиентът не даде информирано съгласие, разкриването не е имплицитно разрешено с цел извършване на представителството или разкриването е разрешено от параграф (b)“ (цитирано от MRPC и за които изключенията, свързани с подраздел b, изглежда не включват използването на генериращо AI приложение по незащитен начин).

Някои адвокати може да се опитат да извинят престъплението си, като твърдят, че не са технически магьосници и че не биха имали готови средства да разберат, че въвеждането на поверителна информация от тях в генеративно AI приложение може по някакъв начин да бъде нещо като нарушение. ABA изясни, че задължението на адвокатите включва да са в крак с AI и технологиите от правна гледна точка: „За да поддържа необходимите знания и умения, адвокатът трябва да бъде в крак с промените в закона и неговата практика, включително ползите и рисковете, свързани със съответната технология, да участва в продължаващо обучение и образование и да спазва всички изисквания за продължаващо правно образование, на които подлежи адвокатът“ (съгласно MRPC).

Няколко разпоредби влизат в това подобие на правно задължение, включително поддържане на поверителна информация на клиента (Правило 1.6), защита на собствеността на клиента като данни (Правило 1.15), правилно общуване с клиент (Правило 1.4), получаване на информирано съгласие на клиента (Правило 1.6), и осигуряване на компетентно представителство от името на клиент (Правило 1.1). Освен това има и малко известната, но много забележителна резолюция, фокусирана върху AI, приета от ABA: „Че Американската асоциация на юристите призовава съдилищата и адвокатите да се справят с възникващите етични и правни проблеми, свързани с използването на изкуствен интелект („AI“) в практиката на правото, включително: (1) пристрастност, обяснимост и прозрачност на автоматизираните решения, взети от ИИ; (2) етично и полезно използване на AI; и (3) контрол и надзор на AI и доставчиците, които предоставят AI.“

Думи на мъдрите за моите юридически приятели и колеги.

Същността на въпроса е, че почти всеки може да се затрудни, когато използва генериращ AI. Неюристите могат да го направят поради предполагаемата си липса на правна проницателност. Адвокатите също могат да направят това, може би влюбени в AI или без да си поемат дълбоко дъх и да размишляват какви правни последици могат да възникнат при използването на генеративен AI.

Ние всички потенциално сме в една лодка.

Трябва също така да осъзнаете, че ChatGPT не е единственото генеративно AI приложение в блока. Има и други генеративни AI приложения, които можете да използвате. Те също вероятно са изрязани от една и съща тъкан, а именно, че входовете, които въвеждате като подкани, и резултатите, които получавате като генерирани изходни есета, се считат за част от колектива и могат да бъдат използвани от производителя на AI.

В днешната колона ще разопаковам естеството на начина, по който данните, които въвеждате, и данните, които получавате от генериращия AI, могат да бъдат потенциално компрометирани по отношение на поверителността и поверителността. Създателите на AI предоставят своите лицензионни изисквания и би било разумно да прочетете тези жизненоважни условия, преди да започнете активно да използвате AI приложение с някакво подобие на реални данни. Ще ви преведа през пример за такова лицензиране, правейки го за приложението ChatGPT AI.

Във всичко това идват множество съображения относно етиката на ИИ и Закона за ИИ.

Моля, имайте предвид, че има текущи усилия за внедряване на етични принципи на AI в разработването и внедряването на приложения с AI. Все по-голям контингент от загрижени и някогашни етици на AI се опитват да гарантират, че усилията за разработване и приемане на AI вземат предвид възгледа за правене AI за добро и предотвратяване AI за лошо. По същия начин има предложени нови закони за изкуствения интелект, които се обединяват като потенциални решения за предпазване на начинанията на изкуствения интелект от нарушаване на правата на човека и други подобни. За моето текущо и обширно отразяване на етиката на ИИ и Закона за ИИ вижте връзката тук намлява връзката тук, Само за да назовем няколко.

Съществуват значителни етични нюанси и разпоредби на AI, свързани с това как производителите на AI могат или трябва да се справят с данните или информацията, които изглеждат частни или поверителни за техните потребители. Вероятно знаете също, че куп съществуващи закони засягат същината на начина, по който данните трябва да се обработват от технологичните субекти. Шансовете също са, че новопредложените закони за ИИ също ще преминат в същата тази територия. Вижте например моето отразяване на Законът за правата на AI и други правни спорове, които се водят относно ИИ, при връзката тук.

Ето основния извод от тази дискусия:

Бъдете много, много, много внимателни какви данни или информация избирате да поставите във вашите подкани, когато използвате генериращ AI, и по същия начин бъдете изключително внимателни и предвидете какви видове изходни есета може да получите, тъй като резултатите също могат да бъдат усвоени.

Това означава ли, че не трябва да използвате генеративен AI?

Не, изобщо не казвам това.

Използвайте генериращ AI до насита. Същността е, че трябва да внимавате как го използвате. Разберете какъв вид лицензионни условия са свързани с използването. Решете дали можете да живеете с тези условия. Ако има начини да информирате производителя на AI, че искате да се позовете на определени видове добавени защити или разрешения, уверете се, че го правите.

Ще спомена и още един аспект, който осъзнавам, че ще вбеси някои хора. Ето го. Въпреки каквито и да са условията за лицензиране, вие също трябва да приемете, че има възможност тези изисквания да не бъдат напълно спазени. Нещата могат да се объркат. Нещата могат да се плъзнат между пукнатините. В крайна сметка, разбира се, може да имате съдебно дело срещу производител на изкуствен интелект за неспазване на техните условия, но това е малко след като конят вече е излязъл от обора.

Потенциално много сигурен начин да продължите би бил да настроите свой собствен екземпляр на вашите собствени системи, независимо дали в облака или вътрешно (и, ако приемем, че се придържате към правилните предпазни мерки за киберсигурност, които някои наистина не го правят и са по-лоши в техния собствен облак, отколкото да използват облака на доставчика на софтуера). Малко неприятен проблем обаче е, че малко от генеративните широкомащабни приложения на AI позволяват това в момента. Всички те почти работят само на базата на нашия облак. Малцина са направили достъпна опцията да бъде издълбан цял екземпляр само за вас. Предвидих, че постепенно ще видим тази опция да се появи, въпреки че в началото ще бъде доста скъпа и донякъде сложна, вижте моите прогнози на връзката тук.

Как иначе особено интелигентните и изключително проницателни хора попадат в блатото на ерозията на поверителността на данните или информацията?

Привлекателността на тези генеративни AI приложения е доста магнетична, след като започнете да използвате едно. Стъпка по стъпка се оказвате хипнотизирани и избирате да навлезете все по-навътре във водите на генеративния AI. Следващото нещо, което знаете, е, че с готовност предавате собствено съдържание, което трябва да се пази лично и поверително, в генеративно AI приложение.

Устояйте на желанието и, моля, въздържайте се постепенно да попадате в неприятен капан.

За бизнес лидери и ръководители от най-високо ниво, същото предупреждение важи за вас и всички хора във вашата компания. Старшите изпълнителни директори също се увличат от ентусиазма и удивлението от използването на генеративен AI. Те наистина могат да объркат и потенциално да въведат секретна информация от най-високо ниво в приложение с изкуствен интелект.

Освен това те може да имат широки лиги от служители, които също си играят с генеративния AI. Много от тези иначе внимателни служители безсмислено и блажено въвеждат личната и поверителна информация на компанията в тези AI приложения. Според последните новини, Amazon очевидно е открил, че някои служители въвеждат различна частна информация в ChatGPT. Твърди се, че вътрешно е изпратено правно ориентирано предупреждение, за да бъдете внимателни при използването на неустоимото AI приложение.

Като цяло има малко ирония в нарастващите явления на служители, които волю-неволю въвеждат поверителни данни в ChatGPT и друг генеративен AI. Позволете ми да уточня. Днешните модерни компании обикновено имат строги политики за киберсигурност, които старателно са изработили и внедрили. Съществуват множество технологични защити. Надеждата е да се предотвратят случайни изпускания на важни неща. Непрекъснато биене на барабани е да внимавате, когато посещавате уебсайтове, внимавайте, когато използвате неодобрени приложения и т.н.

Заедно идват генеративни AI приложения като ChatGPT. Новините за AI приложението преминават през покрива и привличат широко внимание. Възниква лудост. Хората в тези компании, които имат всички тези защити за киберсигурност, избират да се насочат към генеративно AI приложение. Отначало си играят безгрижно с него. След това започват да въвеждат фирмени данни. Wham, те сега потенциално изложиха информация, която не трябваше да бъде разкривана.

Блестящата нова играчка, която магически заобикаля милионите долари разходи за защита на киберсигурността и непрекъснато обучение за това какво да не правите. Но, хей, вълнуващо е да използваш генеративен AI и да си част от тълпата „вътре“. Явно това е от значение.

Вярвам, че разбирате идеята ми да бъда подчертано предпазлив.

Нека след това да разгледаме отблизо как генеративният AI технически се справя с текста на подканите и изведените есета. Ще проучим и някои от условията за лицензиране, като използваме ChatGPT като пример. Моля, имайте предвид, че няма да покрия цялата гама от тези лицензионни елементи. Уверете се, че сте включили своя правен съветник за генеративните AI приложения, които решите да използвате. Освен това лицензирането се различава от производител на AI до производител на AI, освен това даден производител на AI може да избере да промени лиценза си, така че не забравяйте да останете бдителни относно това, което предвижда последната версия на лиценза.

Предстои ни вълнуващо разопаковане на тази опияняваща тема.

Първо, трябва да се уверим, че всички сме на една и съща страница относно това, от което се състои Generative AI, както и какво представлява ChatGPT. След като покрием този основен аспект, можем да извършим убедителна оценка на огледалната метафора, свързана с този тип ИИ.

Ако вече сте добре запознати с Generative AI и ChatGPT, може би можете да прегледате следващия раздел и да продължите с раздела, който го следва. Вярвам, че всеки друг ще намери за поучителни жизненоважните подробности по тези въпроси, като прочете внимателно раздела и се запознае по-бързо.

Кратък пример за Generative AI и ChatGPT

ChatGPT е интерактивна и ориентирана към разговори AI система с общо предназначение, по същество привидно безобиден общ чатбот, но въпреки това се използва активно и жадно от хора по начини, които хващат мнозина напълно неподготвени, както ще обясня скоро. Това AI приложение използва техника и технология в областта на AI, която често се нарича Генеративен AI. AI генерира изходи като текст, което прави ChatGPT. Други базирани на генериране AI приложения произвеждат изображения като картини или произведения на изкуството, докато други генерират аудио файлове или видеоклипове.

Ще се съсредоточа върху текстово-базираните генеративни AI приложения в тази дискусия, тъй като ChatGPT прави това.

Генеративните AI приложения са изключително лесни за използване.

Всичко, което трябва да направите, е да въведете подкана и приложението AI ще генерира за вас есе, което се опитва да отговори на вашата подкана. Съставеният текст ще изглежда така, сякаш есето е написано от човешка ръка и ум. Ако въведете подкана, която казва „Разкажете ми за Ейбрахам Линкълн“, генеративният AI ще ви предостави есе за Линкълн. Това обикновено се класифицира като генериращ AI, който изпълнява текст към текст или някои предпочитат да го наричат текст към есе изход. Както споменахме, има и други режими на генериращ AI, като текст към изкуство и текст към видео.

Първата ви мисъл може да е, че тази генеративна способност не изглежда толкова голяма работа по отношение на създаването на есета. Можете лесно да направите онлайн търсене в Интернет и лесно да намерите тонове и тонове есета за президента Линкълн. Предимството в случая на генеративния AI е, че генерираното есе е относително уникално и предоставя оригинална композиция, а не имитация. Ако се опитате да намерите създаденото от AI есе онлайн някъде, е малко вероятно да го откриете.

Generative AI е предварително обучен и използва сложна математическа и изчислителна формулировка, която е създадена чрез изследване на модели в писмени думи и истории в мрежата. В резултат на изследването на хиляди и милиони писмени пасажи, AI може да избълва нови есета и истории, които са смесица от това, което е намерено. Чрез добавяне на различни вероятностни функционалности, полученият текст е почти уникален в сравнение с това, което е използвано в набора за обучение.

Ето защо се вдигна шум, че учениците могат да мамят, когато пишат есета извън класната стая. Учителят не може просто да вземе есето, което измамните ученици твърдят, че е тяхно собствено писане, и да търси да разбере дали е копирано от друг онлайн източник. Като цяло няма да има окончателно съществуващо онлайн есе, което да отговаря на генерираното от AI есе. Като цяло учителят ще трябва неохотно да приеме, че ученикът е написал есето като оригинално произведение.

Има допълнителни опасения относно генеративния AI.

Един основен недостатък е, че есетата, създадени от генеративно базирано AI приложение, могат да имат различни вградени неистини, включително явно неверни факти, факти, които са подвеждащо изобразени, и очевидни факти, които са изцяло изфабрикувани. Тези измислени аспекти често се наричат форма на AI халюцинации, крилата фраза, която не одобрявам, но за съжаление изглежда все пак набира популярност (за моето подробно обяснение защо това е скапана и неподходяща терминология, вижте моето отразяване на връзката тук).

Бих искал да изясня един важен аспект, преди да навлезем в дебелите неща по тази тема.

В социалните медии имаше някои странни твърдения за Генеративен AI като се твърди, че тази последна версия на AI всъщност е разумен AI (не, грешат!). Тези от AI Ethics и AI Law са особено притеснени от тази процъфтяваща тенденция на открити претенции. Може да кажете учтиво, че някои хора преувеличават какво всъщност може да направи днешният AI. Те приемат, че AI има възможности, които все още не сме успели да постигнем. Това е жалко. Още по-лошо, те могат да позволят на себе си и на другите да попаднат в тежки ситуации поради предположението, че ИИ ще бъде разумен или подобен на човек, за да може да предприеме действия.

Не антропоморфизирайте AI.

Правейки това, ще ви хванат в лепкав капан на твърдо разчитане на очакване AI да прави неща, които не е в състояние да извърши. Като се има предвид това, най-новият генеративен AI е сравнително впечатляващ за това, което може да направи. Имайте предвид обаче, че има значителни ограничения, които трябва непрекъснато да имате предвид, когато използвате което и да е генериращо AI приложение.

Ако се интересувате от бързо разрастващата се суматоха около ChatGPT и Generative AI като цяло, правя фокусирана серия в моята колона, която може да намерите за информативна. Ето един поглед, в случай че някоя от тези теми ви хареса:

1) Прогнози за предстоящ напредък на генериращия AI. Ако искате да знаете какво вероятно ще се развие около AI през 2023 г. и след това, включително предстоящия напредък в генеративния AI и ChatGPT, ще искате да прочетете моя изчерпателен списък с прогнози за 2023 г. връзката тук.
2) Генеративен изкуствен интелект и съвети за психично здраве. Избрах да прегледам как генеративният AI и ChatGPT се използват за съвети за психично здраве, обезпокоителна тенденция, според моя целеви анализ на връзката тук.
3) Основи на Generative AI и ChatGPT. Тази част изследва ключовите елементи на това как работи генеративният AI и по-специално се задълбочава в приложението ChatGPT, включително анализ на шума и фанфарите, на връзката тук.
4) Напрежение между учители и ученици относно генериращия AI и ChatGPT. Ето начините, по които учениците ще използват генеративния AI и ChatGPT. Освен това има няколко начина за учителите да се борят с тази приливна вълна. Вижте връзката тук.
5) Използване на контекст и генериране на AI. Направих също сезонно подправен преглед относно контекст, свързан с Дядо Коледа, включващ ChatGPT и генеративен AI на връзката тук.
6) Измамници, използващи Generative AI. Зловещо е, че някои измамници са измислили как да използват генеративен AI и ChatGPT, за да извършват злоупотреби, включително генериране на измамнически имейли и дори създаване на програмен код за зловреден софтуер, вижте моя анализ на връзката тук.
7) Грешки на новобранците при използване на Generative AI. Много хора както превишават, така и изненадващо подценяват това, което генеративният AI и ChatGPT могат да направят, така че разгледах особено недостигането, което новобранците с AI са склонни да правят, вижте дискусията на връзката тук.
8) Справяне с генеративни AI подкани и AI халюцинации. Описвам водещ подход към използването на AI добавки за справяне с различните проблеми, свързани с опитите за въвеждане на подходящи подкани в генеративен AI, плюс това има допълнителни AI добавки за откриване на така наречените AI халюцинирани резултати и лъжи, като покрити при връзката тук.
9) Развенчаване на твърденията на Bonehead за откриване на генеративни есета, произведени от AI. Има заблудена златна треска от приложения с изкуствен интелект, които твърдят, че могат да установят дали дадено есе е създадено от хора или генерирано от изкуствен интелект. Като цяло, това е подвеждащо и в някои случаи е безсмислено и несъстоятелно твърдение, вижте моето отразяване на връзката тук.
10) Ролевата игра чрез Generative AI може да предвещава недостатъци на психичното здраве. Някои използват генеративен AI, като ChatGPT, за да играят ролеви игри, при което приложението AI реагира на човек, сякаш съществува във фантастичен свят или друга измислена обстановка. Това може да има последици за психичното здраве, вижте връзката тук.
11) Разкриване на диапазона от изведени грешки и неистини. Съставят се различни събрани списъци, за да се опитат да покажат естеството на генерираните от ChatGPT грешки и неистини. Някои смятат, че това е от съществено значение, докато други казват, че упражнението е безполезно, вижте моя анализ на връзката тук.
12) Училищата, забраняващи Generative AI ChatGPT, липсват. Може би знаете, че различни училища, като Министерството на образованието в Ню Йорк (NYC), са обявили забрана за използването на ChatGPT в тяхната мрежа и свързаните с тях устройства. Въпреки че това може да изглежда полезна предпазна мярка, тя няма да премести иглата и за съжаление напълно пропуска лодката, вижте моето покритие на връзката тук.
13) Generative AI ChatGPT ще бъде навсякъде поради предстоящия API. Има важен обрат относно използването на ChatGPT, а именно, че чрез използването на API портал в това конкретно приложение с изкуствен интелект други софтуерни програми ще могат да извикват и използват ChatGPT. Това драстично ще разшири използването на генеративен AI и ще има забележителни последици, вижте моята разработка на връзката тук.
14) Начини, по които ChatGPT може да изгасне или да се стопи. Няколко потенциални неприятни проблема стоят пред ChatGPT по отношение на подбиването на огромната похвала, която е получил досега. Този анализ внимателно проучва осем възможни проблема, които могат да накарат ChatGPT да загуби парата си и дори да се окаже в кучешката колиба, вж. връзката тук.

Може да ви се стори интересно, че ChatGPT е базиран на версия на предшестващо AI приложение, известно като GPT-3. ChatGPT се счита за малко следваща стъпка, наричана GPT-3.5. Очаква се, че GPT-4 вероятно ще бъде пуснат през пролетта на 2023 г. Предполага се, че GPT-4 ще бъде впечатляваща крачка напред по отношение на възможността да произвежда привидно още по-плавни есета, задълбочавайки се и предизвиквайки страхопочитание -вдъхновяващо чудо по отношение на композициите, които може да създаде.

Можете да очаквате да видите нов кръг от изразено удивление, когато дойде пролетта и бъде пуснат най-новият генеративен AI.

Повдигам това, защото има друг ъгъл, който трябва да имате предвид, състоящ се от потенциална ахилесова пета на тези по-добри и по-големи генеративни AI приложения. Ако някой доставчик на изкуствен интелект предостави генеративно приложение за изкуствен интелект, което бълва неприятности, това може да попари надеждите на създателите на изкуствен интелект. Разпространението на обществото може да накара всички генеративни ИИ да получат сериозен синяк. Хората несъмнено ще се разстроят доста от фалшивите резултати, които вече са се случвали много пъти и са довели до бурни обществени осъждащи реакции към AI.

Едно последно предупреждение за сега.

Каквото и да видите или прочетете в генеративен AI отговор, който изглежда да бъдат предадени като чисто фактически (дати, места, хора и т.н.), не забравяйте да останете скептични и да сте готови да проверите отново това, което виждате.

Да, датите могат да бъдат измислени, местата могат да бъдат измислени и елементите, които обикновено очакваме да бъдат безупречни, са all обект на подозрения. Не вярвайте на това, което четете, и бъдете скептични, когато разглеждате всякакви генеративни AI есета или резултати. Ако генеративно AI приложение ви каже, че Ейбрахам Линкълн е летял из страната със собствения си частен самолет, вие несъмнено ще знаете, че това е малкарство. За съжаление, някои хора може да не осъзнават, че реактивните самолети не са били наоколо по негово време, или може да знаят, но да не забележат, че есето прави това нагло и възмутително невярно твърдение.

Силна доза здравословен скептицизъм и постоянна нагласа на недоверие ще бъдат най-добрият ви актив, когато използвате генеративен ИИ.

Готови сме да преминем към следващия етап от това изясняване.

Знаейки какво, по дяволите, ще се случи с този текст

Сега, след като установихме основите, можем да се потопим в съображенията за данни и информация, когато използваме генериращ AI.

Първо, нека разгледаме накратко какво се случва, когато въведете някакъв текст в подкана за ChatGPT. Не знаем със сигурност какво се случва в ChatGPT, тъй като програмата се счита за патентована. Някои посочиха, че това подкопава усещането за прозрачност относно приложението AI. Донякъде злобна забележка е, че за компания, която се нарича OpenAI, техният AI всъщност е затворен за обществен достъп и не е достъпен като отворен код.

Нека обсъдим токенизацията.

Когато въведете обикновен текст в подкана и натиснете return, вероятно има преобразуване, което се случва веднага. Текстът се преобразува във формат, състоящ се от токени. Токените са подчасти на думите. Например думата „хамбургер“ обикновено се разделя на три токена, състоящи се от частта „шунка“, „бур“ и „гер“. Основно правило е, че токените обикновено представляват около четири знака или се считат за приблизително 75% от конвенционална английска дума.

След това всеки токен се преформулира като число. Различни вътрешни таблици определят кой символ е присвоен на кой конкретен номер. Възприемането на това е, че текстът, който сте въвели, сега е изцяло набор от числа. Тези числа се използват за изчислителен анализ на подканата. Освен това мрежата за съвпадение на шаблони, която споменах по-рано, също се основава на токенизирани стойности. В крайна сметка, когато съставяте или генерирате изведеното есе, тези цифрови токени първо се използват и след това, преди да бъдат показани, токените се преобразуват обратно в набори от букви и думи.

Помислете за момент.

Когато казвам на хората, че така работи механиката на обработката, те често остават зашеметени. Те предположиха, че генеративно AI приложение като ChatGPT трябва да използва изцяло интегративни думи. Логично приемаме, че думите действат като основен камък за статистическо идентифициране на връзки в писмени разкази и съчинения. Оказва се, че обработката всъщност има тенденция да използва токени. Може би това допринася за удивлението от това как изглежда, че изчислителният процес върши доста убедителна работа като имитира човешкия език.

Преведох ви през този процес поради едно често срещано погрешно схващане, което изглежда се разпространява наоколо. Някои хора изглежда вярват, че тъй като вашият подканващ текст се преобразува в цифрови токени, вие сте живи и здрави, че вътрешността на приложението AI по някакъв начин вече не разполага с вашия първоначално въведен текст. По този начин се твърди, че дори ако сте въвели поверителна информация във вашата подкана, нямате притеснения, тъй като всичко е привидно токенизирано.

Това схващане е заблуда. Току-що посочих, че цифровите токени могат лесно да бъдат върнати обратно в текстовия формат на букви и думи. Същото може да се направи с преобразуваната подкана, която е токенизирана. Няма нищо магическо защитно в това да бъдете токенизирани. Като се има предвид това, след преобразуването в токени, ако има допълнителен процес, който избира да изпуска токени, да ги премества и по друг начин да разбърква или нарязва неща, в този случай наистина има възможност някои части от оригинала подкана вече не са непокътнати (и ако приемем, че оригинално копие не е запазено или съхранено някъде вътрешно).

След това бих искал да разгледам различните известия и лицензионни условия на ChatGPT.

Когато влезете в ChatGPT, се показват серия от предупреждения и информационни коментари.

Ето ги и тях:

„Може понякога да генерира невярна информация.“
„Може понякога да дава вредни инструкции или пристрастно съдържание.“
„Обучен да отхвърля неподходящи искания.“
„Нашата цел е да получим външна обратна връзка, за да подобрим нашите системи и да ги направим по-безопасни.“
„Въпреки че разполагаме с предпазни мерки, системата може понякога да генерира неправилна или подвеждаща информация и да произвежда обидно или предубедено съдържание. Няма за цел да дава съвети.“
„Разговорите може да бъдат прегледани от нашите AI обучители, за да подобрим нашите системи.“
„Моля, не споделяйте чувствителна информация в разговорите си.“
„Тази система е оптимизирана за диалог. Уведомете ни дали конкретен отговор е добър или безполезен.“
„Ограничени познания за света и събитията след 2021 г.“

Две от посочените предупреждения са особено подходящи за тази дискусия. Погледнете шестата точка и седмата точка.

Нека разопаковаме тези две:

„Разговорите може да бъдат прегледани от нашите AI обучители, за да подобрим нашите системи.“

Тази шеста отбелязана точка обяснява, че текстовите разговори при използване на ChatGPT могат да бъдат прегледани от ChatGPT чрез неговите „обучители на AI“, което се прави за подобряване на техните системи. Това е, за да ви информираме, че всички ваши въведени текстови подкани и съответните изведени есета, всички от които са част от „разговора“, който провеждате с ChatGPT, могат изцяло да се видят от техните хора. Предложената обосновка е, че това се прави, за да се подобри приложението AI, и също така ни се казва, че това е вид работна задача, изпълнявана от техните обучители на AI. Може би е така, но резултатът е, че са ви предупредили, че могат да видят вашия текст. Точка, точка.

Ако трябваше да направят нещо друго с вашия текст, вероятно ще потърсите правен съвет относно това дали са гравитирали извънредно извън предложените граници на просто преглед на текста с цел подобряване на системата (ако приемем, че сте успели да откриете, че са го направили, кое от само по себе си изглежда малко вероятно). Както и да е, можете да си представите правните пререкания да се опитвате да ги хванете за това и опитите им да измислят изход от това да бъдат заловени за това, че по някакъв начин нарушават границите на отказа си от отговорност.

„Моля, не споделяйте чувствителна информация в разговорите си.“

Седмата маркирана точка показва, че не трябва да споделяте чувствителна информация в разговорите си. Това изглежда сравнително лесно. Предполагам, че може да се заяждате с това, от което се състои определението за чувствителна информация. Освен това точката с водещи символи не ви казва защо не трябва да споделяте чувствителна информация. Ако някой ден трябва да опитате и в ужасна пот да обясните защо глупаво сте въвели поверителни данни, може да опитате с повдигнатите вежди, че предупреждението е неконкретно, следователно не сте схванали значението. Задръжте дъха си върху това.

Като цяло, смея да твърдя, че повечето хора, които съм виждал да използват ChatGPT, са склонни да не четат точките с водещи символи или пропускат предпазните мерки с водещи символи и просто кимат с глава, сякаш това е обичайното безсмислие, което виждате всички време. Малцина изглежда приемат предупрежденията строго присърце. Дали това е грешка на продавача, че не е направил по-изразени предпазните мерки? Или трябва да приемем, че потребителите трябва да са отговорни и внимателно да са прочели, разбрали и впоследствие да действат разумно въз основа на предупрежденията?

Някои дори твърдят, че приложението AI трябва многократно да ви предупреждава. Всеки път, когато въведете подкана, софтуерът трябва да изскача предупреждение и да ви попита дали искате да натиснете връщането. Отново и отново. Въпреки че това може да изглежда като полезна предпазна мярка, несъмнено би раздразнило потребителите. Включен е труден компромис.

Добре, така че това са очевидните предупреждения, както са представени за всички потребители, за да ги видят лесно.

Потребителите, които може да са по-любознателни, могат да изберат да следват някои от подробните условия за лицензиране, които също са публикувани онлайн. Съмнявам се, че мнозина го правят. Моето предчувствие е, че малцина обръщат сериозно внимание на маркираните точки, когато влизат, и още по-малко с огромна разлика след това разглеждат подробностите за лицензирането. Отново всички сме малко вцепенени за подобни неща в наши дни. Не оправдавам поведението, само отбелязвам защо се случва.

Ще разгледам няколко извадки от публикуваните лицензионни условия.

Първо, ето дефиниция на това, което те смятат за „съдържание“, свързано с използването на ChatGPT:

„Вашето съдържание. Можете да предоставяте входни данни на Услугите („Входни данни“) и да получавате изходни данни, генерирани и върнати от Услугите въз основа на входните данни („Изходни данни“). Входът и изходът са колективно „Съдържание“. В отношенията между страните и до степента, позволена от приложимото законодателство, вие притежавате целия вход и при спазване от ваша страна на настоящите Условия, OpenAI ви преотстъпва всичките си права, право на собственост и интерес в и към изхода. OpenAI може да използва Съдържание, ако е необходимо, за да предоставя и поддържа Услугите, да спазва приложимото законодателство и да прилага нашите политики. Вие носите отговорност за Съдържанието, включително за гарантирането, че то не нарушава приложим закон или тези Условия.“

Ако внимателно проучите тази дефиниция, ще забележите, че OpenAI декларира, че може да използва съдържанието, както сметне за необходимо, за да поддържа своите услуги, включително спазване на приложимите закони и налагане на своите политики. Това е удобен улов за тях. В предстояща една от моите колони ще обсъждам различна, но свързана тема, по-специално за правата върху интелектуалната собственост (ИС), които имате по отношение на въведените текстови подкани и изведените есета (посочвам това тук, тъй като дефиницията на Съдържанието е по тази тема).

В друга част от термините, обозначени като раздел c, те споменават този аспект: „Едно от основните предимства на моделите за машинно обучение е, че те могат да бъдат подобрени с течение на времето. За да помогнете на OpenAI да предоставя и поддържа Услугите, вие се съгласявате и инструктирате, че можем да използваме Съдържание за разработване и подобряване на Услугите.“ Това е подобно на обсъжданото по-рано едноредово предупреждение, което се появява, когато влезете в ChatGPT.

Отделен документ, който е свързан с това, предоставя някои допълнителни аспекти по тези важни въпроси:

„Като част от това непрекъснато подобрение, когато използвате OpenAI модели чрез нашия API, ние може да използваме данните, които ни предоставяте, за да подобрим нашите модели. Това не само помага на нашите модели да станат по-точни и по-добри при решаването на конкретния ви проблем, но също така помага за подобряване на техните общи възможности и безопасност. Ние знаем, че поверителността и сигурността на данните са критични за нашите клиенти. Ние полагаме големи грижи да използваме подходящи технически и процесни контроли, за да защитим вашите данни. Ние премахваме всякаква лична информация от данните, които възнамеряваме да използваме, за да подобрим ефективността на модела. Освен това използваме само малка извадка от данни на клиент за усилията си да подобрим ефективността на модела. Например, за една задача, максималният брой заявки за API, които вземаме проби за клиент, е ограничен до 200 на всеки 6 месеца“ (извадка от документа, озаглавен „Как вашите данни се използват за подобряване на производителността на модела“).

Имайте предвид, че уговорката показва, че разпоредбата се прилага за използване на API като средство за свързване и използване на моделите OpenAI. Донякъде е неясно дали това се отнася еднакво и за крайните потребители, които директно използват ChatGPT.

В още един различен документ, който съдържа техния списък с различни често задавани въпроси, те предоставят поредица от въпроси и отговори, два от които изглеждат особено подходящи за тази дискусия:

„(5) Кой може да преглежда моите разговори? Като част от нашия ангажимент за безопасен и отговорен AI, ние преглеждаме разговорите, за да подобрим нашите системи и да гарантираме, че съдържанието отговаря на нашите политики и изисквания за безопасност.
„(8) Можете ли да изтриете конкретни подкани? Не, не можем да изтрием конкретни подкани от вашата история. Моля, не споделяйте чувствителна информация в разговорите си.“

Има допълнителен документ, който покрива тяхната политика за поверителност. В него се казва следното: „Ние събираме информация, която самостоятелно или в комбинация с друга информация, с която разполагаме, може да се използва, за да ви идентифицираме („Лична информация“)“ и след това продължава да обяснява, че те могат да използват данни от регистрационни файлове, данни за употреба, информация за комуникация, информация за устройството, бисквитки, анализи и друга потенциално събираема информация за вас. Не забравяйте да прочетете дребния шрифт.

Мисля, че това до голяма степен предоставя обиколка на някои съображения, които стоят в основата на това как вашите данни могат да бъдат използвани. Както споменах в началото, няма да преминавам усилено през всички лицензионни условия.

Надяваме се, че това ще ви настрои на ум по тези въпроси и ще остане на върха на ума ви.

Заключение

Казвал съм го преди и ще го кажа отново, не въвеждайте поверителни или лични данни в тези генеративни AI приложения.

Помислете за няколко полезни съвета или опции за този мъдър съвет:

Помислете преди да използвате Generative AI
Премахнете нещата предварително
Маскирайте или фалшифицирайте информацията си
Настройте свой собствен екземпляр
Други

След това ще посоча от какво се състои всеки един от тях. Настройката на вашия собствен екземпляр беше разгледана по-рано тук. Използването на „друго“ в моя списък се дължи на възможността за други начини за справяне с предотвратяването на включването на поверителни данни, което ще разгледам допълнително в бъдеща публикация в колона.

Нека разгледаме тези:

Помислете преди да използвате Generative AI. Един подход включва пълно избягване на използването на генеративен AI. Или поне помислете два пъти, преди да го направите. Предполагам, че най-безопасният път включва неизползването на тези AI приложения. Но това също изглежда доста тежко и почти зад граница.
Премахнете нещата предварително. Друг подход се състои в премахване на поверителна или лична информация от всичко, което въвеждате като подкана. В този смисъл, ако не влезете в него, няма шанс да се влее в Borg. Недостатъкът е, че може би премахването на поверителната част по някакъв начин намалява или подбива това, което се опитвате да накарате генеративния AI да направи за вас.
Маскирайте или фалшифицирайте информацията си. Можете да модифицирате предложения текст, като промените информацията, така че всичко, което изглежда поверително или лично, сега да бъде изобразено по различен начин. Например, вместо договор, в който се споменават Widget Company и John Smith, вие променяте текста, за да се позовавате на Specious Company и Jane Capone. Въпросът тук е дали ще свършите достатъчно изчерпателна работа, така че всички поверителни и частни аспекти да бъдат напълно променени или фалшифицирани. Би било лесно да пропуснете някои от замъгляванията и да оставите неща, които не би трябвало да са там.

Ето един интересен добавен обрат, който може да накара крака ви да се задълбочи по тази тема. Ако можете напълно да се уверите, че нито едно от подканите ви за въвеждане не съдържа никаква поверителна информация, това означава ли, че не е нужно да имате и капка притеснение относно изведените есета, които също съдържат каквато и да е ваша поверителна информация?

Това би изглеждало аксиоматично вярно. Няма поверителен вход, няма поверителен изход.

Ето вашия умопомрачителен обрат.

Генеративният AI често се настройва да се преквалифицира изчислително от текстовите подкани, които се предоставят. По същия начин генеративният AI често се създава за изчислително преквалифициране от изходните есета. Цялото това преквалификация има за цел да подобри възможностите на генеративния AI.

В една от другите си колонки описах следния експеримент, който предприех. Един адвокат се опитваше да открие ново средство за справяне с правен проблем. След изчерпателен преглед на правната литература изглеждаше, че всички вече открити ъгли бяха открити. Използвайки генеративен AI, ние накарахме приложението AI да създаде новаторски правен подход, който изглежда не беше идентифициран преди. Смяташе се, че никой друг все още не е стъпил на тази правна позиция. Легално самородно злато, така да се каже. Това може да бъде стратегически ценно конкурентно законно богатство, което в подходящия момент да бъде използвано и експлоатирано.

Дали това изведено есе представлява форма на поверителна информация, така че да е генерирано от AI за този конкретен човек и да съдържа нещо специално и привидно уникално?

Аха, това ни води до другата свързана и преплетена тема за собствеността и правата върху интелектуалната собственост, свързани с генеративния AI. Останете на линия, за да видите как ще се окаже това.

Последна забележка за сега.

Софокъл дава следната мъдрост: „Не правете нищо тайно; защото времето вижда и чува всички неща и разкрива всичко. Предполагам, че можете да модернизирате формулировката и да твърдите, че генеративният ИИ и тези, които създават и поддържат ИИ, също са склонни да видят всичко.

Това е скромно символичен съвет, който заслужава да бъде запомнен.

Източник: https://www.forbes.com/sites/lanceeliot/2023/01/27/generative-ai-chatgpt-can-disturbingly-gobble-up-your-private-and-confidential-data-forewarns-ai- ethics-and-ai-law/