Правен съден ден за Generative AI ChatGPT, ако бъде хванат в плагиатство или нарушение, предупреждава за етиката на AI и закона за AI

Извлича ли генеративен AI като ChatGPT нашите уебсайтове и създадено от хора съдържание? Бъдете наясно, бъдете … [+] разстроен, бъди готов.

Гети

Дайте кредит там, където се дължи кредит.

Това е част от мъдрата мъдрост, в която може би сте възпитани да вярвате твърдо. Наистина, човек предполага или си въобразява, че всички ние можем донякъде разумно да се съгласим, че това е справедливо и разумно правило в живота. Когато някой направи нещо, което заслужава признание, уверете се, че ще получи заслуженото признание.

Противоположната гледна точка би изглеждала много по-малко убедителна.

Ако някой се разхождаше и настояваше, че кредитът трябва не бъдете признати, когато кредитът е дължим, добре, можете да твърдите, че подобно убеждение е неучтиво и вероятно подмолно. Често се оказваме шумно обезпокоени, когато кредитът е измамен от някой, който е постигнал нещо забележително. Смея да твърдя, че ние особено не харесваме, когато другите лъжливо си приписват заслугите за работата на другите. Това е обезпокоителен двоен удар. Човекът, който трябваше да получи заслугата, е лишен от момента си на слънце. В допълнение, измамникът се наслаждава на светлината на прожекторите, въпреки че погрешно ни заблуждават да присвоим нашите благоприятни чувства.

Защо целият този дискурс за печелене на кредити по най-правилните начини и избягване на грешните и презрителни начини?

Защото изглежда сме изправени пред подобно затруднение, когато става въпрос за най-новото в областта на изкуствения интелект (AI).

Да, твърденията са, че това се случва очевидно чрез вид AI, известен като Генеративен AI. Има много манипулации, че Generative AI, най-горещият AI в новините тези дни, вече си е приписал заслугите за това, за което не заслужава да си приписва. И това вероятно ще се влоши, тъй като генеративният AI се разширява и използва все повече. Все повече и повече заслуги се придават на генеративния AI, докато за съжаление онези, които напълно заслужават истинската заслуга, са оставени в прахта.

Предложеният от мен начин за ясно обозначаване на този предполагаем феномен е чрез две хитри крилати фрази:

1) Плагиатство в мащаб
2) Нарушаване на авторски права в мащаб

Предполагам, че може да сте наясно с генеративния AI поради широко популярно приложение за AI, известно като ChatGPT, което беше пуснато през ноември от OpenAI. Ще кажа повече за генеративния AI и ChatGPT за момент. Почакай там.

Нека да преминем веднага към същността на това, което, така да се каже, кара хората да държат козите.

Някои пламенно се оплакват, че генеративният AI потенциално изтръгва хората, които са създали съдържание. Виждате ли, повечето генеративни AI приложения са данни, обучени чрез изследване на данни, намерени в Интернет. Въз основа на тези данни, алгоритмите могат да усъвършенстват обширна вътрешна мрежа за съпоставяне на шаблони в рамките на AI приложението, което впоследствие може да произведе привидно ново съдържание, което удивително изглежда така, сякаш е създадено от човешка ръка, а не част от автоматизация

Това забележително постижение до голяма степен се дължи на използването на сканирано в интернет съдържание. Без обема и богатството на интернет съдържание като източник за обучение на данни, генеративният AI ще бъде почти празен и ще представлява малък или никакъв интерес за използване. Като накара AI да изследва милиони и милиони онлайн документи и текст, заедно с всякакъв вид свързано съдържание, съпоставянето на шаблони постепенно се извлича, за да се опита и имитира съдържание, създадено от човека.

Колкото повече съдържание се изследва, шансовете са, че съвпадението на шаблона ще бъде по-усъвършенствано и ще стане още по-добро в мимикрията, при всички останали равни условия.

Ето тогава въпросът за милиони долари:

Голям въпрос: Ако вие или други имате съдържание в интернет, върху което е обучено някое генеративно AI приложение, което вероятно го прави без вашето пряко разрешение и може би изцяло без вашето съзнание, трябва ли да имате право на част от пая относно каквато и стойност да произтича от това обучение за генериране на AI данни?

Някои яростно твърдят, че единственият правилен отговор е Да, особено че тези създатели на човешко съдържание наистина заслужават своята част от действието. Работата е там, че ще ви бъде трудно да намерите някой, който да е получил справедливия си дял, и още по-лошо, почти никой не е получил никакъв дял. На създателите на интернет съдържание, които неволно и несъзнателно са допринесли, по същество се отказва полагащата им се заслуга.

Това може да се характеризира като жестоко и възмутително. Току-що преминахме през разопаковането на мъдрата мъдрост, че кредитът трябва да се отдава там, където се дължи. В случая с генеративния AI, очевидно не е така. Дългогодишното и добродетелно правило за кредитирането изглежда грубо нарушавано.

Уау, отговорът е, вие напълно преувеличавате и изопачавате ситуацията. Разбира се, генеративният AI изследва съдържанието в интернет. Разбира се, това беше много полезно като част от обучението за данни на генеративния AI. Разбира се, впечатляващите генеративни AI приложения днес не биха били толкова впечатляващи без този обмислен подход. Но вие отидохте твърде далеч, когато казахте, че създателите на съдържание трябва да получат някаква подобна заслуга.

Логиката е следната. Хората излизат в Интернет и научават неща от Интернет, като го правят рутинно и без никакво суетене само по себе си. Човек, който чете блогове за водопроводни инсталации и след това прекомерно гледа свободно достъпни видеоклипове за ремонт на водопроводни инсталации, може на следващия ден да излезе и да си намери работа като водопроводчик. Трябва ли да дадат част от своя паричен превод, свързан с водопровода, на блогъра, който е писал за това как да почистите мивка? Трябва ли да дадат хонорар на влогъра, който е направил видеоклипа, показващ стъпките за поправка на протекла вана?

Почти сигурно не.

Обучението на данни на генеративния AI е просто средство за разработване на модели. Докато резултатите от генеративния ИИ не са просто регургитация на точно това, което е изследвано, можете убедително да твърдите, че те са „научени“ и следователно не подлежат на предоставяне на конкретна заслуга на който и да е конкретен източник. Освен ако не можете да уловите генеративния AI при извършване на точна регургитация, индикациите са, че AI се е обобщил отвъд всеки конкретен източник.

Не се дължи кредит на никого. Или, предполага се, може да се каже, че заслугата е на всички. Колективният текст и другото съдържание на човечеството, което се намира в Интернет, получава заслугата. Ние всички получаваме кредита. Безсмислено е да се опитвате да посочите кредита на определен източник. Радвайте се, че изкуственият интелект се развива и че човечеството ще се възползва. Тези публикации в интернет трябва да се чувстват честни, че са допринесли за бъдещето на напредъка в ИИ и как това ще помогне на човечеството завинаги.

Ще имам да кажа повече за двете тези противоположни гледни точки.

Междувременно, клоните ли към лагера, който казва, че кредитът е дължим и закъснял за тези, които имат уебсайтове в Интернет, или смятате, че противоположната страна, която казва, че създателите на интернет съдържание са категорично не да бъдеш измамен е по-убедителна поза?

Енигма и гатанка, събрани заедно.

Нека разопаковаме това.

В днешната колона ще разгледам тези изразени притеснения, че генеративният AI по същество плагиатства или евентуално нарушава авторските права на съдържание, което е публикувано в интернет (считано за право на интелектуална собственост или проблем с IP). Ще разгледаме основата за тези опасения. От време на време ще се позовавам на ChatGPT по време на тази дискусия, тъй като това е 600-килограмовата горила на генеративния AI, но имайте предвид, че има много други генеративни AI приложения и те като цяло се основават на същите общи принципи.

Междувременно може би се чудите какво всъщност е генеративният AI.

Нека първо разгледаме основите на генеративния AI и след това можем да разгледаме отблизо належащия въпрос.

Във всичко това идват множество съображения относно етиката на ИИ и Закона за ИИ.

Моля, имайте предвид, че има текущи усилия за внедряване на етични принципи на AI в разработването и внедряването на приложения с AI. Все по-голям контингент от загрижени и някогашни етици на AI се опитват да гарантират, че усилията за разработване и приемане на AI вземат предвид възгледа за правене AI за добро и предотвратяване AI за лошо. По същия начин има предложени нови закони за изкуствения интелект, които се обединяват като потенциални решения за предпазване на начинанията на изкуствения интелект от нарушаване на правата на човека и други подобни. За моето текущо и обширно отразяване на етиката на ИИ и Закона за ИИ вижте връзката тук намлява връзката тук, Само за да назовем няколко.

Разработването и разпространението на етични принципи на ИИ се преследват, за да се надяваме, че обществото ще попречи да попадне в безброй капани, предизвикващи ИИ. За моето отразяване на етичните принципи на AI на ООН, разработени и подкрепени от близо 200 държави чрез усилията на ЮНЕСКО, вж. връзката тук. По подобен начин се проучват нови закони за изкуствения интелект, за да се опитат да поддържат AI на равно ниво. Един от най-новите снимки се състои от набор от предложени Законът за правата на AI че Белият дом на САЩ наскоро пусна за идентифициране на човешките права в ерата на ИИ, вижте връзката тук. Нужно е село, за да поддържа AI и разработчиците на AI по правилния път и да възпира целенасочените или случайни подмолни усилия, които могат да подкопаят обществото.

Ще вплета в тази дискусия съображения, свързани с етиката на ИИ и закона за ИИ.

Основи на генериращия AI

Най-широко известният екземпляр на генеративен AI е представен от AI приложение, наречено ChatGPT. ChatGPT изникна в общественото съзнание през ноември, когато беше пуснат от изследователската фирма за изкуствен интелект OpenAI. Откакто ChatGPT събра огромни заглавия и изумително надхвърли отредените му петнадесет минути слава.

Предполагам, че вероятно сте чували за ChatGPT или може би дори познавате някой, който го е използвал.

ChatGPT се счита за генериращо AI приложение, тъй като приема като вход текст от потребител и след това генерира или създава резултат, който се състои от есе. AI е генератор на текст към текст, въпреки че аз описвам AI като генератор на текст към есе, тъй като това по-лесно изяснява за какво обикновено се използва. Можете да използвате генеративен AI, за да композирате дълги композиции или можете да го накарате да предлага доста кратки съдържателни коментари. Всичко е по ваше желание.

Всичко, което трябва да направите, е да въведете подкана и приложението AI ще генерира за вас есе, което се опитва да отговори на вашата подкана. Съставеният текст ще изглежда така, сякаш есето е написано от човешка ръка и ум. Ако въведете подкана, която казва „Разкажете ми за Ейбрахам Линкълн“, генеративният AI ще ви предостави есе за Линкълн. Има и други режими на генериращ AI, като текст към изкуство и текст към видео. Тук ще се съсредоточа върху варианта текст към текст.

Първата ви мисъл може да е, че тази генеративна способност не изглежда толкова голяма работа по отношение на създаването на есета. Можете лесно да направите онлайн търсене в Интернет и лесно да намерите тонове и тонове есета за президента Линкълн. Предимството в случая на генеративния AI е, че генерираното есе е относително уникално и предоставя оригинална композиция, а не имитация. Ако се опитате да намерите създаденото от AI есе онлайн някъде, е малко вероятно да го откриете.

Generative AI е предварително обучен и използва сложна математическа и изчислителна формулировка, която е създадена чрез изследване на модели в писмени думи и истории в мрежата. В резултат на изследването на хиляди и милиони писмени пасажи, AI може да избълва нови есета и истории, които са смесица от това, което е намерено. Чрез добавяне на различни вероятностни функционалности, полученият текст е почти уникален в сравнение с това, което е използвано в набора за обучение.

Има много опасения относно генеративния ИИ.

Един съществен недостатък е, че есетата, създадени от генеративно базирано AI приложение, могат да имат различни вградени неистини, включително явно неверни факти, факти, които са подвеждащо представени, и очевидни факти, които са изцяло изфабрикувани. Тези измислени аспекти често се наричат форма на AI халюцинации, крилата фраза, която не одобрявам, но за съжаление изглежда все пак набира популярност (за моето подробно обяснение защо това е скапана и неподходяща терминология, вижте моето отразяване на връзката тук).

Друго притеснение е, че хората могат лесно да си припишат заслугата за генеративно създадено от AI есе, въпреки че не са съставили есето сами. Може би сте чували, че учителите и училищата са доста загрижени за появата на генеративни AI приложения. Учениците могат потенциално да използват генеративен AI, за да напишат възложените им есета. Ако ученик твърди, че дадено есе е написано от собствената му ръка, има малък шанс учителят да успее да различи дали вместо това е подправено от генеративен ИИ. За моя анализ на този объркващ аспект на ученици и учители вижте моето отразяване на връзката тук намлява връзката тук.

В социалните медии имаше някои странни твърдения за Генеративен AI като се твърди, че тази последна версия на AI всъщност е разумен AI (не, грешат!). Тези от AI Ethics и AI Law са особено притеснени от тази процъфтяваща тенденция на открити претенции. Може да кажете учтиво, че някои хора преувеличават какво всъщност може да направи днешният AI. Те приемат, че AI има възможности, които все още не сме успели да постигнем. Това е жалко. Още по-лошо, те могат да позволят на себе си и на другите да попаднат в тежки ситуации поради предположението, че ИИ ще бъде разумен или подобен на човек, за да може да предприеме действия.

Не антропоморфизирайте AI.

Правейки това, ще ви хванат в лепкав капан на твърдо разчитане на очакване AI да прави неща, които не е в състояние да извърши. Като се има предвид това, най-новият генеративен AI е сравнително впечатляващ за това, което може да направи. Имайте предвид обаче, че има значителни ограничения, които трябва непрекъснато да имате предвид, когато използвате което и да е генериращо AI приложение.

Едно последно предупреждение за сега.

Каквото и да видите или прочетете в генеративен AI отговор, който изглежда да бъдат предадени като чисто фактически (дати, места, хора и т.н.), не забравяйте да останете скептични и да сте готови да проверите отново това, което виждате.

Да, датите могат да бъдат измислени, местата могат да бъдат измислени и елементите, които обикновено очакваме да бъдат безупречни, са all обект на подозрения. Не вярвайте на това, което четете, и бъдете скептични, когато разглеждате всякакви генеративни AI есета или резултати. Ако генеративно AI приложение ви каже, че Ейбрахам Линкълн е летял из страната с частния си самолет, вие несъмнено ще знаете, че това е малкарство. За съжаление, някои хора може да не осъзнават, че реактивните самолети не са били наоколо по негово време, или може да знаят, но да не забележат, че есето прави това нагло и възмутително невярно твърдение.

Силна доза здравословен скептицизъм и постоянна нагласа на недоверие ще бъдат най-добрият ви актив, когато използвате генеративен ИИ.

Готови сме да преминем към следващия етап от това изясняване.

Интернет и Generative AI са в това заедно

Сега, след като имате някаква прилика на това какво е генеративен ИИ, можем да проучим тревожния въпрос дали генеративният ИИ е справедливо или нечестно „увеличаване“, или някои биха казали нагло използване на Интернет съдържание.

Ето моите четири важни теми, свързани с този въпрос:

1) Двоен проблем: Плагиатство и нарушаване на авторски права
2) Опитът да се докаже плагиатство или нарушаване на авторски права ще бъде опит
3) Извеждане на аргументи за плагиатство или нарушаване на авторски права
4) Законни противопехотни мини чакат

Ще разгледам всяка една от тези важни теми и ще предложа проницателни съображения, върху които всички трябва да обмисляме внимателно. Всяка от тези теми е неразделна част от по-голям пъзел. Не можете да гледате само едно парче. Нито можете да разглеждате някое парче изолирано от другите парчета.

Това е сложна мозайка и целият пъзел трябва да бъде разгледан правилно и хармонично.

Двоен проблем: Плагиатство и нарушаване на авторски права

Двойният проблем, пред който са изправени тези, които създават и прилагат генеративен ИИ, е, че техните продукти може да правят две лоши неща:

1) Плагиатство. Генеративният AI може да се тълкува като плагиатство съдържание, което съществува в интернет според интернет сканирането, извършено по време на обучението на данни на AI.
2) Нарушаване на авторски права. Генеративният AI може да се счита за предприятие нарушаване на авторски права свързани с интернет съдържанието, което е било сканирано по време на обучението за данни.

За да поясним, в интернет има много повече съдържание, отколкото обикновено се сканира за обучение на данни на генеративен AI. Обикновено се използва само малка част от Интернет. По този начин можем да предположим, че всяко съдържание, което не е сканирано по време на обучението на данни, няма особено говеждо месо с генеративния AI.

Това обаче е донякъде спорно, тъй като потенциално бихте могли да нарисувате линия, която свързва друго сканирано съдържание със съдържанието, което не е сканирано. Също така, друга важна уговорка е, че дори и да има съдържание, което не е сканирано, то пак може да се счита за плагиатство и/или нарушено авторско право, ако резултатите от генеративния AI вероятно попаднат на същото словоблудие. Мисълта ми е, че във всичко това има много гъделичкане.

В крайна сметка: Generative AI е пълен с потенциални правни главоблъсканици относно етиката на AI и закона за AI, когато става въпрос за плагиатство и нарушаване на авторски права в основата на преобладаващите практики за обучение на данни.

Досега създателите на изкуствен интелект и изследователите на изкуствения интелект са се пързаляли през това почти без проблем, въпреки надвисналия и несигурно висящ меч, който виси над тях. До момента са започнати само няколко съдебни дела срещу тези практики. Може да сте чували или виждали новинарски статии за подобни правни действия. Единият, например, включва фирмите за текст към изображение на Midjourney и Stability AI за нарушаване на художествено съдържание, публикувано в интернет. Друго включва нарушение на текст към код срещу GitHub, Microsoft и OpenAI поради софтуера Copilot, създаващ AI приложения. Getty Images също се стремят да преследват AI за стабилност за нарушение на текст към изображение.

Можете да очаквате, че ще бъдат заведени още подобни дела.

Точно сега е малко шанс да се започнат тези дела, тъй като резултатът е относително неизвестен. Дали съдът ще застане на страната на създателите на AI или тези, които смятат, че съдържанието им е било несправедливо експлоатирано, ще бъдат победителите? Една скъпа правна битка винаги е сериозен въпрос. Разходването на големи съдебни разходи трябва да се претегли спрямо шансовете за печалба или загуба.

Създателите на AI изглежда нямат почти друг избор, освен да се борят. Ако се поддадат, дори и малко, шансовете са, че това ще доведе до порой от допълнителни съдебни дела (по същество отваряне на вратата за повишени шансове други също да надделеят). След като има законна кръв във водата, останалите законни акули ще се втурнат към смятания за „лесен резултат“ и със сигурност ще се случи кървава баня с пари и побой.

Някои смятат, че трябва да приемем нови закони за ИИ, които да защитят създателите на ИИ. Защитата може дори да е със задна дата. Основата за това е, че ако искаме да видим генеративен AI напредък, трябва да дадем на производителите на AI писта за безопасна зона. След като съдебните дела започнат да печелят победи срещу създателите на AI, ако това се случи (все още не знаем), притеснението е, че генеративният AI ще се изпари, тъй като никой няма да желае да подкрепи фирмите за AI.

Както умело беше посочено в скорошен материал на Bloomberg Law, озаглавен „ChatGPT: IP, Cybersecurity & Other Legal Risks of Generative AI“ от д-р Илия Колоченко и Гордън Плат, Bloomberg Law, февруари 2023 г., ето два жизненоважни извадки, отразяващи тези гледни точки:

„Сега бушува разгорещен дебат сред американските правни учени и професори по право на интелектуална собственост относно това дали неоторизираното изтриване и последващото използване на защитени с авторски права данни представляват нарушение на авторските права. Ако гледната точка на практикуващите юристи, които виждат нарушения на авторските права в подобна практика надделее, потребителите на такива системи с изкуствен интелект също могат да бъдат отговорни за вторично нарушение и потенциално да се сблъскат с правни последици.
„За цялостно справяне с предизвикателството, законодателите трябва да обмислят не само модернизиране на съществуващото законодателство за авторското право, но и прилагане на набор от специфични за ИИ закони и разпоредби.“

Спомнете си, че като общество ние въведохме правна защита за експанзия на интернет, както се вижда сега от Върховния съд, преразглеждащ известния или скандален раздел 230. По този начин изглежда в рамките на разума и прецедента, че може да сме готови да направим някои подобни защити за напредъка на генеративния ИИ. Може би защитите могат да бъдат настроени временно, изтичащи след като генеративният AI достигне някакво предварително определено ниво на професионализъм. Могат да бъдат измислени други защитни разпоредби.

Скоро ще публикувам своя анализ за това как оценката на Върховния съд и окончателното решение по Раздел 230 може да повлияе на появата на генеративен ИИ. Очаквайте тази предстояща публикация!

Обратно към остро изразеното мнение, че трябва да дадем свобода на действие на вдъхващите благоговение за обществото технологични иновации, известни като генеративен ИИ. Някои биха казали, че дори ако претендираното нарушение на авторските права е или се случва, обществото като цяло трябва да е готово да позволи това за специфичните цели на напредъка на генеративния ИИ.

Надеждата е, че новите закони за ИИ ще бъдат внимателно изработени и настроени към подробностите, свързани с обучението на данни за генеративен ИИ.

Има много контрааргументи срещу тази идея за разработване на нови закони за ИИ за тази цел. Едно от опасенията е, че всеки такъв нов закон за ИИ ще отвори шлюзовете за всякакъв вид нарушаване на авторски права. Ще съжаляваме за деня, в който позволихме такива нови закони за ИИ да кацнат в книгите. Колкото и да се опитвате да ограничите това само до обучение за данни с изкуствен интелект, други скришом или хитро ще намерят вратички, които ще се равняват на неограничено и необуздано нарушаване на авторски права.

Аргументите се въртят.

Един аргумент, който не издържа особено вода, е свързан с опитите да съдите самия AI. Забележете, че споменах създателя на AI или изследователите на AI като виновни заинтересовани страни. Това са хора и фирми. Някои предполагат, че трябва да се насочим към AI като страна, която да бъде съдена. Обсъждах надълго и нашироко в моята колона, че все още не приписваме юридическа личност на AI, вижте връзката тук например, и по този начин подобни съдебни дела, насочени срещу AI per se, биха се считали за безсмислени в момента.

Като допълнение към въпроса кой или какво трябва да бъде съден, това повдига друга пикантна тема.

Да приемем, че конкретно генеративно AI приложение е създадено от някой производител на AI, който ще наречем Widget Company. Widget Company е сравнително малка по размер и няма много приходи, нито много активи. Да ги съдиш вероятно няма да спечелиш огромните богатства, които човек може да търси. Най-много просто ще имате удовлетворението да поправите това, което смятате за грешно.

Искаш да преследваш голямата риба.

Ето как ще възникне това. Производител на изкуствен интелект избира да направи своя генеративен изкуствен интелект на разположение на Big Time Company, голям конгломерат с тонове пари и тонове активи. Съдебно дело, назоваващо Widget Company, сега би имало по-добра цел, а именно и чрез назоваване на Big Time Company. Това е битка на Давид и Голиат, на която адвокатите биха се насладили. Разбира се, Big Time Company несъмнено ще се опита да се отърве от риболовната кука. Дали могат да го направят отново е правен въпрос, който е несигурен и може безнадеждно да затънат в калта.

Преди да продължим по-нататък по този въпрос, бих искал да изложа нещо изключително важно за спорните посегателства на генеративния AI поради обучението на данни. Сигурен съм, че интуитивно осъзнавате, че плагиатството и нарушаването на авторските права са две донякъде различни животни. Те имат много общи неща, но и значително се различават.

Ето едно удобно кратко описание от университета Дюк, което обяснява двете:

„Плагиатството най-добре се дефинира като непотвърдено използване на работата на друг човек. Това е етичен проблем, включващ иск за кредит за работа, която ищецът не е създал. Човек може да изплагиатства чужда работа, независимо от статуса на авторското право на тази работа. Например, все пак е плагиатство да копирате от книга или статия, която е твърде стара, за да бъде все още под авторско право. Използването на данни, взети от непотвърден източник, също е плагиатство, въпреки че фактическият материал като данните може да не е защитен с авторско право. Плагиатството обаче се лекува лесно – правилно цитиране на оригиналния източник на материала.“
„Нарушаването на авторските права, от друга страна, е неоторизирано използване на чужда работа. Това е правен проблем, който зависи от това дали произведението е защитено с авторско право на първо място, както и от специфики като колко се използва и целта на използването. Ако някой копира твърде много от защитено произведение или копира с неоторизирана цел, просто признаването на оригиналния източник няма да реши проблема. Само чрез искане на предварително разрешение от притежателя на авторските права човек избягва риска от такса за нарушение.

Посочвам важността на тези две опасения, за да разберете, че средствата за защита могат да се различават съответно. Освен това и двете са заплетени в съображения, проникващи в етиката на ИИ и Закона за ИИ, което ги прави еднакво заслужаващи внимание.

Нека проучим претендираното лекарство или решение. Ще видите, че това може да помогне на един от двойните проблеми, но не и на другия.

Някои настояват, че всичко, което производителите на AI трябва да направят, е да цитират своите източници. Когато генеративният AI създава есе, просто включете конкретни цитати за всичко, което е посочено в есето. Дайте различни URL адреси и други указания за това кое интернет съдържание е използвано. Това изглежда ще ги освободи от притеснения относно плагиатството. Изведеното есе вероятно би идентифицирало ясно какви източници са били използвани за изготвената формулировка.

Има някои кавги в това заявено решение, но на ниво от 30,000 XNUMX фута да кажем, че това наистина служи като полузадоволително лекарство за дилемата с плагиатството. Както е посочено по-горе в обяснението за нарушаване на авторски права, цитирането на изходен материал не ви изкарва непременно от кучешката колиба. Ако приемем, че съдържанието е защитено с авторски права и в зависимост от други фактори, като например колко от материала е използван, очакващият меч на нарушаване на авторските права може да се завърти рязко и окончателно.

Двойна беда е паролата тук.

Опитът да се докаже плагиатство или нарушаване на авторски права ще бъде опит

Докажи го!

Това е изтърканият рефрен, който всички сме чували в различни периоди от живота си.

Знаете как става. Може да твърдите, че нещо се случва или се е случило. Може да знаете в сърцето си, че това се е случило. Но когато става въпрос за бутане срещу бутане, трябва да имате доказателството.

На днешния език трябва да покажете постъпления, както казват.

Моят въпрос към вас е следният: Как ще докажем доказуемо, че генеративният AI е използвал неподходящо интернет съдържание?

Предполага се, че отговорът трябва да е лесен. Вие молите или казвате на генеративния AI да създаде изведено есе. След това вземете есето и го сравнете с това, което може да се намери в Интернет. Ако намерите есето, бам, имате генеративния ИИ, прикован към пословичната стена.

Животът изглежда никога не е бил толкова лесен.

Представете си, че получаваме генеративен AI, за да създадем есе, което съдържа около 100 думи. Обикаляме и се опитваме да достигнем до всички кътчета на Интернет, търсейки тези 100 думи. Ако намерим 100-те думи, показани в същия точен ред и по идентичен начин, изглежда, че сме се хванали на горещо.

Да предположим обаче, че намерим в интернет привидно „сравнимо“ есе, въпреки че то съвпада само с 80 от 100-те думи. Това все още изглежда достатъчно, може би. Но си представете, че намираме само екземпляр от 10 думи от 100, които съвпадат. Това достатъчно ли е, за да се твърди, че е налице плагиатство или е налице нарушение на авторските права?

Сивотата съществува.

Текстът е смешен по този начин.

Сравнете това с обстоятелствата текст към изображение или текст към изкуство. Когато generative AI предоставя възможност за текст към изображение или текст към изкуство, вие въвеждате текстова подкана и приложението AI създава изображение, базирано донякъде на подканата, която сте предоставили. Изображението може да не прилича на нито едно изображение, което някога е виждано на тази или друга планета.

От друга страна, изображението може да напомня за други изображения, които съществуват. Можем да погледнем генеративното изображение, създадено от AI, и донякъде по интуиция да кажем, че със сигурност изглежда като друго изображение, което сме виждали преди. Като цяло, визуална аспектите на сравнението и контраста се предприемат малко по-лесно. Като се има предвид това, моля, знайте, че огромни правни дебати гарантират какво представлява припокриването или репликацията на едно изображение от друго.

Друга подобна ситуация съществува с музиката. Има генеративни AI приложения, които ви позволяват да въведете текстова подкана, а изходът, произведен от AI, е аудио музика. Тези AI възможности за текст към аудио или текст към музика едва сега започват да се появяват. Едно нещо, на което можете да заложите най-добрия си долар, е, че музиката, произведена от generative AI, ще бъде строго проверена за нарушение. Изглежда, че знаем, когато чуем музикално нарушение, въпреки че отново това е сложен правен въпрос, който не се основава само на това как се чувстваме относно възприеманото възпроизвеждане.

Позволете ми още един пример.

Генериращият AI текст към код ви предоставя възможността да въведете текстова подкана и AI ще създаде програмен код вместо вас. След това можете да използвате този код за изготвяне на компютърна програма. Можете да използвате кода точно както е генериран или можете да изберете да редактирате и коригирате кода, за да отговаря на вашите нужди. Също така е необходимо да се гарантира, че кодът е подходящ и работещ, тъй като е възможно да възникнат грешки и неистини в генерирания код.

Първото ви предположение може да е, че програмният код не се различава от текста. Това е просто текст. Разбира се, това е текст, който осигурява определена цел, но все пак е текст.

Е, не точно. Повечето езици за програмиране имат строг формат и структура спрямо естеството на кодовите изрази на този език. Това в известен смисъл е много по-тясно от свободно течащия естествен език. Вие сте донякъде затворени по отношение на това как са формулирани кодиращите изявления. По същия начин последователността и начинът, по който изразите се използват и подреждат, са донякъде затворени.

Като цяло, възможността да се демонстрира, че програмният код е плагиатстван или нарушен, е почти по-лесна от естествения език като цяло. По този начин, когато генеративен AI тръгне да сканира програмен код в Интернет и по-късно генерира програмен код, шансовете да се твърди, че кодът е бил грубо репликиран, ще бъдат относително по-убедителни. Не е забиване, така че очаквайте да се водят горчиви битки за това.

Основната ми точка е, че ще имаме едни и същи въпроси относно етиката на ИИ и Закона за ИИ, които се сблъскват с всички видове генеративен ИИ.

Плагиатството и нарушаването на авторски права ще бъдат проблематични за:

Текст към текст или текст към есе
Текст към изображение или текст към изкуство
Текст към аудио или текст към музика
Текст към видео
Текст към код
Т.н.

Всички те са обект на едни и същи грижи. Някои може да са малко по-лесни за „доказване“ от други. Всички те ще имат свое собствено разнообразие от кошмари на основата на етиката на ИИ и Закона за ИИ.

Извеждане на дело за плагиатство или нарушаване на авторски права

За целите на дискусията, нека се съсредоточим върху генериращия AI текст към текст или текст към есе. Правя го отчасти поради огромната популярност на ChatGPT, който е типът текст към текст на генериращия AI. Има много хора, които използват ChatGPT, заедно с много други, които използват различни подобни генериращи AI приложения за текст в текст.

Тези хора, които използват генеративни AI приложения, знаят ли, че потенциално разчитат на плагиатство или нарушаване на авторски права?

Изглежда съмнително, че го правят.

Бих се осмелил да кажа, че преобладаващото предположение е, че ако генеративното AI приложение е достъпно за използване, производителят на AI или компанията, която е внедрила AI, трябва да знае или да е уверена, че няма нищо неблагоприятно в стоките, които предлагат за употреба. Ако можете да го използвате, трябва да е над борда.

Нека преразгледаме предишния ми коментар за това как ще се опитаме да докажем, че конкретен генеративен ИИ работи на погрешна основа по отношение на обучението на данни.

Бих могъл също да добавя, че ако успеем да хванем един генеративен ИИ да го прави, шансовете да хванем останалите вероятно ще се повишат. Не казвам, че всички генеративни AI приложения ще бъдат в една и съща лодка. Но те ще се озоват в доста сурови морета, след като един от тях бъде прикован към стената.

Ето защо също така ще бъде изключително полезно да следите съществуващите съдебни дела. Първият, който спечели по отношение на претендираното нарушение, ако това се случи, вероятно ще доведе до гибел и мрак за другите генеративни AI приложения, освен ако някаква тяснота не избяга от по-широките проблеми. Тези, които губят по отношение на претендираното нарушение, не означава непременно, че генеративните AI приложения могат да бият камбани и да празнуват. Възможно е загубата да се дължи на други фактори, които не са толкова подходящи за другите генеративни AI приложения и т.н.

Бях споменал, че ако вземем есе от 100 думи и се опитаме да намерим точно тези думи в абсолютно същата последователност в Интернет, може да имаме относително солиден случай за плагиатство или нарушаване на авторски права, при всички останали равни условия. Но ако броят на съвпадащите думи е малък, изглежда, че сме на тънък лед.

Бих искал да се задълбоча в това.

Очевиден аспект на правенето на сравнение се състои от абсолютно същите думи в абсолютно същата последователност. Това може да се случи за цели пасажи. Това би било удобно за забелязване, почти като да ни бъде подаден на сребърен поднос.

Може също да сме подозрителни, ако съвпадне само откъс от думи. Идеята би била да видим дали те са ключови думи или може би думи-пълнители, които можем лесно да премахнем или игнорираме. Също така не искаме да бъдем измамени от използването на думи в тяхното минало или бъдеще време или друга глупост. Тези вариации в думите също трябва да се имат предвид.

Друго ниво на сравнение би било, когато думите не са особено едни и същи думи до голяма степен, но въпреки това думите, дори в различно състояние, все още изглежда, че правят същите точки. Например, резюмето често ще използва доста подобни думи като оригинален източник, но можем да различим, че резюмето изглежда се основава на оригиналния източник.

Най-трудното ниво на сравнение би било базирано на концепции или идеи. Да предположим, че виждаме есе, което няма същите или подобни думи като база за сравнение, но същността или идеите са същите. Вярно е, че навлизаме в груба територия. Ако с готовност кажем, че идеите са строго защитени, бихме сложили капак на почти всички форми на знание и разширяване на знанието.

Можем отново да се позовем на удобно обяснение от университета Дюк:

„Авторското право не защитава идеи, а само конкретния израз на идея. Например, съд реши, че Дан Браун не е нарушил авторските права на по-ранна книга, когато е писал The Da Vinci Code защото всичко, което той заимства от по-ранната работа, са основните идеи, а не спецификата на сюжета или диалога. Тъй като авторското право има за цел да насърчи творческото производство, използването на нечии идеи за създаване на ново и оригинално произведение поддържа целта на авторското право, то не го нарушава. Само ако някой копира израз на друг без разрешение, потенциално е нарушено авторското право.
„За да се избегне плагиатството, от друга страна, трябва да се признае източникът дори на идеи, които са заимствани от някой друг, независимо дали изразът на тези идеи е заимстван с тях. Следователно една парафраза изисква цитиране, въпреки че рядко повдига някакъв проблем с авторското право.

Моля, обърнете внимание, както по-рано идентифицирахме разликите между аспектите на двойните проблеми.

Сега, прилагането на подходите за сравнение на практика е нещо, което се случва от много години. Мислете за това по този начин. Учениците, които пишат есета за училищната си работа, може да се изкушат да грабнат съдържание от интернет и да се преструват, че са автори на думите, спечелили наградата Пулицър за A-клас.

Учителите използват програми за проверка на плагиатство от дълго време, за да се справят с това. Учител взема есето на ученик и го подава в програмата за проверка на плагиатство. В някои случаи цялото училище ще лицензира използването на програма за проверка на плагиатство. Всеки път, когато студентите предават есе, те трябва първо да изпратят есето на програмата за проверка за плагиатство. Учителят е информиран какво съобщава програмата.

За съжаление, трябва да сте изключително внимателни относно това, което имат да кажат тези програми за проверка на плагиатство. Важно е внимателно да се прецени дали докладваните показания са валидни. Както вече споменахме, възможността за установяване дали дадено произведение е копирано може да бъде неясна. Ако необмислено приемете резултата от програмата за проверка, можете лъжливо да обвините ученик в преписване, когато не го е направил. Това може да бъде съкрушително.

Продължавайки напред, можем да опитаме да използваме програми за проверка на плагиатство в сферата на тестване на генеративни резултати от AI. Отнасяйте се към изведените есета от генеративно AI приложение, сякаш са написани от студент. След това преценяваме какво казва програмата за проверка на плагиатство. Това се прави с доза сол.

Съществува скорошно проучване, което се опитва да операционализира тези типове сравнения в контекста на генеративния ИИ по същия начин. Бих искал да прегледам някои интересни открития с вас.

Първо, изисква се добавен фон. Генеративният AI понякога се нарича LLM (големи езикови модели) или просто LM (езикови модели). Второ, ChatGPT е базиран на версия на друг генеративен AI пакет на OpenAI, наречен GPT-3.5. Преди GPT-3.5 имаше GPT-3, а преди това беше GPT-2. В днешно време GPT-2 се смята за доста примитивен в сравнение с по-късните серии и всички ние с нетърпение очакваме предстоящото разкриване на GPT-4, вижте дискусията ми на връзката тук.

Изследователското проучване, което искам да разгледам накратко, се състоеше от изследване на GPT-2. Това е важно да се осъзнае, тъй като сега сме по-далеч отвъд възможностите на GPT-2. Не правете прибързани заключения относно резултатите от този анализ на GPT-2. Въпреки това можем да научим много от оценката на GPT-2. Изследването е озаглавено „Плагиатстват ли езиковите модели?“ от Jooyoung Lee, Thai Le, Jinghui Chen и Dongwon Lee, появяващи се в ACM WWW '23, 1–5 май 2023 г., Остин, Тексас, САЩ.

Това е основният им изследователски въпрос:

„До каква степен (без да се ограничава до запомняне) LM използват фрази или изречения от техните образци за обучение?“

Те са използвали тези три нива или категории на потенциално плагиатство:

„Дословно плагиатство: точни копия на думи или фрази без трансформация.“
„Плагиатство с перифразиране: заместване на синоними, пренареждане на думи и/или обратен превод.“
„Плагиатство на идея: Представяне на основно съдържание в удължена форма.“

GPT-2 наистина беше обучен на интернет данни и следователно е подходящ кандидат за този тип анализ:

„GPT-2 е предварително обучен за WebText, съдържащ над 8 милиона документа, извлечени от 45 милиона Reddit връзки. Тъй като OpenAI не е пуснал публично WebText, ние използваме OpenWebText, който е пресъздаване с отворен код на корпуса WebText. Той е надеждно използван в предишната литература.

Селективните ключови констатации, извлечени от проучването, се състоят от:

„Открихме, че предварително обучените семейства GPT-2 наистина плагиатстват от OpenWebText.“
„Нашите открития показват, че фината настройка значително намалява случаите на дословно плагиатство от OpenWebText.“
„В съответствие с Carlini et al. и Carlini et al., откриваме, че по-големите GPT-2 модели (големи и xl) обикновено генерират плагиатствани последователности по-често от по-малките.
„Въпреки това, различните LM могат да демонстрират различни модели на плагиатство и по този начин нашите резултати може да не се обобщават директно към други LM, включително по-нови LM като GPT-3 или BLOOM.“
„В допълнение, известно е, че автоматичните детектори за плагиатство имат много режими на отказ (както при фалшиви негативи, така и при фалшиви положителни резултати).
„Като се има предвид, че по-голямата част от данните за обучение на LM се извличат от мрежата, без да се информират собствениците на съдържание, тяхното повторение на думи, фрази и дори основни идеи от набори за обучение в генерирани текстове има етични последици.“

Определено се нуждаем от много повече проучвания от този вид.

Ако сте любопитни как GPT-2 се сравнява с GPT-3 по отношение на обучението на данни, има доста подчертан контраст.

Според докладваните индикации, обучението за данни за GPT-3 е много по-обширно:

„Моделът беше обучен с помощта на текстови бази данни от интернет. Това включва огромни 570 GB данни, получени от книги, уеб текстове, Wikipedia, статии и други текстове в интернет. За да бъдем дори по-точни, 300 милиарда думи бяха въведени в системата” (BBC Научен фокус списание, „ChatGPT: Всичко, което трябва да знаете за инструмента GPT-3 на OpenAI“ от Алекс Хюз, февруари 2023 г.).

За тези от вас, които се интересуват от по-задълбочени описания на обучението за данни за GPT-3, ето извадка от официалната GPT-3 моделна карта, публикувана в GitHub (последна актуализирана дата е посочена като септември 2020 г.):

„Наборът от данни за обучение GPT-3 се състои от текст, публикуван в интернет, или от текст, качен в интернет (напр. книги). Интернет данните, върху които е обучен и спрямо които е оценен до момента, включват: (1) версия на набора от данни CommonCrawl, филтриран въз основа на сходство с висококачествени референтни корпуси, (2) разширена версия на набора от данни Webtext, (3) ) два интернет базирани корпуса на книги и (4) Wikipedia на английски език.“
„Като се имат предвид неговите данни за обучение, резултатите и производителността на GPT-3 са по-представителни за свързаните с интернет популации, отколкото тези, потопени в вербална, недигитална култура. Свързаното с интернет население е по-представително за развитите страни, богати, по-млади и мъжки възгледи и е предимно ориентирано към САЩ. По-богатите нации и население в развитите страни показват по-високо проникване на интернет. Дигиталното разделение между половете също така показва по-малко жени, представени онлайн в световен мащаб. Освен това, тъй като различните части на света имат различни нива на проникване и достъп до интернет, наборът от данни не представя по-малко свързани общности.

Един извод от горната индикация за GPT-3 е, че основното правило сред тези, които създават генеративен AI е, че колкото повече интернет данни можете да сканирате, шансовете за подобряване или напредък на генеративния AI нарастват.

Можете да погледнете на това по два начина.

1) Подобрено AI. Ще имаме генеративен AI, който пълзи във възможно най-голяма част от интернет. Вълнуващият резултат е, че генеративният AI ще бъде по-добър, отколкото е сега. Това е нещо, което трябва да очакваме с нетърпение.
2) Потенциал за копиране в изобилие. Това разширяване на сканирането в интернет неприятно и ангажиращо прави проблема с плагиатството и нарушаването на авторските права потенциално все по-голям. Докато преди нямаше толкова много засегнати създатели на съдържание, размерът ще процъфти. Ако сте адвокат от страна на създателите на съдържание, това предизвиква сълзи в очите ви (може би сълзи на ужас или сълзи на радост какви перспективи носи това по отношение на съдебни дела).

Чашата наполовина пълна или наполовина празна?

Ти решаваш.

Законни противопехотни мини чакат

Въпрос, върху който може би си мислите, е дали публикуваното от вас интернет съдържание се счита за честна игра за сканиране. Ако вашето съдържание е зад платена стена, вероятно то не е цел за сканиране, защото не може да бъде лесно достигнато в зависимост от силата на платената стена.

Предполагам, че съдържанието на повечето обикновени хора не е скрито зад платена стена. Те искат тяхното съдържание да бъде публично достъпно. Предполагат, че хората ще го разгледат.

Дали вашето съдържание е публично достъпно също аксиоматично означава, че одобрявате то да бъде сканирано за използване от генериращ AI, който се обучава с данни?

Може би да, може би не.

Това е един от онези правни въпроси, които въртят очи.

Връщайки се към цитираното по-рано Закон на Блумбърг статия, авторите споменават важността на Правилата и условията (T&C), свързани с много уебсайтове:

„Легалната противопехотна мина – силно пренебрегвана от несъзнателни AI компании, които управляват онлайн ботове за извличане на данни – е скрита в Правила и условия, които обикновено се предлагат на обществени уебсайтове от всякакъв вид. За разлика от понастоящем неуреденото законодателство за интелектуалната собственост и дилемата за нарушаване на авторските права, Общите условия на уебсайта са подкрепени от добре установено договорно право и обикновено могат да бъдат наложени в съда, разчитайки на достатъчен брой прецеденти.

Те показват, че ако приемем, че вашият уебсайт има страница, свързана с лицензиране, шансовете са, че ако сте използвали стандартизиран съвременен шаблон, той може да съдържа ключова клауза:

„Следователно, повечето стандартни правила и условия за уебсайтове – изобилно налични в свободен достъп – съдържат клауза, забраняваща автоматизирано извличане на данни. По ирония на съдбата такива свободно достъпни шаблони вероятно са били използвани за обучение по ChatGPT. Поради това собствениците на съдържание може да пожелаят да прегледат своите Общи условия и да вмъкнат отделна клауза, категорично забраняваща всякакво използване на каквото и да е съдържание от уебсайтовете за обучение на AI или други свързани цели, независимо дали се събира ръчно или автоматично, без предварително писмено разрешение от собственика на уебсайта .”

В техния анализ на потенциалните действия, които създателите на съдържание да предприемат относно своите уебсайтове, е включен допълнителен кикер:

„Следователно въвеждането на приложима разпоредба за обезщетение за неустойки за всяко нарушение на клаузата за неизтриване, подсилена с разпоредба за разпореждане без облигации, може да бъде приемливо решение за онези автори на творческо съдържание, които не желаят да предоставят плодовете на своето интелектуален труд за целите на обучението на ИИ, без да им бъде платено или поне да им бъде даден подходящ кредит за тяхната работа.

Може да искате да се консултирате с вашия адвокат за това.

Някои казват, че това е жизненоважен начин да се опитаме да кажем на създателите на AI, че създателите на съдържание са изключително сериозни относно защитата на тяхното съдържание. Уверете се, че лицензът ви има правилната формулировка, изглежда ще постави пред внимание създателите на AI.

Други обаче са малко недоволни. Те унило казват, че можете да продължите да поставяте най-суровия и смъртоносен правен език на вашия уебсайт, но в крайна сметка създателите на AI ще го сканират. Няма да знаете, че са го направили. Ще имате дяволски време, за да докажете, че са го направили. Малко вероятно е да откриете, че техните резултати отразяват вашето съдържание. Това е тежка битка, която няма да спечелите.

Контрааргументът е, че вие предавате битката, преди дори да е започнала. Ако поне не владеете достатъчно правен език и ако някога ги хванете, те ще се клатят и ще избягат от всякаква отговорност. Всичко, защото не сте публикували правилния вид правен жаргон.

Междувременно друг подход, който се стреми да спечели сцепление, ще се състои от маркиране вашия уебсайт с нещо, което казва, че сайтът не трябва да бъде сканиран от генериращ AI. Идеята е да се създаде стандартизиран маркер. Предполага се, че уебсайтовете могат да добавят маркера към своя сайт. На производителите на AI ще бъде казано, че трябва да променят сканирането на данните си, за да прескочат маркираните уебсайтове.

Може ли подходът с маркер да бъде успешен? Притесненията включват разходите за получаване и поставяне на маркерите. Заедно с това дали създателите на AI ще спазват маркерите и ще гарантират, че избягват сканирането на маркираните сайтове. Друга гледна точка е, че дори създателите на AI да не се съобразят с маркировките, това дава още една издайническа следа за отиване в съда и твърдение, че създателят на съдържание е извървял последната миля, за да се опита да предупреди за сканирането с AI.

Ох, всичко ти замайва главата.

Заключение

Няколко последни бележки по тази трънлива тема.

Готови ли сте за умопомрачителна гледна точка на цялата тази дилема на ИИ като плагиат и нарушител на авторски права?

Голяма част от предположенията за „улавянето“ на генеративния AI в акта на плагиатство или нарушаване на авторски права зависи от откриването на резултати, които силно приличат предишни работи, като например съдържанието в Интернет, което е било потенциално сканирано по време на обучението за данни.

Да предположим обаче, че тук се играе трик „разделяй и владей“.

Ето какво искам да кажа.

Ако генеративният изкуствен интелект вземе назаем малко оттук и мъничко оттам, като в крайна сметка ги смеси заедно, за да произведе някакъв конкретен резултат, шансовете да успеете да имате момент на грешка са значително намалени. Никой изход няма да се повиши до достатъчен праг, за да можете да кажете със сигурност, че е копиран от конкретен източник. Полученото есе или други начини на извеждане ще бъдат съпоставими само частично. И чрез обичайния подход да се опитвате да аргументирате, че е налице плагиатство или нарушение на авторски права, обикновено трябва да демонстрирате повече от някаква мъничка частица, особено ако хапката не е забележителна и може да бъде намерена широко в интернет (подбиване всяка адекватна тежест на доказване на незаконно присвояване).

Можете ли все още убедително да декларирате, че обучението на данни от генеративен AI е откраднал уебсайтове и създатели на съдържание, дори ако предложеното доказателство е привидно несъществена част?

Помислете за това.

Ако сме изправени пред потенциално мащабно плагиатство и мащабно нарушаване на авторски права, може да се наложи да променим подхода си към определянето на това какво представлява плагиатство и/или нарушаване на авторски права. Може би трябва да се направи случай за плагиатство или нарушаване на авторски права като цяло или като цяло. Мозайка, състояща се от хиляди или милиони дребни откъси, може да се тълкува като извършване на такива нарушения. Очевидният проблем обаче е, че това може да накара всякакъв вид съдържание внезапно да попадне под чадъра на нарушения. Това може да е хлъзгав наклон.

Тежки мисли.

Говорейки за тежки мисли, Лео Толстой, легендарният писател, каза известното: „Единственият смисъл на живота е да служиш на човечеството“.

Ако вашият уебсайт и уебсайтовете на други се сканират за подобряване на AI и въпреки че не получавате нито стотинка за това, може ли да имате тържествена утеха в пламенната вяра, че допринасяте за бъдещето на човечеството? Изглежда малка цена за плащане.

Е, освен ако ИИ не се окаже страховитият екзистенциален риск, който заличава всички хора от съществуването. Не трябва да си приписвате заслуги за това. Предполагам, че вие не бихте допринесли за този ужасен резултат. Като оставим настрана тази пагубна прогноза, може би си мислите, че ако създателите на AI печелят пари от своя генеративен AI и изглежда, че се наслаждават на печалбите, вие също трябва да получите парче от пая. Споделяйте и споделяйте еднакво. Създателите на AI трябва да поискат разрешение да сканират всеки уебсайт и след това да договорят цена, която трябва да се плати за това, че им е позволено да извършат сканирането.

Дайте кредит там, където се дължи кредит.

Нека да дадем на сър Уолтър Скот последната дума за сега: „О, каква оплетена мрежа плетем. Когато за първи път практикуваме да мамим.

Това може би е приложимо, ако вярвате, че се извършва измама, или може би не е приложимо, ако смятате, че всичко е наред и напълно откровено и законно. Моля, великодушно си дайте кредит, че сте обмислили това. Заслужаваш го.

Източник: https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caught-plagiarizing-or-infringing-warns-ai-ethics- и-ай-закон/