LIVE UPDATES
Bota

Si duhet të sillen sistemet e AI dhe kush duhet të vendosë për to?

Që nga lansimi i ChatGPT, përdoruesit kanë ndarë rezultate që ata i konsiderojnë të njëanshme politikisht, fyese ose ndryshe të kundërshtueshme.

17 Shkurt 2023, 08:30 Nga I.A
Si duhet të sillen sistemet e AI dhe kush duhet të vendosë
ChatGPT

SHBA- Misioni i OpenAI është të sigurojë që inteligjenca e përgjithshme artificiale (AGI) është dobi e gjithë njerëzimit. Prandaj, ne mendojmë shumë për sjelljen e sistemeve të AI që ndërtojmë në prag të AGI, dhe mënyrën në të cilën përcaktohet kjo sjellje.

Që nga lansimi ynë i ChatGPT, përdoruesit kanë ndarë rezultate që ata i konsiderojnë të njëanshme politikisht, fyese ose ndryshe të kundërshtueshme. Në shumë raste, ne mendojmë se shqetësimet e ngritura kanë qenë të vlefshme dhe kanë zbuluar kufizime reale të sistemeve tona, të cilat duam t'i adresojmë. Ne kemi parë gjithashtu disa keqkuptime rreth mënyrës se si sistemet dhe politikat tona funksionojnë së bashku për të formuar rezultatet që merrni nga ChatGPT.

Ku jemi sot

Ndryshe nga softueri i zakonshëm, modelet tona janë rrjete nervore masive. Sjelljet e tyre mësohen nga një gamë e gjerë të dhënash, jo të programuara në mënyrë eksplicite. Megjithëse nuk është një analogji e përsosur, procesi është më i ngjashëm me trajnimin e një qeni sesa me programimin e zakonshëm. Një fazë fillestare e "para-trajnimit" vjen e para, në të cilën modeli mëson të parashikojë fjalën tjetër në një fjali, i informuar nga ekspozimi i tij ndaj shumë teksteve në internet (dhe ndaj një gamë të gjerë këndvështrimesh). Kjo pasohet nga një fazë e dytë në të cilën ne "përshtatim" modelet tona për të kufizuar sjelljen e sistemit.

Deri më sot, ky proces është i nuk është i përsosur. Ndonjëherë procesi i rregullimit të imët nuk arrin qëllimin tonë (prodhimi i një mjeti të sigurt dhe të dobishëm) dhe qëllimi i përdoruesit (marrja e një rezultati të dobishëm në përgjigje të një hyrjeje të caktuar). Përmirësimi i metodave tona për përafrimin e sistemeve të AI me vlerat njerëzore është një përparësi kryesore për kompaninë tonë, veçanërisht pasi sistemet e AI bëhen më të afta.

Një proces me dy hapa: Para-trajnimi dhe rregullimi i imët

Së pari, ne modelojmë " para-trajnim " duke i bërë ata të parashikojnë atë që vjen më pas në një grup të dhënash të madhe që përmban pjesë të internetit. Ata mund të mësojnë të plotësojnë fjalinë "në vend që të kthehej majtas, ajo u kthye ___". Duke mësuar nga miliarda fjali, modelet tona mësojnë gramatikën, shumë fakte rreth botës dhe disa aftësi arsyetimi. Ata gjithashtu mësojnë disa nga paragjykimet e pranishme në ato miliarda fjali. Më pas, ne i "rregullojmë" këto modele në një grup të dhënash më të ngushtë që ne e gjenerojmë me kujdes me rishikuesit njerëzorë që ndjekin udhëzimet që ne u ofrojmë atyre. Meqenëse nuk mund të parashikojmë të gjitha hyrjet e mundshme që përdoruesit e ardhshëm mund të vendosin në sistemin tonë, ne nuk shkruajmë udhëzime të detajuara për çdo hyrje që ChatGPT do të hasë. Në vend të kësaj, ne përshkruajmë disa kategori në udhëzimet që rishikuesit tanë përdorin për të shqyrtuar dhe vlerësuar rezultatet e mundshme të modelit për një sërë të dhënash shembujsh. Më pas, ndërsa ato janë në përdorim, modelet përgjithësohen nga ky reagim i rishikuesit në mënyrë që t'i përgjigjen një grupi të gjerë të dhënash specifike të ofruara nga një përdorues i caktuar.

Roli i rishikuesve dhe politikat e OpenAI në zhvillimin e sistemit

Në disa raste, ne mund tu japim udhëzime rishikuesve tanë për një lloj produkti të caktuar (për shembull, "mos plotësoni kërkesat për përmbajtje të paligjshme"). Në raste të tjera, udhëzimet që ndajmë me rishikuesit janë më të nivelit të lartë (për shembull, "shmangni marrjen e një pozicioni për tema të diskutueshme"). E rëndësishmja, bashkëpunimi ynë me recensentët nuk është i vetëm por është një marrëdhënie e vazhdueshme, në të cilën ne mësojmë shumë nga ekspertiza e tyre. Një pjesë e madhe e procesit të rregullimit të saktë është mbajtja e një qarku të fortë reagimesh me rishikuesit tanë, i cili përfshin takime javore për të adresuar pyetjet që mund të kenë ose për të dhënë sqarime mbi udhëzimet tona. Ky proces i përsëritur i reagimit është mënyra se si ne e trajnojmë modelin që të jetë më i mirë dhe më i mirë me kalimin e kohës.

Adresimi i paragjykimeve

Shumë janë të shqetësuar me të drejtë për paragjykimet në hartimin dhe ndikimin e sistemeve të AI. Ne jemi të përkushtuar që ta trajtojmë me forcë këtë çështje dhe të jemi transparent si për qëllimet ashtu edhe për progresin tonë. Për këtë qëllim, ne po ndajmë një pjesë të udhëzimeve tona që kanë të bëjnë me tema politike dhe të diskutueshme. Udhëzimet tona janë të qarta që vlerësuesit nuk duhet të favorizojnë asnjë grup politik. Paragjykimet që megjithatë mund të dalin nga procesi i përshkruar më sipër janë gabime, jo veçori. Ndërsa mosmarrëveshjet do të ekzistojnë gjithmonë, ne shpresojmë se ndarja e këtij postimi në blog dhe këto udhëzime do të japin më shumë njohuri se si ne e shohim këtë aspekt kritik të një teknologjie të tillë themelore. Është besimi ynë se kompanitë e teknologjisë duhet të jenë të përgjegjshme për prodhimin e politikave që qëndrojnë përballë shqyrtimit.

Ne jemi gjithmonë duke punuar për të përmirësuar qartësinë e këtyre udhëzimeve - dhe bazuar në atë që kemi mësuar nga prezantimi i ChatGPT deri më tani, ne do t'u ofrojmë udhëzime më të qarta rishikuesve në lidhje me kurthet dhe sfidat e mundshme që lidhen me paragjykimet, si dhe figura dhe tema të diskutueshme. Për më tepër, si pjesë e iniciativave të vazhdueshme të transparencës, ne po punojmë për të ndarë informacionin e grumbulluar demografik për rishikuesit tanë në një mënyrë që nuk shkel rregullat dhe normat e privatësisë, pasi ky është një burim shtesë i njëanshmërie të mundshme në rezultatet e sistemit. Aktualisht po hulumtojmë se si ta bëjmë procesin e akordimit më të kuptueshëm dhe të kontrollueshëm, dhe po ndërtojmë përparime të jashtme si shpërblimet e bazuara në rregulla dhe AI.

Ku po shkojmë: Blloqet ndërtuese të sistemeve të ardhshme

Në ndjekje të misionit tonë, ne jemi të përkushtuar të sigurojmë që aksesi, përfitimet dhe ndikimi mbi AI dhe AGI janë të përhapura. Ne besojmë se kërkohen të paktën tre blloqe ndërtimi për të arritur këto qëllime në kontekstin e sjelljes së sistemit AI. Në këtë postim, ne fokusohemi qëllimisht në këtë fushë të veçantë dhe se ku do të shkojmë në të ardhmen e afërt. Ne po ndjekim gjithashtu një axhendë kërkimore të vazhdueshme duke marrë parasysh këto pyetje.

1. Përmirësoni sjelljen e paracaktuar. Ne duam që sa më shumë përdorues që të jetë e mundur t'i gjejnë sistemet tona të AI të dobishme për ta "jashtë kutisë" dhe të ndiejnë se teknologjia jonë i kupton dhe respekton vlerat e tyre.

Për këtë qëllim, ne po investojmë në kërkime dhe inxhinieri për të reduktuar paragjykimet e dukshme dhe delikate në mënyrën se si ChatGPT u përgjigjet inputeve të ndryshme. Në disa raste ChatGPT aktualisht refuzon rezultatet që nuk duhet, dhe në disa raste, nuk refuzon kur duhet. Ne besojmë se përmirësimi në të dyja aspektet është i mundur. Për më tepër, ne kemi hapësirë ​​për përmirësim në dimensione të tjera të sjelljes së sistemit, siç është sistemi që "përgatit gjërat". Reagimet nga përdoruesit janë të paçmueshme për të bërë këto përmirësime.

2. Përcaktoni vlerat e AI tuaj, brenda kufijve të gjerë. Ne besojmë se AI duhet të jetë një mjet i dobishëm për njerëzit individualë, dhe kështu i personalizueshëm nga çdo përdorues deri në kufijtë e përcaktuar nga shoqëria.

Prandaj, ne po zhvillojmë një përmirësim në ChatGPT për t'i lejuar përdoruesit të personalizojnë me lehtësi sjelljen e tij. Kjo do të nënkuptojë lejimin e rezultateve të sistemit me të cilat njerëzit e tjerë (përfshirë veten tonë) mund të mos pajtohen fuqimisht. Arritja e ekuilibrit të duhur këtu do të jetë sfiduese, marrja e personalizimit në ekstrem do të rrezikonte të mundësonte përdorime dashakeqe të teknologjisë sonë dhe AI-të sikofantike që amplifikojnë pa mendje bindjet ekzistuese të njerëzve. Prandaj do të ketë gjithmonë disa kufij në sjelljen e sistemit. Sfida është përcaktimi i atyre kufijve. Nëse përpiqemi t'i bëjmë të gjitha këto përcaktime vetë, ose nëse përpiqemi të zhvillojmë një sistem të vetëm, monolit të AI, ne do të dështojmë në angazhimin që bëjmë në Kartën tonë për të "shmangur përqendrimin e panevojshëm të pushtetit".

3. Të dhëna publike për standardet dhe kufijtë e vështirë. Një mënyrë për të shmangur përqendrimin e panevojshëm të fuqisë është t'u jepni njerëzve që përdorin ose preken nga sisteme si ChatGPT aftësinë për të ndikuar në rregullat e atyre sistemeve.

Ne besojmë se shumë vendime në lidhje me parazgjedhjet dhe kufijtë tanë të vështirë duhet të merren kolektivisht, dhe ndërsa zbatimi praktik është një sfidë, ne synojmë të përfshijmë sa më shumë perspektiva të jetë e mundur. Si pikënisje, ne kemi kërkuar të dhëna të jashtme në teknologjinë tonë në formën e bashkimit të kuq. Kohët e fundit kemi filluar gjithashtu të kërkojmë kontributin e publikut për AI në arsim (një kontekst veçanërisht i rëndësishëm në të cilin po përdoret teknologjia jonë). Jemi në fazat e hershme të përpjekjeve pilotuese për të kërkuar të dhëna publike për tema si sjellja e sistemit, mekanizmat e zbulimit (të tilla si filigrani) dhe politikat tona të vendosjes më gjerësisht. Ne po eksplorojmë gjithashtu partneritete me organizata të jashtme për të kryer auditime nga palët e treta të përpjekjeve tona të sigurisë dhe politikave.

chatgpt openai

Sondazh

Poll

Reshjet përmbytin rrugët e Shëngjinit, vështirësi në qarkullimin e automjeteve dhe këmbësorëve

Reshjet përmbytin rrugët e Shëngjinit, vështirësi në qarkullimin e automjeteve dhe këmbësorëve

Qytetarët nisen sërish drejt kryeministrisë, me flamurin kuq e zi dhe brohorima vazhdojnë protestën

Protestuesit marshojnë drejt zonës së Bllokut, qytetarët e tjerë nuk iu bashkohen #dosja #protesta

Protesta nuk ka të ndalur, qyetarët bllokojnë rrugën te Ura e Tajvanit, thirrje në kor policëve

Nga Sheshi tek Banka, qytetarët bllokojnë rrugën: Edi Rama ka mbaru

Qytetarët nuk ndalen në protestë/ Bllokojnë rrugën te selia e PS-së, ulen në gjunjë

Vazhdon protesta për Zvërnëcin/ Protestuesit ngren nga kafet qytetarët te Opera

E mbuluar me flamurin kuq e zi, e reja shfaqet me foshnjën në krah gjatë protestës

"Edi Rama jep dorëheqjen/E reja nga protesta:Ka ardhur koha të shkosh me Berishën te Veliaj dhe Meta

Qytetarët protestë në Vlorë për Zvërnecin, me pankarta në duar marshojnë drejt Sheshit të Flamurit

Dy orë protestë, bulevardi plot qytetarë ndriçohet nga blicat e telefonave: Jep dorëheqje

"Studentët të ndërrojnë qeverinë"/ I riu thirrje të forta nga protesta: Mos u largoni nga Shqipëria

Protestuesit nuk i tremb as shiu, thirrje të forta nga Kryeministria: Revolucion!

“I preve në besë banorët e Rrjollit dhe Thethit”/ Protestuesi thirrje Ramës: Malet i nxore në shitje

PAMJE PREKËSE/ Vogëlushja mes lotësh mesazh Ramës: Pelikanin kaçurrel do ta sjellim në Surrel

Qytetarët njëzëri para Kryeministrisë: Rama në burg, Berisha në Burg

Banorja e Rrjollit: Mos bini pre e provokimeve! Këtu do rrimë deri sa Rama të japë dorëheqjen

Protesta kundër projektit të Zvërnecit/ Protestesit mesazh Ivanka Trump: Mbaj duart larg Nartës

Tensionohet situata në protestë, policia nuk kursen qytetarët hedh ujë me piper me presion

Protesta për Zvërnecin, përplasje mes qytetarëve dhe policisë

Përplasjt mes qytetarëve dhe policisë në protestë, çahet kordoni

PAMJE nga tubimi i i katërt kundër projektit në Zvërnec #dosja #protesta #zvernec

Protestë në Durrës kundër projektit në Zvërnec, qytetarët mblidhen para Bashkisë

Berisha: Shteti duhej të ishte garanti në Zvërnec.Ndërtimet të bëhen në përputhje me standardet e BE

Berisha: Aeroporti i Vlorës kurrë nuk mund të ndërtohej aty

Zvërneci,Berisha:Ne mbështesim plotësisht investimin e huaj.Sazani nuk është një investim i thjeshtë

Berisha në grupin parlamentar: Pas Kuvendit Kombëtar hyjmë në një etapë të re

Berisha: Meta është një i burgosur politik, Rama po vazhdon me besnikëri rrugën e babait të vet

Burgun apo dorëheqje? Rama kapet me gazetarin: Nuk meriton përgjigje

Protestuesit kërkojnë dorëheqjen, Rama: Film i vjetër, përfaqësoj të paktën 800 mijë shqiptarë

Protesta për Zvërnecin, Rama: SPAK po mban të ngrira fondet pa i lënë të kalojë te shitësi

Rama: Të rreshtohesh me PS, do të thotë të mbështesësh Shqipërinë drejt BE

Rama: Jemi këtu për të ndërtuar Shqipërinë e së ardhmes

Rama: Bëmë ligjin për hapjen e dosjeve të komunizmit, partia jonë u përball me të keqen në opozitë

"Kryeministri gënjeu"/ Gazetarja thirrje qytetarëve: Ai që të vjedh sot, do e bëjë dhe nesër

35-vjetori i PS në Tiranë/ Rama: Arsyeja e fitores së PS është aftësia për t’u hapur!

Mbyllet protesta për Zvërnecin #dosja #protesta #zverneci

Protesta për Zvërnecin/ Qytetarja: Ne nuk e lëshojmë sheshin pa u heq gardhi në Zvërnec dhe Rrjoll

Qytetarja: Kërkojmë anulimin e ligjit për zonat e mbrojtura, nuk ka negociata

"Anulo projektin"/ Me pankarta në duar, të rinjtë 'pushtojnë' kryeministrinë: Jep dorëheqjen

"Janë provokime"/ Çfarë po ndodh para ambienteve të Kryeministrisë?

Protestuesit i përgjigjen kryeministrit Rama: Jep dorëheqje nuk ka dialog!

Qytetarët zbresin sërish në shesh, protestojnë kundër projektit në Zvërnec

Ermonela Jaho mbështet protestën për Zvërnecin, shpërndan pamjet në rrjetet sociale

Skandali me ADS/ Berisha: U ngrit pa vendim qeverie, Rama krijoi një monstër për të vjedhur

"Populli flet në ditën e zgjedhjeve"/ Kryeministri: Thirrjet 'O Rama të QR' nuk funksionojnë me mua

Projekti për Zvërnecin/ Rama për hetimet e SPAK: Investimi nuk ndalon sa kohë unë jam këtu!

Antonio Costa: Zgjerimi një domosdoshmëri gjeostrategjike për Europën

Antonio Costa: Zgjerimi një domosdoshmëri gjeostrategjike për Europën

Mesazhi i Antonio Costës: Përshpejtoni luftën kundër krimit dhe korrupsionit në vend