Në fund të vitit të kaluar, kur kompania e njohur kineze e Inteligjencës Artificiale, DeepSeek, hodhi në treg modelin e madh gjuhësor me një çmim të lirë, ajo përmbysi parashikimet e kahershme mbi të ardhmen e Inteligjencës Artificiale, shkruan The Economist.
Kjo është e rëndësishme për këdo që del në krye të betejës së madhe globale për epërsi në Inteligjencën Artificiale. Zhvilluesit tani po rishikojnë se sa harduer, energji dhe të dhëna nevojiten. Një tjetër faktor kontribuues dhe më pak i diskutuar në Inteligjencën Artificiale, është fuqia punëtore.
Për njeriun e zakonshëm, Inteligjenca Artificiale ka të bëjë vetëm me robotë, makineri dhe modele. Është një teknologji që vret vendet e punës. Në fakt, miliona punëtorë janë të përfshirë në prodhimin e modeleve të Inteligjencës Artificiale.
Pjesa më e madhe e punës së tyre përfshin detyra si etiketimi i objekteve në imazhet e rrugëve në mënyrë që të trajnohen makinat vetëdrejtuese apo etiketimi i fjalëve në regjistrimet audio të përdorura për të trajnuar sistemet e njohjes së të folurit.
Teknikisht, këta punëtorë të quajtur “shënues”, i japin të dhënave kontekstin që u nevojitet kompjuterëve, për të përpunuar lidhjet statistikore midis komponentëve të një grupi të dhënash dhe të kuptuarit e tyre nga qeniet njerëzore.
Në fakt, kushdo që ka kryer me sukses një test CAPTCHA, mund të ketë ndihmuar pa dashje në trajnimin e Inteligjencës Artificiale.
Kjo është pjesa “jotërheqëse” e industrisë, siç shprehet Alex Wang, drejtuesi i firmës së të dhënave Scale AI.
Megjithëse Scale AI thotë se pjesa më e madhe e punës së kontribuuesve të saj kryhet në Amerikë dhe Europë, në industrinë në tërësi, pjesa më e madhe e punës u jepet njerëzve në vendet e varfra të botës, ku shumë persona të arsimuar kërkojnë punë.
Qeveria kineze ka bashkuar forcat me kompanitë e teknologjisë, si Alibaba dhe JD.com, për të punësuar njerëz të tillë në pjesë të largëta të vendit.
Në Indi, kompania Nasscom, llogarit se të ardhurat nga “shënuesit” mund të arrijnë 7 miliardë dollarë në vit dhe mund të punësohen 1 milion njerëz në vend deri në vitin 2030.
Kjo është domethënëse, sepse e gjithë industria e teknologjisë së informacionit në Indi vlen 254 miliardë dollarë në vit (përfshirë harduerin) dhe punëson 5.5 milionë njerëz.
“Shënuesit” janë krahasuar prej kohësh me prindërit, duke stërvitur modelet e Inteligjencës Artificiale dhe duke i ndihmuar ata të kuptojnë botën. Por modelet e fundit nuk kanë nevojë për udhëzime në të njëjtën mënyrë. Ndërsa teknologjia po rritet, a do të bëhen mësuesit e saj të tepërt?
Shënimi i të dhënave nuk është asgjë e re. Fei Fei Li, një shkencëtare kompjuterike amerikane e njohur si “kumbara e Inteligjencës Artificiale”, ka nxitur lindjen e kësaj industrie në mesin e viteve 2000, kur krijoi ImageNet, grupin më të madh të të dhënave të imazheve në atë kohë.
Zonja Li e kuptoi se nëse do t’i paguante studentët e kolegjit për të grupuar imazhet, kjo punë do të zgjaste 90 vjet. Prandaj, ajo punësoi njerëz anembanë botës, duke përdorur Mechanical Turk, një platformë në internet e drejtuar nga Amazon.
Ajo përfitoi rreth 3.2 milionë imazhe të organizuara në grupe të dhënash, në dy vjet e gjysmë. Së shpejti, edhe laboratorë të tjerë të Inteligjencës Artificiale filluan të kontraktojnë punën në këtë mënyrë.
Me kalimin e kohës, zhvilluesit u lodhën me shënimet e cilësisë së ulët të bëra nga punëtorë të patrajnuar. U shfaqën kompani të të dhënave të Inteligjencës Artificiale, si Sama dhe iMerit. Ato punësuan punëtorë në vendet e varfra.
Puna joformale e “shënuesve” vazhdoi, por u krijuan platforma të posaçme për punën në Inteligjencën Artificiale, si ato të drejtuara nga firma Scale AI, e cila trajnon punonjësit.
Banka Botërore llogarit se midis 4.4% dhe 12.4% e fuqisë punëtore globale, është e përfshirë në këtë fushë. Krystal Kauffman, një banor në Miçigan, i cili ka një dekadë që punon me të dhëna të tilla në internet, mendon se kompanitë e teknologjisë kanë interes për ta mbajtur të fshehur këtë fuqi punëtore.
“Ato po shesin idenë magjike se të gjitha këto gjëra ndodhin vetë”, thotë zonja Kauffman. “Pa pjesën magjike, Inteligjenca Artificiale është thjesht një tjetër produkt”.
Në industri është hapur një debat për trajtimin e punëtorëve që qëndrojnë pas Inteligjencës Artificiale. Kompanitë ngurrojnë të bëjnë publike të dhënat mbi pagat. Por “shënuesit” amerikanë në përgjithësi mendojnë se 10-20 dollarë ora është një pagesë e mirë në platformat online.
Ata që punojnë në vendet e varfra, shpesh marrin 4-8 dollarë ora. Në shumë raste, ka mjete vëzhgimi që ndjekin veprimtarinë kompjuterike të punëtorëve dhe dënohen nëse punojnë ngadalë.
Firma Scale AI është paditur disa herë për praktikat e punësimit. Firma i ka mohuar akuzat dhe thotë: “Ne planifikojmë të mbrohemi fuqishëm”.
Por çështja më e madhe, është se puna e “shënuesve” po thahet. Deri diku, kjo ishte e pashmangshme.
Nëse Inteligjenca Artificiale dikur ishte një fëmijë që kishte nevojë për një prind për t’i vënë në dukje gjërat dhe për ta ndihmuar të kuptonte botën përreth tij, tani teknologjia është rritur në një adoleshent që ka nevojë për udhëzime dhe këshilla të rastësishme.
Laboratorët e Inteligjencës Artificiale po përdorin gjithnjë e më shumë të dhëna të para-etiketuara nga laboratorë të tjerë, të cilët përdorin algoritme për të vendosur etiketime në grupet e të dhënave.
Marrim shembullin e traktorëve me vetëdrejtim të ndërtuar nga firma Blue River Technology, një degë e kompanisë John Deere, gjigant i pajisjeve bujqësore. Tre vjet më parë, inxhinierët amerikanë ngarkonin foto në cloud për t’i kaluar stafit në Hubli, Indi, udhëzime të kujdesshme se çfarë duhej etiketuar: traktorë, ndërtesa, pajisje vaditëse, etj.
Tani zhvilluesit përdorin të dhëna të para-etiketuara. Ata ende kanë nevojë për një staf për të kontrolluar etiketimin dhe për t’u marrë me “rastet e skajshme”, për shembull kur një re pluhuri errëson një pjesë të peizazhit ose një hije peme errëson të korrat, duke ngatërruar modelin. Por një proces që më parë zgjaste disa muaj, tani kërkon disa javë.
Vala më e fundit e modeleve të Inteligjencës Artificiale, ka ndryshuar shumë punën me të dhënat. Që nga viti 2022, kur firma OpenAI për herë të parë e lejoi publikun të përdorte chatbot-in e saj ChatGPT, ka pasur interes gjithnjë e më të madh për modelet e mëdha gjuhësore.
Të dhënat nga firma kërkimore Pitchbook tregojnë se financimi i kapitalit sipërmarrës për firmat startup të Inteligjencës Artificiale në botë u rrit me më shumë se 50% në vitin 2024, duke arritur në 131.5 miliardë dollarë, edhe pse fondet për firmat e tjera startup, ranë.
Pjesa më e madhe e këtyre parave po shkon në teknika të reja për zhvillimin e Inteligjencës Artificiale, të cilat nuk kanë nevojë për shënimin e të dhënave në të njëjtën mënyrë. Iva Gumnishka në firmën Humans in the Loop, thotë se kompanitë që punësojnë “shënues” me aftësi të ulëta, po “mbeten pas”.
Ka ende kërkesë për “shënuesit”, por puna e tyre ka ndryshuar. Ndërsa bizneset po fillojnë të përdorin Inteligjencën Artificiale, ata po ndërtojnë modele më të vogla të posaçme dhe po kërkojnë “shënues” me arsim të lartë. Është bërë e zakonshme që reklamat për punësimin e “shënuesve” të kërkojnë një doktoraturë ose aftësi në kodim dhe shkencë.
Tani që studiuesit po përpiqen ta bëjnë Inteligjencën Artificiale më shumëgjuhëshe, po rritet edhe kërkesa për “shënues” që flasin gjuhë të tjera përveç anglishtes. Sushovan Das, dentist që punon në projekte mjekësore që lidhen me Inteligjencën Artificiale, mendon se puna e “shënuesve” nuk do të zhduket kurrë.
“Kjo botë po zhvillohet vazhdimisht, – thotë ai. – Pra, Inteligjenca Artificiale do të përmirësohet pa pushim”.
Nga ana tjetër, po shfaqen role të reja për njerëzit, në trajnimin e Inteligjencës Artificiale. Firma kërkimore Epoch AI, llogarit se sasia e tekstit me cilësi të lartë të disponueshëm për trajnimin e modeleve mund të shterojë deri në vitin 2026.
Disa laboratorë të Inteligjencës Artificiale po punësojnë njerëz për të shkruar copa teksti dhe rreshta kodi mbi të cilat mund të trajnohen modelet e Inteligjencës Artificiale.
Të tjerë po blejnë të dhëna sintetike, të krijuara duke përdorur algoritme kompjuterike dhe po punësojnë njerëz për t’i verifikuar ato. “Të dhënat sintetike duhet të jenë të dhëna të mira”, thotë Wendy Gonzalez, shefi i firmës Sama, që ka operacione në Afrikën Lindore.
Roli tjetër i punëtorëve është të vlerësojnë rezultatet nga modelet e Inteligjencës Artificiale dhe të ndihmojnë për t’u dhënë atyre formë. Falë kësaj, ChatGPT ishte në gjendje të performonte më mirë se chatbot-et e mëparshme.
Xiaote Zhu në firmën Scale AI jep si shembull disa detyra të hapura që kryhen në platformën Outlier të firmës, e cila u prezantua në vitin 2023 për të ndihmuar ekspertët me trajnimin e Inteligjencës Artificiale.
Punëtorëve u paraqiten dy përgjigje nga një chatbot që këshillon një itinerar për pushime në Maldive. Ata duhet të zgjedhin se cilën përgjigje parapëlqejnë, ta vlerësojnë atë, të shpjegojnë pse përgjigjja është e mirë apo e keqe dhe më pas ta rishkruajnë përgjigjen për ta përmirësuar.
Shembulli i zonjës Zhu është një rast i veçantë. Megjithatë, është e vërtetë se ndërhyrjet e njerëzve janë thelbësore për t’u siguruar që Inteligjenca Artificiale është e sigurt dhe etike.
Në një dokument që u publikua pas hedhjes në treg të ChatGPT në vitin 2022, kompania OpenAI tha se kishte punësuar ekspertë “për të hetuar dhe për të dhënë reagime” në lidhje me modelet e saj.
Në fund të këtij procesi, modeli u trajnua që të mos u përgjigjej disa kërkesave, si për shembull, kërkesës për të shkruar tekste që synojnë t’i bindin njerëzit që t’i bashkohen grupit terrorist al-Kaeda.
Fluturimi jashtë folesë
Zhvilluesit e Inteligjencës Artificiale duan që ta heqin nevojën për këtë lloj kontributi njerëzor. Studimet tregojnë se deri në 80% e kohës që shpenzohet për zhvillimin e Inteligjencës Artificiale, shkon për punën e të dhënave.
Naveen Rao në firmën e Inteligjencës Artificiale me emrin Databricks, thotë se do të donte që modelet të mësonin vetë, ashtu siç do të donte që të bënin fëmijët e tij. “Unë dua të ndërtoj njerëz vetë-efikasë”, thotë ai. “Dua që ata të kenë kuriozitetin dhe të kuptojnë si t’i zgjidhin problemet. Nuk dua t’i ushqej me lugë në çdo hap”.
Ka shumë entuziazëm për mësimin e pambikëqyrur. Ky përfshin ushqyerjen e modeleve të Inteligjencës Artificiale me të dhëna të paetiketuara dhe të mësuarit sipas stilit përforcues, që përdor provën dhe gabimin për të përmirësuar vendimmarrjen e makinerisë së Inteligjencës Artificiale.
Kompanitë e Inteligjencës Artificiale, përfshirë DeepMind e kompanisë Google, kanë trajnuar makineri të Inteligjencës Artificiale për të fituar në lojëra si Go dhe shah, duke luajtur me miliona gara kundër vetes dhe duke gjurmuar se cilat strategji funksionojnë, pa dhënë asnjë ndihmë njerëzore. Por kjo qasje autodidakte nuk funksionon jashtë sferës së matematikës dhe shkencës, të paktën tani për tani.
Të pasionuarit e teknologjisë kudo në botë janë mahnitur nga fakti se sa i lirë dhe efikas është modeli kinez DeepSeek. Por atyre nuk u pëlqen fakti se DeepSeek po trajnohet duke përdorur reagime të krijuara nga kompjuterët dhe jo nga njerëzit.
Modeli e kishte të vështirë t’u përgjigjej pyetjeve të hapura. “Dallimi është se me lojërat si Go dhe shah, rezultati i dëshiruar është krejt i qartë: fito lojën”, thotë Phelim Bradley, bashkëthemelues i firmës Prolific, një tjetër kompani e të dhënave të Inteligjencës Artificiale. “Kurse modelet e mëdha gjuhësore janë më të ndërlikuara dhe më të gjera”.
Bradley, si shumë teknikë, mendon se duhet të përfshihen më tepër njerëz në trajnimin e Inteligjencës Artificiale, jo më pak. Larmia e fuqisë punëtore ka rëndësi.
Kur ChatGPT u publikua disa vite më parë, njerëzit vunë re se ai e përdorte së tepërmi fjalën “gërmoj”. Kjo fjalë u kthye në një shenjë dalluese e Inteligjencës Artificiale, që tregonte se një tekst i caktuar ishte shkruar nga një robot.
Në fakt, “shënuesit” në Afrikë ishin punësuar për të trajnuar modelin dhe fjala “gërmoj” përdoret më shpesh në anglishten afrikane, sesa në anglishten amerikane ose britanike.
Në të njëjtën mënyrë siç përcillen aftësitë dhe njohuritë e punëtorëve te modelet e Inteligjencës Artificiale, ashtu përcillet edhe fjalori. Siç thotë shprehja, në rritjen e një fëmije merr pjesë gjithë fshati. / Monitor