Kai ruošiatės namuose atsipalaiduoti, galite paprašyti savo išmaniojo telefono groti mėgstamą dainą arba pasakyti savo namų asistentui, kad būtų galima pritemdyti šviesą. Šios užduotys jaučiasi paprastos, nes jas skatina dirbtinis intelektas (AI), kuris dabar yra integruotas į mūsų kasdienybę. Šių sklandžių sąveikų centre yra „Edge AI“ – AI, veikianti tiesiogiai tokiuose įrenginiuose kaip išmanieji telefonai, nešiojamieji ir interneto prietaisai, teikdami tiesioginius ir intuityvius atsakymus.
„Edge AI“ nurodo AI algoritmų diegimą tiesiogiai tinklo „krašte“ įrenginiuose, o ne pasikliauja centralizuotais debesų duomenų centruose. Šis požiūris panaudoja „Edge“ įrenginių apdorojimo galimybes, tokias kaip nešiojamieji kompiuteriai, išmanieji telefonai, išmanieji laikrodžiai ir namų prietaisai – priimti sprendimus vietoje.
„Edge AI“ suteikia svarbių privatumo ir saugumo pranašumų: sumažinant poreikį perduoti neskelbtinus duomenis internete, „Edge AI“ sumažina duomenų pažeidimų riziką. Tai taip pat padidina duomenų apdorojimo ir sprendimų priėmimo greitį, kuris yra labai svarbus realiojo laiko programoms, tokioms kaip „Healthcare Wearables“, pramoninė automatika, papildyta realybė ir žaidimai. „Edge AI“ netgi gali veikti aplinkoje, kurioje yra pertraukiamas ryšys, palaikant autonomiją su ribota technine priežiūra ir sumažinant duomenų perdavimo išlaidas.
Nors AI dabar yra integruota į daugelį įrenginių, įgalinti galingus AI galimybes kasdieniuose įrenginiuose yra techniškai sudėtinga. „Edge“ įrenginiai veikia griežtais apdorojimo galios, atminties ir akumuliatoriaus veikimo apribojimais, vykdydami sudėtingas užduotis, susijusias su kukliomis aparatinės įrangos specifikacijomis.
Pvz., Kad išmanieji telefonai galėtų atlikti sudėtingą veido atpažinimą, jie turi naudoti pažangiausias optimizavimo algoritmus, kad galėtų analizuoti vaizdus ir suderinti funkcijas milisekundėmis. Vertimas realiuoju laiku ant ausinių reikalauja išlaikyti mažai energijos, kad būtų užtikrintas ilgalaikis akumuliatoriaus veikimo laikas. Ir nors debesies pagrindu sukurtos AI modeliai gali pasikliauti išoriniais serveriais, turinčiais didelę skaičiavimo galią, kraštų įrenginiai turi padaryti tai, kas yra po ranka. Šis perėjimas prie kraštų apdorojimo iš esmės keičia, kaip kuriami, optimizuoti ir diegti AI modeliai.
Užkulisiuose: optimizuoti AI kraštui
PG modeliai, galintys efektyviai veikti ant kraštinių įrenginių, turi būti sumažinami pagal dydį ir žymiai apskaičiuoti, išlaikant panašius patikimus rezultatus. Šis procesas, dažnai vadinamas modelio suspaudimu, apima pažangius algoritmus, tokius kaip nervų architektūros paieška (NAS), mokymasis perdavimo, genėjimas ir kvantizavimas.
Modelio optimizavimas turėtų prasidėti pasirinkus arba suprojektuojant modelio architektūrą, specialiai tinkančią įrenginio aparatinės įrangos galimybėms, tada patobulinti ją efektyviai veikti konkrečiuose krašto įrenginiuose. NAS metodai Naudokite paieškos algoritmus, kad ištirtumėte daugybę galimų AI modelių ir rastumėte geriausiai tinkamą tam tikros užduoties įrenginyje. Perkelkite mokymosi metodus, mokykite daug mažesnį modelį (studentą), naudojant didesnį modelį (mokytoją), kuris jau yra apmokytas. Genėjimas apima nereikalingų parametrų, kurie nedaro didelės įtakos tikslumui, pašalinimą, o kvantizavimas paverčia modelius, kad būtų galima naudoti mažesnę tikslumą aritmetiką, kad būtų galima išsaugoti skaičiavimo ir atminties naudojimą.
Atnaujinant naujausius AI modelius į „Edge“ įrenginius, kyla pagunda sutelkti dėmesį tik į tai, kaip efektyviai jie gali atlikti pagrindinius skaičiavimus, būtent „padauginti“ operacijas ar „Mac“. Paprastai tariant, „Mac“ efektyvumas matuoja, kaip greitai lustas gali atlikti matematiką AI širdyje: padauginti skaičius ir juos sudėti. Modelio kūrėjai gali gauti „Mac Tunnel Vision“, sutelkdami dėmesį į tą metriką ir ignoruodami kitus svarbius veiksnius.
Kai kurie populiariausi AI modeliai, pavyzdžiui, „MobileNet“, „EffictionNet“ ir „Transformeriai“, skirtas regėjimo programoms – yra sukurti kaip ypač efektyvūs atliekant šiuos skaičiavimus. Tačiau praktiškai šie modeliai ne visada veikia AI lustus mūsų telefonuose ar išmaniuosiuose laikrodžiuose. Taip yra todėl, kad realaus pasaulio našumas priklauso ne tik nuo matematikos greičio-tai taip pat priklauso nuo to, kaip greitai duomenys gali judėti įrenginio viduje. Jei modeliui reikia nuolat paimti duomenis iš atminties, jis gali viską sulėtinti, nesvarbu, kaip greitai skaičiavimai.
Keista, bet senesni, biriesni modeliai, tokie kaip „Resnet“, kartais geriau veikia šių dienų įrenginiuose. Jie gali būti ne naujausi ar supaprastinti, tačiau pirmyn ir atgal tarp atminties ir apdorojimo yra daug geriau pritaikyti AI procesorių specifikacijoms. Atliekant realius bandymus, šie klasikiniai modeliai pasiekė geresnį greitį ir tikslumą krašto įrenginiuose, net ir po to, kai buvo sutrumpinti, kad tilptų.
Pamoka? „Geriausias“ AI modelis ne visada yra tas, kuris turi ryškiausią naują dizainą arba didžiausią teorinį efektyvumą. „Edge“ įrenginiams svarbiausia yra tai, kaip gerai modelis tinka aparatinei įrangai, kuria ji iš tikrųjų veikia.
Ir ta aparatūra taip pat greitai vystosi. Norėdami neatsilikti nuo šiuolaikinės AI reikalavimų, įrenginių gamintojai pradėjo įskaitant specialius specialius lustus, vadinamus AI greitintuvais išmaniuosiuose telefonuose, išmaniuosiuose laikrodžiuose, nešiojamuosiuose daiktuose ir dar daugiau. Šie greitintuvai yra sukurti specialiai, kad būtų galima tvarkyti skaičiavimus ir duomenų judėjimą, kurio reikia AI modeliams. Kiekvienais metais architektūros, gamybos ir integracijos pasiekimai užtikrina, kad aparatinė įranga atitiktų AI tendencijas.
Kelias į priekį „Edge Ai“
AI modelių dislokavimą krašto prietaisuose dar labiau apsunkina suskaidytas ekosistemos pobūdis. Kadangi daugeliui programų reikalingi pasirinktiniai modeliai ir specifinė aparatinė įranga, trūksta standartizacijos. Reikia efektyvių kūrimo priemonių, skirtų supaprastinti mašininio mokymosi gyvenimo ciklą, skirtą „Edge“ programoms. Tokie įrankiai turėtų palengvinti kūrėjams optimizuoti realaus pasaulio našumą, energijos suvartojimą ir latenciją.
Įrenginių gamintojų ir AI kūrėjų bendradarbiavimas sumažina atotrūkį tarp inžinerijos ir vartotojo sąveikos. Kylančios tendencijos sutelkia dėmesį į konteksto supratimą ir adaptyvųjį mokymąsi, leidžiant prietaisams numatyti ir reaguoti į vartotojo poreikius natūraliau. Pasitelkdamas aplinkos užuominas ir stebėdami vartotojų įpročius, „Edge AI“ gali pateikti atsakymus, kurie jaučiasi intuityvūs ir asmeniški. Lokalizuotas ir pritaikytas intelektas yra skirtas pakeisti mūsų ir pasaulio technologijų patirtį.
Iš jūsų svetainės straipsnių
Susiję straipsniai visame internete
Nuoroda į informacijos šaltinį