Aplikačné kontajnery ako spúšťač AI
Čas čítania: 8m. 42s.

Aplikačné kontajnery ako spúšťač AI

Ellen Friedman, Ellen Friedman je hlavnou technologičkou HPE, zameriava sa na analýzu veľkých objemov dát a strojové učenie. Pred príchodom do HPE pôsobila v spoločnosti MapR Technologies, pracovala ako vývojárka open-source projektov Apache Drill a Apache Mahout a je spoluautorkou viacerých publikácií vydavateľstva O’Reilly Media, vrátane titulov AI & Analytics in Production, Machine Learning Logistics a tiež série o praktickom využití strojového učenia.
27.6.2020
Aplikačné kontajnery a mikroslužby zrýchľujú vývoj umelej inteligencie (AI). Stačí vaše aplikácie vybudovať len raz, vďaka kontajnerom už budú bežať kdekoľvek.

Keď spoločnosti pred desiatimi rokmi začali prvýkrát používať kontajnery Docker, ich hlavným cieľom bolo riešenie problému mobility: jednoducho povedané, aby softvér robil stále to isté bez ohľadu na systém, na ktorom bežal. Vytvorenie jednotlivých mikroservisov, ktoré možno ľahko modifikovať a škálovať bez toho, aby to ovplyvnilo celý systém, prinieslo do vývojových prostredí predvídateľnosť a spoľahlivosť.

Budovanie komplexných aplikácií AI nebolo pre používateľov kontajnerov prioritou. AI aplikácie si vyžadovali kopec práce a veľa zdrojov na nasadenie. No v dobe, keď sa kontajnery stávajú čoraz populárnejšími a zavedenie AI sa stáva mainstreamom, podniky začínajú využívať kontajnerizáciu pre lepšiu spoľahlivosť, prenosnosť a flexibilitu projektov, ktoré sú postavené na AI a strojovom učení.

Technológia AI v poslednom období zažíva obrovský boom. Len v Severnej Amerike sa očakáva, že AI trh s hardvérom, softvérom a službami porastie z 21 miliárd dolárov v roku 2018 na 203 miliárd dolárov v roku 2026. AI hrá dôležitú úlohu prakticky v každom odvetví: od autonómnych vozidiel, cez digitálnych hlasových asistentov až po analýzu sentimentu zákazníckeho správania.

Rozširovanie AI je poháňané celým radom faktorov. Patrí medzi ne rozsiahla dostupnosť obrovských súborov s dátami z mnohých zdrojov, zvýšenie povedomia firiem a organizácií o hodnote dát, ľahšie dostupné AI nástroje a technológie, lacnejšie výpočty a rastúci počet dátových vedcov a dátových inžinierov. Stručne povedané, ľudia vidia, že AI sa v biznise skutočne môže vyplatiť.

Hodnota, ktorú vďaka kontajnerom získate

Prečo teda spoločnosti používajú kontajnery na uľahčenie vývoja a nasadenia aplikácií AI? Hlavným dôvodom je, že kontajnery poskytujú flexibilitu vďaka tomu, že umožňujú, aby sa aplikácie zostavili len raz a bežali kdekoľvek ― na ktoromkoľvek serveri, s akýmkoľvek poskytovateľom cloudu či na ľubovoľnom operačnom systéme.

Na to, aby podniky naplno využili strojové učenie, najímajú veľa dátových vedcov. Títo vysoko kvalifikovaní odborníci vytvárajú softvérové ​​matematické modely, ktoré spracúvajú obrovské množstvo historických údajov s cieľom predpovedať biznisové výsledky. Google, Tesla, Amazon a ďalšie spoločnosti vďaka poznatkom, ktoré generujú prostredníctvom pokročilých modelov strojového učenia, doslova narušili zaužívané trhové praktiky.

Ak si však myslíte, že stačí najať pár šikovných a skúsených dátových vedcov, nie je to tak. Vnímanie AI sa totiž v posledných rokoch dramaticky zmenilo: z vedeckej či odbornej disciplíny sa stal nástroj praktického podnikového (biznisového) využitia v rôznych odvetviach. Organizácie, ktoré nad zavedením AI uvažujú, by preto mali mať k dispozícii adekvátne nástroje a procesy na prevádzku modelov strojového učenia a ich nasadenie do výrobných aplikácií.

Výzvy pri budovaní modelov strojového učenia

Dátoví vedci tvorbu modelov strojového učenia chápu ako opakujúci sa proces: máme na mysli dátový výskum, spracovanie dát, extrakciu prvkov, „trénovanie“ modelov a ich validáciu, či samotné nasadenie modelov. Strojové učenie nefunguje na princípe „raz to nasadím a je to hotové“. Ak v predstihu viete, čo potrebujete, stačí predsa napísať kód. Hovoríme o inom procese: dáta a strojové učenie učia softvér skúšať rôzne cesty, až sám nedospeje k riešeniu, ktoré reprezentuje skutočný svet.

Projekt strojového učenia prechádza niekoľkými krokmi a iteráciami. Najprv musíte prejsť experimentálnou fázou, počas ktorej zistíte, ktoré algoritmy sú najvhodnejšie pre dané dáta a vaše biznisové výzvy. Tímy dátových vedcov často experimentujú s rôznymi algoritmami v rôznych prostrediach a nakoniec vyberú ten, ktorý sa k danému problému hodí najviac.

Výzvou bude plánovanie a riadenie neustále sa meniacich požiadaviek na výpočtovú silu. Výcvikové modely strojového učenia sú náročné na výpočty, najmä počas fázy získavania údajov a samotného tréningu. Modelová inferencia (proces, keď sa na tvorbu predikcií použije vytrénovaný model a nové dáta) si vyžaduje relatívne menej výpočtového výkonu. Tieto výpočtové systémy však musia byť spoľahlivé – slúžia totiž modelom, ktoré vykonávajú kriticky dôležité obchodné funkcie. Podniky pre tieto meniace sa požiadavky využívajú tzv. hybridnú architektúru, ktorú prevádzkujú vo svojich priestoroch a tiež vo verejnom cloude. Takéto riešenie im umožňuje realizovať efektívnejšie a nákladovo výhodnejšie výpočty, ktoré sú v prípade dátovej vedy vysoké.

Ako kontajnery pomáhajú životnému cyklu strojového učenia

Používanie aplikačných kontajnerov umožňuje urýchlenie vývoja modelov strojového učenia. Kontajnerizované vývojové prostredia môžu byť zabezpečené v priebehu pár minút, príprava tradičných riešení môže trvať týždne až mesiace. Spracovanie údajov a extrakcia prvkov sú kľúčovou súčasťou životného cyklu strojového učenia. Použitie vývojových prostredí v kontajneroch uľahčuje rozdeľovanie klastrov podľa potreby.

Kontajnery počas tréningovej fázy poskytujú flexibilitu na vytváranie distribuovaných tréningových prostredí na viacerých hostiteľských serveroch, čo umožňuje lepšie využitie vašej infraštruktúry. A akonáhle budú „vytrénované“, modely môžu byť použité ako koncové kontajnerové body a nasadené buď na vašich interných serveroch, vo verejnom cloude alebo na okraji siete.

Tieto koncové body môžu byť škálované nahor i nadol v závislosti od dopytov a zároveň tak, aby boli spoľahlivé a dostatočne výkonné. Ak napríklad obsluhujete e-shop, ktorý zákazníkom generuje nákupné odporúčania, v prípade, že zaznamenáte zvýšenú návštevnosť stránky, môžete podľa potreby pridať ďalšie kontajnery. Keď dopyt klesne, môžete nepotrebné kontajnery „uzatvoriť“. Tým zefektívnite využitie drahého hardvéru.

AI a izolácia

Balenie aplikácie a jej závislostí izolovane od iných kontajnerových aplikácií je obzvlášť užitočné pre AI systémy. Al potrebuje väčšiu izoláciu ako vývoj konvenčného softvéru, pretože si vyžaduje viac rôznych verzií softvérových nástrojov a modelov. Tradiční vývojári sú zvyknutí reagovať na aktualizácie softvéru a z nich vyplývajúce zmeny sú zvyčajne oveľa menej invazívne, ako v prípade rôznych verzií budovania modelov AI.

Dátoví vedci môžu byť napríklad veľmi citliví, keď sa s grafickými procesormi používajú rôzne verzie TensorFlow alebo PyTorch. Výber nástrojov a ich verzií môže výrazne ovplyvniť dĺžku trvania tréningového procesu modelu. Dátoví vedci taktiež potrebujú kontrolovať prostredie, v ktorom model beží, a zároveň chcú mať možnosť naraz prevádzkovať rôzne modely v rôznych  prostrediach.

Reprodukovateľnosť je dôležitá aj v prípade, keď model potrebujete opätovne „vytrénovať“. Aby boli výsledky presné, úlohou vývojárov je namodelovať rovnaké prostredie s rovnakými verziami nástrojov a závislých knižníc. Zmena verzie v závislých knižniciach by mohla spôsobiť, že riešenie nebude nakoniec fungovať.

Príklady použitia AI a strojového učenia

Aplikácie strojového učenia sú, prirodzene, veľmi závislé od dát. Preto ich nasadenie na kontajnery nie je také jednoduché, ako nasadenie webových aplikácií alebo iných aplikácií založených na mikroprocesoch. Je dobré ich špeciálne nakonfigurovať, aby dáta v kontajneri ostali zachované v pôvodnej kvalite. Aj keď sú kontajnery skvelou voľbou pri tvorbe flexibilných a prenosných aplikácií, v zložitom systéme je náročné súbežne spravovať viac kontajnerov. A práve vtedy prichádza Kubernetes.

Kubernetes je open source framework, ktorý organizuje nasadenie a manažment kontajnerových aplikácií v cloude. Samotný Kubernetes vám však nebude stačiť na nasadenie kontajnerových aplikácií v podnikovom meradle. Jeho nasadenie v podnikovom prostredí si vyžaduje veľa ďalších funkcií: od správy, cez monitorovanie a trvalé ukladanie údajov až po zabezpečenie a prístupové kontroly.

Jednou z kľúčových funkcií na rozšírenie používania kontajnerov je podpora trvalého ukladania stavových aplikácií. V prípade analytických údajov a aplikácií strojového učenia, ktoré prístup k údajom potrebujú, je potrebná dátová vrstva alebo dátová štruktúra, ktorá zabezpečí, že všetky kontajnerové aplikácie budú mať konzistentný pohľad na údaje, bez ohľadu na miesto ich nasadenia.

Čaká nás mnoho ďalších inovácií

Podobne ako pri softvérovom inžinierstve, aj strojové učenie môže ťažiť  z agility, možnosti prenosu aplikácií a flexibility, ktorú kontajnery prinášajú. Napríklad KubeDirector je open source projekt, ktorý zjednodušuje nasadenie strojového učenia vo výrobe a je určený na spúšťanie komplexných a distribuovaných stavových aplikácií na serveri Kubernetes. KubeFlow je ďalší open source nástroj nadizajnovaný na zjednodušenie nasadzovania strojového učenia. S rastúcim používaním kontajnerov sa v tejto oblasti určte stretneme s ďalšími prichádzajúcimi inováciami.

SVET HPE

Používate zastaralý prehliadač. Môžete si ho aktualizovať na tejto stránke.

Spýtajte sa špecialistu

Nesprávne vyplnené pole.
Nesprávne vyplnené pole.
Nesprávne vyplnené pole.
Nesprávne vyplnené pole.
Email nieje správny.
Telefón nieje správny.
Vyberte jednu z možností.
Nesprávne vyplnené pole.
Vyberte jednu z možností.
Nesprávne vyplnené pole.
Vyberte jednu z možností.
Nesprávne vyplnené pole.
Môže vám spoločnosť HPE poskytnúť personalizovanú komunikáciu o spoločnosti HPE a vybraných produktoch, službách a ponukách spoločnosti HPE?

Telefón

SMS

E-mail



Chcem odoberať novinky HPE (Newsletter).

Súhlasím so všeobecnými obchodnými podmienkami a prečítal/a som si zásady ochrany súkromia a udeľujem súhlas so spracovaním mojich osobných údajov

Nepodarilo sa odoslať formulár.
Tieto stránky sú chránené reCAPTCHA a spoločnosťou Google a platia Pravidlá ochrany osobných údajov a Zmluvné podmienky.

Stiahnite si infografiku zdarma

A získajte stručný prehľad prečo je HPE GreenLake vhodným produktom práve pre vás, stačí keď nám zanecháte svoj email.

Email nieje správny.


Chcem odoberať novinky HPE (Newsletter).

Súhlasím so všeobecnými obchodnými podmienkami a prečítal/a som si zásady ochrany súkromia a udeľujem súhlas so spracovaním mojich osobných údajov.

Nepodarilo sa odoslať formulár.
Tieto stránky sú chránené reCAPTCHA a spoločnosťou Google a platia Pravidlá ochrany osobných údajov a Zmluvné podmienky.