Tekoälyä mikro-ohjaimiin10.10.2022 Mikro-ohjaimissa on äärimmäisen rajallinen muisti eikä käyttöjärjestelmää, mikä tekee tekoälymallien kouluttamisen näihin laitteisiin haastavaksi. Ongelman ratkaisemiseksi MIT:n ja MIT-IBM Watson AI Lab -laboratorion tutkijat kehittivät uuden tekniikan, joka mahdollistaa laitteen harjoittamisen käyttämällä vähemmän kuin 256 kilotavua muistia. "Vähäisempi resurssien käyttö tekee syvän oppimisen helpommin saavutettavaksi ja sillä voi olla laajempi ulottuvuus, erityisesti pienitehoisille reunalaitteille", sanoo apulaisprofessori ja MIT-IBM Watson AI Labin jäsen Song Han. Yleisin koneoppimismallin tyyppi tunnetaan neuroverkkona. Ne on ensin koulutettava, mikä edellyttää miljoonien esimerkkien näyttämistä, jotta se voi oppia tehtävän. Han ja hänen työtoverinsa käyttivät kahta algoritmista ratkaisua tehdäkseen neuroverkon harjoitteluprosessista tehokkaamman ja vähemmän muisti-intensiivisen. Ensimmäinen tunnetaan nimellä harva päivitys, ja se käyttää algoritmia, joka tunnistaa tärkeimmät painot, jotka päivitetään jokaisella harjoituskierroksella. "Koko mallin päivittäminen on erittäin kallista, koska aktivaatioita on paljon, joten yleensä päivitetään vain viimeinen kerros mutta se heikentää tarkkuutta. Päivitämme menetelmässämme valikoivasti tärkeitä painoja ja varmistamme, että tarkkuus säilyy täysin”, Han sanoo. Heidän toinen ratkaisunsa sisältää kvantisoidun harjoittelun ja painojen yksinkertaistamisen, jotka ovat tyypillisesti 32 bittiä. Algoritmi pyöristää painot kahdeksaan bittiin mikä vähentää muistin määrää sekä harjoittelua että päätelmiä varten. Päättely on prosessi, jossa mallia sovelletaan datajoukkoon ja luodaan ennuste. Sitten algoritmi käyttää tekniikkaa, jota kutsutaan kvantisointitietoiseksi skaalaukseksi (QAS), joka toimii kertoimena säätämään painon ja gradientin välistä suhdetta, jotta vältetään kvantisoidusta harjoittelusta mahdollisesti aiheutuva tarkkuuden lasku. Tutkijat testasivat puitteitaan kouluttamalla tietokonenäkömallia tunnistamaan ihmisiä kuvista. Vain 10 minuutin harjoittelun jälkeen malli oppi suorittamaan tehtävän onnistuneesti. Heidän menetelmänsä pystyi kouluttamaan mallia yli 20 kertaa nopeammin kuin muut lähestymistavat. ”Tekoälymallin sovittaminen/koulutus laitteessa, erityisesti sulautetuissa ohjaimissa, on avoin haaste. Tämä tutkimus on osoittanut kyvyt, vaan myös avannut uusia mahdollisuuksia yksityisyyttä säilyttävien laitteiden personointiin reaaliajassa", sanoo Nilesh Jain, Intelin pääinsinööri, joka ei ollut mukana tässä työssä. "Laitteessa tapahtuva oppiminen on seuraava suuri edistysaskel, jonka eteen teemme töitä yhdistetyn älykkään reunan hyväksi. Professori Song Hanin ryhmä on osoittanut suurta edistystä koulutuksessa käytettävien reunalaitteiden tehokkuuden osoittamisessa", lisää Jilei Hou, Qualcommin tekoälytutkimuksen johtaja. Aiheeesta aiemmin: Kuitujen epälineaarisuuden korjaus neuroverkolla Analogialaskentaa verkon reunalle |
Nanotekniikka on tulevaisuuden lupaus. Näillä sivuilla seurataan elektroniikkaa sekä tieto- ja sähkötekniikkaa sivuavia nanoteknisiä tiedeuutisia.