Google järjesti vuotuisen Google I/O -tapahtuman, jossa se on usein esitellyt uusia laitteita sekä ohlemistoa. Tällä kertaa laitteet esiteltiin jo viime viikolla ja nyt Google keskittyi julkistustilaisuudessa suurilta osin tekoälyyn.
Kokonaisuudessaan Google esitteli tekoälyä kuluttajille, yrityksille, tutkimukseen ja infrastruktuuriin. Tavoitteena yhtiöllä on, että tekoäly saataisiin tuotua kaikkien avuksi.
Google esitteli uuden Gemini 1.5 Pro -tekoälymallin, joka on paranneltu versio Gemini 1.0 -versiosta. Gemini 1.5 Pro tukee 35 kieltä ja kykenee käsittelemään paljon aiempaa enemmän tietoa kerralla. Googlen mukaan jopa miljoonaa sanaa tai tekstipätkää, joita Google kutsuu tokeniksi.
Esimerkkinä Google antoi, että tekoälymalli kykenee ymmärtämään 1500-sivuisen PDF-tiedoston, 30 000 koodiriviä tai tunnin mittaisen videon.
Gemini 1.5 Pron lisäksi Googlelta nähtiin kevyempi Gemini 1.5 Flash. Gemini 1.5 Flash on varustettu pienemmällä viiveellä ja rakennettu käyttäjien palautteen perusteella kustannustehokkaaksi työkaluksi Project Astrassa . Poject Astra on Googlen visio seuraavan sukupolven tekoälyavustajasta. Project Astra ymmärtää Googlen esittelemän demon perusteella keskusteluiden kontekstin ja kykenee reagoimaan niihin. Project Astra on tulossa myöhemmin tänä vuonna osaksi Geminiä.
Google esitteli tekoälyä myös musiikinluojille ja videontuottajille. Imagen 3 on Googlen mukaan yhtiön tehokkain tekstistä kuvaksi -malli. Mallin avulla voidaan luoda “uskomattoman” yksityiskohtaisia, fotorealistisia ja todenmukaisia kuvia. Imagen 3:n avulla kuvissa esiintyy aiempaa vähemmän erilaisia häiriöitä ja visuaalisia artefakteja kuin aiemmissa malleissa.
Videoihin suunnattu Veo-moduuli kykenee tuottamaan korkealaatuisia Full HD -tasoisia videoita useilla erilaisilla tyyleillä. Tekoälyllä luodut videot voivat olla tässä vaiheessa enintään minuutin mittaisia.
Käytännössä Veo-moduuli toimii annetun tekstin pohjalta, eli tekoäly osaa generoida videota annettujen sanojen perusteella. Tekoälyn kerrotaan tunnistavan termejä, kuten “timelapse” ja “ilmakuva maisemasta” ja se pystyy luomaan niistä kuvamateriaalia. Googlen mukaan Veon tarjoama materiaali on johdonmukaista ja yhtenäistä, jossa esimerkiksi eläimet ja esineet liikkuvat realistisesti videon eri vaiheissa.
Aluksi Veo on saatavilla valikoitujen tekijöiden yksityisessä esikatselussa VideoFX:n kautta. Veo tulee saataville tulevaisuudessa esimerkiksi YouTube Shortsiin.
Kolmantena mediaan liittyvänä tekoälynä esiteltiin Music AI sandbox, joka on suunnattu musiikin tuottajien käyttöön. Työkalun avulla tuotettuun musiikkiin saadaan lisättyä sanojen perusteella haluttuja ääniä ja tekoäly osaa sovittaa äänet jo valmiiksi luotuun materiaaliin.
Lähde: Google