24. April, 2024 19:46

Thermonator: Robottikoira, johon on yhdistetty liekinheitin - hinta alle 9000 euroa
24. April, 2024 9:11

Väite: Applen Vision Pro -lasit ovat floppi, Apple leikkasi tuotantomäärät lähes puoleen

24. April, 2024 7:43 1

TS: Tietosuojavaltuutettu aloitti selvityksen, rikkooko Yle Areenan kirjautumispakko lakia
23. April, 2024 21:52

Huikea ohjelmistopäivitys onnistui: 24 miljardin kilometrin päässä oleva 46-vuotias Voyager 1 lähettää taas dataa
23. April, 2024 17:01

OnePlussan Pad Go maksaa vain hieman vähemmän kuin paremmin varusteltu OnePlus Pad
23. April, 2024 15:43

SkyShowtime -palveluun mainoksilla varustettu tilausvaihtoehto - mainoksista vapaan tilauksen hinta nousi
23. April, 2024 11:39

Listaus: Parhaat näytönohjaimet loppukeväästä 2024 - Kaikki mallit, tehokkaimmasta hitaimpaan ja mukana myös vanhemmat näytönohjaimet
23. April, 2024 7:43

Taas mennään... Europol haluaa kieltää salatun viestiliikenteen, kuten WhatsAppin ja Signalin
22. April, 2024 22:39

Päivän diili: kesäksi tehokas robottileikkuri - Ecovacs Goat G1 nyt 300 euron alessa
22. April, 2024 13:23

Palo Alton VPN-ratkaisussa merkittävä haavoittuvuus - Tietomurtohavaintoja tehty Suomessa
22. April, 2024 11:51

Valokuitunen laittaa lähes 10 miljoonaa euroa Oulun valokuituverkon rakentamiseen
21. April, 2024 20:31 1

HBO Maxin pysyvä 50% alennus pysyy voimassa, kun Max tulee käyttöön - Kunhan et tee tätä virhettä
21. April, 2024 20:14

EU: Ei, maksullinen Facebook ei ole riittävä "vaihtoehto" mainoksia kohdentavalle Facebookille
21. April, 2024 19:31

Tietokonemaailman todellinen legenda, Z80-prosessori, lakkautetaan lähes 50 vuoden jälkeen - sinäkin olet lähes varmasti käyttänyt sitä
19. April, 2024 21:21

Hinnankorotukset ja salasanojen jakamisen esto eivät haittaa mitään: Netflixin tilaajamäärät kasvavat kohisten
19. April, 2024 21:06

Samsung paniikkitilaan: Pomot tekemään kuusipäiväistä työviikkoa

Tietokoneet oppivat puhumaan jo viidessä minuutissa – IBM kehitti uuden tekoälymallin

Manu Pitkänen

1. October, 2019 5:56

Tekoäly kehittyy valtavaa tahtia ja suurin harppauksin parhaillaan, kun yritykset investoivat tekoälyn laskentakapasiteetin lisäämiseen ja kehittämiseen, mutta lisäksi tekoälyn taustalla olevat algoritmit ja mallit kehittyvät tehokkaammiksi sekä tietysti älykkäämmiksi.

Teknologiajätti IBM on esimerkiksi nyt onnistunut luomaan puhetta tekstisyötteestä tuottavan tekoälymallin, joka yltää laadukkaaseen puhesyntetisointiin vain viisi minuuttia kestävän puheen kuuntelun avulla. Tämä on suuri saavutus, sillä useimmat nykyiset puhesyntetisointimallit vaativat toimiakseen kattavan tausta-aineiston, jonka käsittely on luonnollisesti vie paljon aikaa.

IBM:n mallin nerous piilee sen modulaarisessa luonteessa. Mallissa on erikseen esimerkiksi puheen kestoa, painoa ja korkoa arvioiva komponentti, minkä lisäksi mallista löytyy muihin akustisiin piirteisiin liittyvä osa. Näiden analysointien pohjalta mallin vokooderi luo audionäytteitä. Kukin komponentti toimii keskenään ja yrittävät opettaa toinen toisiaan jotta lopputulos vastaisi mahdollisimman paljon alkuperäistä ääninäytettä.

Voit testata teknologian toimivuutta täällä (valitse ääneksi V3).

TÄMÄN UUTISEN KOMMENTOINTI ON PÄÄTTYNYT