
Image by Catherine Breslin from Unsplash
AI visszaadja a hangját rák után, de a fedezet továbbra is elérhetetlen marad
A generatív AI hangtechnológia lehetővé tette, hogy Sonya Sotinsky újra beszéljen, miután a rákműtétje elvette a hangját.
Siet? Íme a legfontosabb tények:
- Ő mesterséges intelligenciát használt a hangjának újrateremtéséhez, előre felvett mintákat felhasználva.
- A mesterséges intelligencia által generált hangot egy Whisper nevű szövegbeszéd alkalmazáson keresztül használják.
- Havonta 99 dollárt fizet a mesterséges intelligencia által generált hangjáért, és most szélesebb körű hozzáférésért kampányol.
Miután diagnosztizálták Sonya Sotinskyt 4-es stádiumú nyelvrákkal, egy életmentő műtéten esett át, amely során eltávolították a nyelvét, a gégéjét és a hangdobozát. A beavatkozás megfosztotta őt a hangjától, mégis talált egy módot arra, hogy megtartsa a beszéd képességét.
Sotinsky a diagnózisa és a műtéte közötti öt hetes időszakban kezdte el a hangbankolást. Felvette, ahogy mindennapi kifejezéseket mond és gyerekkönyveket olvas, megőrizve ezzel egyedi hangját és szarkasztikus előadásmódját.
„A hangod azonosít téged” – mondta az NPR-nek, amely először számolt be erről a történetről. „Amikor nem tudod használni a hangod, az nagyon, nagyon frusztráló” – tette hozzá.
A műtétje idején, 2022 elején elérhető beszédtechnológiák korlátozottak és robotikusak voltak. Ráadásul a standard elektrolaringális eszközök nem működtek nála, mert nem volt nyelve.
De 2024 közepére a generatív AI fejlődése lehetővé tette a természetes emberi hangok sokkal nagyobb pontossággal történő reprodukálását. Az NPR jelentése szerint egy AI cég fejlesztett egyedi hangmodellt a nő által archivált felvételek felhasználásával. Ez lehetővé tette a szöveg-beszéd funkció használatát a mobiltelefonján lévő Whisper alkalmazáson keresztül.
A végeredmény lenyűgöző volt. Leánya, Ela Fuentevilla így írta le a pillanatot: “Visszakapta a régi, fanyar stílusát […] Elképesztően hasonló,” mondta az NPR-nek.
Azonban, ez a fokú hangvisszaállítás személyes áldozatot kíván. Az NPR jelentése szerint az első segítő hangtechnológia Sotinsky-t 3.000 dollárba kerülte. Most pedig havonta 99 dollárt költ a folyamatos használatra.
Az egészségbiztosító, az Arizonai Blue Cross Blue Shield, megtagadta a költségek fedezését. Az NPR jelentése szerint azzal érveltek, hogy az asszisztív kommunikációs eszközök nem felelnek meg az orvosi szükségesség kritériumainak.
Ez nem az első alkalom, hogy az AI szerepet játszik a hangok helyreállításában. Idén korábban a Radboud Egyetem és az UMC Utrecht tudósai fejlesztettek ki egy agyi implantátumot, amely valós időben, természetesen hangzó beszéddé alakítja az idegi jeleket. Az AI modell mindössze 80 ezredmásodperc alatt dekódolja az agyhullámokat, és még képes reprodukálni egy beteg eredeti hangját a sérülés előtti felvételek segítségével.
Az NPR jelentése szerint Sotinsky háttérbe lépett a karrierjében, hogy kiálljon a hangbankolásért és a mesterséges intelligencia alapú eszközökhöz való jobb hozzáférésért. Olyan kutatókkal dolgozik, akik remélik, hogy a klinikai vizsgálatok segítenek abban, hogy ez a technológia szélesebb körben hozzáférhetővé váljon, és végül biztosítási fedezet alá kerüljön.