Sora je najnovejši AI model, ki ga je razvilo podjetje OpenAI. Sora lahko iz besedilnih navodil ustvari realistične in domiselne videoposnetke, ki so dolgi do ene minute. Videoposnetki ohranjajo vizualno kakovost in se držijo zahtev uporabnika glede vsebine in sloga.
Sora je prvi video-generacijski model, ki ga je predstavilo OpenAI, znano po svojem prebojnem klepetnem robotu ChatGPT in priljubljenem modelu za generiranje slik Dall-E. Do zdaj je bil vodilni model za pretvorbo besedila v video razvit v brooklynskem podjetju Runway. Runwayjev najnaprednejši model, Gen-2, je bil predstavljen marca 2023. Nekateri uporabniki so se čudili superiornosti videoposnetkov, ki jih je ustvarila Sora, in opazili hitrost napredka AI v manj kot enem letu.
Sora je plod večletnega raziskovanja na področju difuzijskih modelov, ki so vrsta generativnih modelov, ki lahko ustvarjajo zapletene vzorce iz naključnega šuma. Sora uporablja posebno tehniko. Med učenjem modela se uporablja tudi ponovno označevanje, da se ustvarijo dobri opisi za videoposnetke, ki nimajo dobrih opisov.
Sora je sposobna ustvarjati videoposnetke v različnih ločljivostih in razmerjih stranic, pa tudi urejati obstoječe videoposnetke, kar omogoča hitro spreminjanje scene, osvetlitve in stila snemanja z besedilnim pozivom. Na spletni strani OpenAI so prikazani številni videoposnetki, ki jih je ustvarila Sora. Da bi še bolj pokazali zmožnosti Sore, je direktor OpenAI Sam Altman povabil uporabnike na X, da predlagajo pozive, iz katerih bi Sora ustvarila videoposnetke. Odgovorili so z zahtevami, kot so “navodilna kuharska seja za domače njoke, ki jo vodi babica, vplivnica na družbenih omrežjih, postavljena v rustikalni toskanski podeželski kuhinji s kinematografsko osvetlitvijo” in “pol raca pol zmaj leti skozi čudovit sončni zahod z morskim prašičkom, oblečenim v pustolovsko opremo, na hrbtu”.
Sora prihaja v kritičnem trenutku za te programe. Strokovnjaki so izrazili zaskrbljenost, da bi lahko z AI ustvarjena vsebina bila uporabljena za napačno vplivanje na volitve ali drugače povzročala zmedo po svetu. Svetovni gospodarski forum je v svojem poročilu o globalnih tveganjih za leto 2024 navedel, da je z AI ustvarjeno dezinformiranje in lažno informiranje največje tveganje, s katerim se bo svet soočal leta 2024.
Sora še ni na voljo javnosti. Za zdaj OpenAI omogoča dostop le rdečim ekipam – posameznikom, zaposlenim za iskanje težav – ki bodo ocenili morebitna tveganja, povezana z izdajo modela, pa tudi omejenemu številu “vizualnih umetnikov, oblikovalcev in filmskih ustvarjalcev, da bi pridobili povratne informacije o tem, kako napredovati model, da bi bil najbolj koristen za ustvarjalne strokovnjake”, je zapisano v blogu.
Komentiraj