Intelligenza Artificiale ed Esperienze Immersive

Come creare video 360° con l’AI generativa

L’intelligenza artificiale generativa sta cambiando rapidamente il modo in cui produciamo contenuti visivi. Ma cosa succede quando queste tecnologie incontrano il mondo del video immersivo a 360°? Da qualche tempo stiamo sperimentando in Cinemagica alcune tecniche per generare e modificare contenuti immersivi sferici attraverso modelli di AI, e i risultati sono già molto interessanti.

Lo stato dell’arte: dall’immagine statica al video immersivo

Fino a poco tempo fa, le possibilità offerte dall’intelligenza artificiale applicata ai contenuti a 360° erano limitate alla generazione e alla modifica di immagini statiche equirettangolari. Si poteva, ad esempio, utilizzare modelli di inpainting per rimuovere il treppiede dal nadir di una foto sferica, oppure generare ambienti panoramici a partire da un prompt testuale. Operazioni utili, ma che restavano confinate al singolo fotogramma.

Oggi lo scenario è cambiato. Sono disponibili modelli che, combinando un’immagine di riferimento e un prompt testuale, sono in grado di generare una sequenza video a partire da un’immagine sferica fissa. In altre parole: possiamo prendere una foto a 360° e trasformarla in un video immersivo con movimento di camera, il tutto guidato dall’intelligenza artificiale.

Come funziona il processo di creazione

Il flusso di lavoro è più semplice di quanto si possa pensare, e si articola in pochi passaggi fondamentali.

Si parte dalla creazione o dalla selezione di un’immagine sferica equirettangolare, che costituirà il fotogramma di base — il punto di partenza visivo dell’intera sequenza. Questa immagine può essere una foto reale scattata con una camera 360°, oppure un’immagine generata o ricostruita tramite AI.

A questo punto, l’immagine viene fornita al modello insieme a un prompt testuale che descrive il tipo di movimento o trasformazione desiderata: una carrellata in avanti, un’elevazione del punto di vista, una panoramica laterale. Il modello analizza la scena e genera, fotogramma dopo fotogramma, l’intera sequenza video, mantenendo la coerenza spaziale dell’ambiente sferico.

Il risultato è un video immersivo fruibile su visori VR, su player web a 360° o su qualsiasi piattaforma compatibile con il formato equirettangolare.

Due esempi concreti con approcci diversi

Per mostrare le potenzialità di questa tecnica, abbiamo realizzato due esperimenti con approcci differenti.

Esempio 1: dal fotogramma reale al video — il Duomo di Molfetta

Nel primo caso siamo partiti da un’immagine sferica reale, ripresa da noi all’interno del Duomo di Molfetta. Si tratta di una foto a 360° autentica, con tutta la ricchezza di dettaglio e le caratteristiche di luce dell’ambiente reale.

Tramite un prompt, abbiamo chiesto al modello di generare una carrellata in avanti verso l’altare. Il risultato è un breve video immersivo in cui la camera avanza lungo la navata, mantenendo una buona coerenza geometrica con l’architettura della cattedrale.

Duomo Molfetta 01
Duomo di Molfetta – Immagine di partenza
Duomo Molfetta AI Video Generation
Duomo Molfetta AI Video Generation

Esempio 2: dall’immagine rettilinea all’immersione completa — il Castello di Bernalda

Il secondo esperimento è più articolato e mostra un flusso di lavoro in due fasi.

Siamo partiti da un’immagine rettilinea, estratta da un fotogramma di una clip reale del Castello di Bernalda. Un’immagine tradizionale, con un campo visivo limitato. Il primo passo è stato utilizzare l’AI per ricostruire la porzione mancante della scena, generando un’immagine sferica completa a 360° a partire dal frammento disponibile — un’operazione nota come outpainting sferico.

Una volta ottenuta l’immagine equirettangolare completa, abbiamo proceduto come nel primo esempio: tramite prompt, abbiamo chiesto al modello di generare un video con un movimento di camera che include un’elevazione del punto di vista, come se la camera si alzasse per rivelare il paesaggio circostante.

Bernalda Castello Full Sphere
Castello di Bernalda – Immagine sferica di partenza
Bernalda Castello Rectilinear
Castello di Bernalda – Immagine rettilinea estratta da quella sferica
Bernalda Castello AI Image Generation
Immagine Immersiva generata dalla AI partendo da quella rettilinea
Bernalda Castello AI Video Generation
Bernalda Castello AI Video Generation

Questo secondo esempio è particolarmente significativo perché dimostra come sia possibile partire da materiale video tradizionale, non necessariamente girato in 360°, e ricostruire un’esperienza immersiva completa grazie all’intelligenza artificiale.

Limiti attuali e prospettive

I risultati ottenuti sono, a nostro avviso, già soddisfacenti, soprattutto considerando che siamo nelle fasi iniziali di sviluppo di questi modelli. Non esistono ancora molti sistemi addestrati specificamente su immagini sferiche equirettangolari, e questo si riflette in alcune limitazioni visibili: artefatti nelle zone di giunzione, occasionali incoerenze geometriche nelle linee architettoniche, e una risoluzione che non è ancora paragonabile a quella di una ripresa nativa in 8K.

Tuttavia, la direzione è chiara. I modelli stanno evolvendo rapidamente, e l’addestramento su dataset specificamente progettati per contenuti sferici migliorerà significativamente la qualità dell’output. Quello che oggi richiede sperimentazione e aggiustamenti manuali, domani potrebbe diventare un passaggio fluido e integrato nelle pipeline di produzione immersiva.

Cosa significa per il settore immersivo

Per chi, come noi, lavora quotidianamente nella produzione di video immersivi e esperienze VR, queste tecnologie aprono scenari concreti e molto promettenti.

Pensiamo alla possibilità di arricchire un virtual tour con sequenze video generate a partire da fotografie statiche, o di creare anteprime immersive di ambienti ancora in fase di progettazione. Oppure alla capacità di ricostruire esperienze immersive a partire da materiale d’archivio in formato tradizionale, dando nuova vita a riprese che non erano state pensate per la fruizione a 360°.

L’intelligenza artificiale non sostituisce la ripresa sul campo né la competenza nella produzione immersiva, ma aggiunge uno strumento potente al nostro arsenale creativo. Ed è esattamente il tipo di innovazione che seguiamo e integriamo nel nostro lavoro in Cinemagica.

Articolo pubblicato originariamente su LinkedIn