Blog | 11 Marzo 2026

Intelligenza Artificiale ed Esperienze Immersive

Come creare video 360° con l’AI generativa

L’intelligenza artificiale generativa sta cambiando rapidamente il modo in cui produciamo contenuti visivi. Ma cosa succede quando queste tecnologie incontrano il mondo del video immersivo a 360°? Da qualche tempo stiamo sperimentando in Cinemagica alcune tecniche per generare e modificare contenuti immersivi sferici attraverso modelli di AI, e i risultati sono già molto interessanti.

Lo stato dell’arte: dall’immagine statica al video immersivo

Fino a poco tempo fa, le possibilità offerte dall’intelligenza artificiale applicata ai contenuti a 360° erano limitate alla generazione e alla modifica di immagini statiche equirettangolari. Si poteva, ad esempio, utilizzare modelli di inpainting per rimuovere il treppiede dal nadir di una foto sferica, oppure generare ambienti panoramici a partire da un prompt testuale. Operazioni utili, ma che restavano confinate al singolo fotogramma.

Oggi lo scenario è cambiato. Sono disponibili modelli che, combinando un’immagine di riferimento e un prompt testuale, sono in grado di generare una sequenza video a partire da un’immagine sferica fissa. In altre parole: possiamo prendere una foto a 360° e trasformarla in un video immersivo con movimento di camera, il tutto guidato dall’intelligenza artificiale.

Come funziona il processo di creazione

Il flusso di lavoro è più semplice di quanto si possa pensare, e si articola in pochi passaggi fondamentali.

Si parte dalla creazione o dalla selezione di un’immagine sferica equirettangolare, che costituirà il fotogramma di base — il punto di partenza visivo dell’intera sequenza. Questa immagine può essere una foto reale scattata con una camera 360°, oppure un’immagine generata o ricostruita tramite AI.

A questo punto, l’immagine viene fornita al modello insieme a un prompt testuale che descrive il tipo di movimento o trasformazione desiderata: una carrellata in avanti, un’elevazione del punto di vista, una panoramica laterale. Il modello analizza la scena e genera, fotogramma dopo fotogramma, l’intera sequenza video, mantenendo la coerenza spaziale dell’ambiente sferico.

Il risultato è un video immersivo fruibile su visori VR, su player web a 360° o su qualsiasi piattaforma compatibile con il formato equirettangolare.

Due esempi concreti con approcci diversi

Per mostrare le potenzialità di questa tecnica, abbiamo realizzato due esperimenti con approcci differenti.

Esempio 1: dal fotogramma reale al video — il Duomo di Molfetta

Nel primo caso siamo partiti da un’immagine sferica reale, ripresa da noi all’interno del Duomo di Molfetta. Si tratta di una foto a 360° autentica, con tutta la ricchezza di dettaglio e le caratteristiche di luce dell’ambiente reale.

Tramite un prompt, abbiamo chiesto al modello di generare una carrellata in avanti verso l’altare. Il risultato è un breve video immersivo in cui la camera avanza lungo la navata, mantenendo una buona coerenza geometrica con l’architettura della cattedrale.

Duomo Molfetta 01 — Duomo di Molfetta – Immagine di partenza

Duomo Molfetta AI Video Generation

Esempio 2: dall’immagine rettilinea all’immersione completa — il Castello di Bernalda

Il secondo esperimento è più articolato e mostra un flusso di lavoro in due fasi.

Siamo partiti da un’immagine rettilinea, estratta da un fotogramma di una clip reale del Castello di Bernalda. Un’immagine tradizionale, con un campo visivo limitato. Il primo passo è stato utilizzare l’AI per ricostruire la porzione mancante della scena, generando un’immagine sferica completa a 360° a partire dal frammento disponibile — un’operazione nota come outpainting sferico.

Una volta ottenuta l’immagine equirettangolare completa, abbiamo proceduto come nel primo esempio: tramite prompt, abbiamo chiesto al modello di generare un video con un movimento di camera che include un’elevazione del punto di vista, come se la camera si alzasse per rivelare il paesaggio circostante.

Bernalda Castello Full Sphere — Castello di Bernalda – Immagine sferica di partenza

Bernalda Castello Rectilinear — Castello di Bernalda – Immagine rettilinea estratta da quella sferica

Bernalda Castello AI Image Generation — Immagine Immersiva generata dalla AI partendo da quella rettilinea

Bernalda Castello AI Video Generation

Questo secondo esempio è particolarmente significativo perché dimostra come sia possibile partire da materiale video tradizionale, non necessariamente girato in 360°, e ricostruire un’esperienza immersiva completa grazie all’intelligenza artificiale.

Limiti attuali e prospettive

I risultati ottenuti sono, a nostro avviso, già soddisfacenti, soprattutto considerando che siamo nelle fasi iniziali di sviluppo di questi modelli. Non esistono ancora molti sistemi addestrati specificamente su immagini sferiche equirettangolari, e questo si riflette in alcune limitazioni visibili: artefatti nelle zone di giunzione, occasionali incoerenze geometriche nelle linee architettoniche, e una risoluzione che non è ancora paragonabile a quella di una ripresa nativa in 8K.

Tuttavia, la direzione è chiara. I modelli stanno evolvendo rapidamente, e l’addestramento su dataset specificamente progettati per contenuti sferici migliorerà significativamente la qualità dell’output. Quello che oggi richiede sperimentazione e aggiustamenti manuali, domani potrebbe diventare un passaggio fluido e integrato nelle pipeline di produzione immersiva.

Cosa significa per il settore immersivo

Per chi, come noi, lavora quotidianamente nella produzione di video immersivi e esperienze VR, queste tecnologie aprono scenari concreti e molto promettenti.

Pensiamo alla possibilità di arricchire un virtual tour con sequenze video generate a partire da fotografie statiche, o di creare anteprime immersive di ambienti ancora in fase di progettazione. Oppure alla capacità di ricostruire esperienze immersive a partire da materiale d’archivio in formato tradizionale, dando nuova vita a riprese che non erano state pensate per la fruizione a 360°.

L’intelligenza artificiale non sostituisce la ripresa sul campo né la competenza nella produzione immersiva, ma aggiunge uno strumento potente al nostro arsenale creativo. Ed è esattamente il tipo di innovazione che seguiamo e integriamo nel nostro lavoro in Cinemagica.

Articolo pubblicato originariamente su LinkedIn

Share this page

Related news

17 Luglio 2025

Venice Immersive 2025: l’impatto XR al cuore della Biennale

Anche quest’anno, la Mostra del Cinema di Venezia conferma il suo ruolo di riferimento per il mondo della realtà immersiva. Dal 27 agosto al 6 settembre 2025, l’Isola del Lazzaretto Vecchio si trasforma nel cuore pulsante di Venice Immersive, la...

Read

24 Giugno 2025

DaVinci Resolve 20: un vero ambiente professionale per il video immersivo

Con la versione 20, DaVinci Resolve compie un salto importante verso l’integrazione totale del video immersivo nei suoi flussi di lavoro. Blackmagic Design ha chiaramente puntato a offrire una piattaforma completa per chi realizza contenuti pensati per visori come l’Apple...

Read

17 Giugno 2025

visionOS 26: Apple consolida il supporto di video immersivi su Vision Pro

Con la versione 26 di visionOS, Apple rafforza la centralità del Vision Pro come piattaforma di riferimento per la fruizione e la produzione di contenuti immersivi. L’aggiornamento introduce miglioramenti concreti che toccano direttamente il mondo del video a 180°, 360°...

Read

10 Giugno 2025

Sphere di Las Vegas: il futuro dell’intrattenimento immersivo è già realtà

Inaugurato nel 2023, lo Sphere di Las Vegas non è semplicemente un'arena o un teatro: è una piattaforma rivoluzionaria di esperienze sensoriali, progettata per riscrivere completamente il modo in cui viviamo spettacoli, concerti ed eventi visivi. Cos’è lo Sphere? Lo...

Read