Microsoft PhotoSynth aggiunge la prospettiva 3D al mondo della fotografia
05/05/2008 20:29:04Abbiamo visto Google Earth fare la sua comparsa qualche anno fa sui nostri pc e siamo rimasti tutti a bocca aperta davanti alla possibilità di guardare "dal cielo" il giardino di casa nostra o la torre Eiffel... ancora stiamo esplorando il nostro mondo dal satellite che ecco arrivare Photosynth, un software in via di rilascio (ormai da quasi 5 mesi) della Microsoft che ci offrirà la possibilità di guardare le fotografie attraverso una prospettiva tridimensionale.
PhotoSynth è in grado di farci navigare nelle immagini in 3D, dando cioè la sensazione di muoverci nello spazio, partendo da una collezione di foto che ritraggono lo stesso soggetto. E' possibile ad esempio, guardando l'immagine di un'auto, ruotarci intorno e visualizzare quindi tutti i suoi lati oltre a potere zoomare senza perdere la risoluzione e quindi il dettaglio di ogni particolare. E' possibile anche ad esempio guardare l'immagine di una piazza e potere "camminare" virtualmente guardandosi intorno come se ci si trovasse proprio là.
Per fare tutto questo il software ha bisogno di una collezione di immagini che ritraggono il soggetto da più angolazioni diverse. Tante più sono le fotografie, tanto più sarà elevato il dettaglio dello spostamento e della visualizzazione. Ciascuna immagine viene poi elaborata e da ognuna vengono estrapolati centinaia di elementi caratteristici grafici che sono in grado di creare dei punti di "sovrapposizione". Tramite questi punti, le immagini di angolazioni diverse possono essere parzialmente sovrapposte generando così una sorta di collage che offre di conseguenza la sensazione di muoversi nello spazio "attorno" all'oggetto.
Se tutto questo affascina, il bello in realtà deve ancora venire: l'algoritmo alla base del software è in grado di estrapolare gli elmenti caratteristici grafici da qualunque foto, qualunque sia l'origine, qualunque sia il tipo di fotocamera utilizzata. Sarà quindi possibile visualizzare anche le nostre fotografie in 3D perchè potranno essere integrate con le foto di centinaia di altre persone disponibili sul web! E' facile immaginare la disponibilità di tante fotografie e quindi un livello di dettaglio incredibile per i luoghi pubblici e turistici visitati e fotografati da una enorme quantità di persone.
Inoltre, un'ulteriore funzionalità futura sarà quella di riuscire ad integrare informazioni alle immagini: ogni immagine catturata ed elaborata dal software possiederà una sorta di identificativo univoco e riproducibile; se quindi scatto ad esempio una foto al Colosseo di Roma, il software "riconoscerà" l'immagine e "capirà" che si tratta proprio del Colosseo e potrà fornirmi altre foto simili o informazioni o indirizzi web o qualunque altra cosa sia in relazione con esso.
E'immaginabile che tra qualche tempo tutto questo diventerà una realtà cui tutti saremo abituati e che il Web, inteso come ragnatela di informazioni, acquisterà sempre di più la capacità di condividere il significato dei dati tra uomini e macchine realizzando il concetto di web semantico e portandoci in una nuova era in cui saranno realizzabili interrogazioni di un database di dimensioni colossali: tutta la rete Internet...
Replies to this post
-
Lara
-
06/05/2008 21:57:04
Se ho capito bene il software utilizzerà foto provenienti anche da fonti differenti, ma se le foto hanno risoluzione diversa tra loro si vedrà un salto nella fluidità del percorso virtuale (sequenza di immagini) che eprcorriamo, giusto?
Il software può ovviare a questo tipo di problema??
Lara
-
Alessandro Miele
-
09/05/2008 21:44:28
In realtà la sequenza non sarà mai fluida, indipendentemente dalla risoluzione delle foto. Il software infatti è in grado di interpolare porzioni uguali di immagini diverse e le mostrerà esattamente come sono state riprese.
Facciamo un esempio: ho due foto che riprendono la torre di Pisa; una dal lato destro,l'altra dal sinistro, con un'angolazione di 45 gradi l'una rispetto all'altra.
Il software cercherà tra le due immagini i punti "comuni" e quindi "collegherà" le due immagini. In fase di "navigazione", essendo presenti solo 2 fotogrammi, la fluidità sarà esattamente di due scatti e chi visualizza la scena avrà la sensazione di "saltare" da un lato all'altro della torre. Le immagini con risoluzione diversa saranno interpretate semplicemente come ingrandimenti o rimpicciolimenti rispetto al fotogramma da cui si proviene.
Viceversa, nel caso in cui siano state messe a disposizione molte immagini, comprendenti angolazioni diverse o momenti diversi, sarà possibile "muoversi" tra un'immagine e l'altra con più fluidità.
Ad ogni modo c'è comunque da sottolineare che anche in presenza di una enorme quantità di fotogrammi, la visualizzazione sarà sempre a scatti: visualizzerà cioè staticamente un'immagine dopo l'altra in base a un nostro comando; non permetterà mai una visualizzazione "fluida"... Almeno per il momento.