Solucions per a la millora de qualitat de fotomosaics submarins de grans dimensions / Universitat de Girona
Els fotomosaics submarins de grans dimensions topen amb el problema d’una imperfecta combinació i fusió de les imatges. Una tesi de la Universitat de Girona proposa una solució a la qüestió, a la vegada que en fa possible la producció a gran escala.
L’estudi científic del medi submarí té nombroses aplicacions que beneficien, per exemple, àmbits del coneixement com l’arqueologia, la geologia i la biologia. Per obtenir dades que es troben a gran profunditat, o que requereixen períodes llargs d’immersió, s’utilitzen vehicles submarins equipats amb sensors avançats, entre els quals hi ha càmeres fotogràfiques o de vídeo. Les imatges òptiques que s’obtenen a curta distància proporcionen informació visual d’alta resolució del fons submarí. Els científics treuen profit de les imatges perquè els ofereixen la representació més precisa i acurada de les àrees que volen estudiar i els permeten una anàlisi detallada de les estructures d’interès.
Les característiques del medi submarí constitueixen, en sí mateixes, una dificultat per a la tasca d’adquisició d’imatges. Per reeixir cal superar reptes com de l’atenuació de la llum, la qual cosa fa que l’obtenció de les imatges del fons del mar calgui fer-la a molt poca distància de l’objectiu triat. És per aquest motiu que, quan es vol generar un mapa òptic d’una àrea extensa del fons marí, la tasca, només pugui ser assolida per mitjà de la construcció d’un mosaic d’imatges, això vol dir, a partir d’un conjunt de fotografies que, cadascuna, recull una àrea reduïda. Fins ara, la tècnica imposava una limitació a la confecció de fotomosaics, perquè les unions entre els límits de les imatges –tot i que es miraven de minimitzar– eren perceptibles per les imprecisions en el registre fotomètric i geomètric. A més, la manca d’eines específiques per al tractament dels resultats havien restringit les possibilitats dels fotomosaics submarins a representacions que reproduïen àrees reduïdes, tot i que els estudis científics actuals poden arribar a comprendre centenars de milers de metres quadrats de la superfície del fons oceànic.
Paradoxalment, la demanda de fotomosaics submarins de grans dimensions creix per la necessitat de caracterització del fons marí, amb finalitats científiques. Amb la intenció de superar les limitacions i satisfer la demanda, Ricard Prados, dirigit per Rafael Garcia i László Neumann, ha dedicat la tesi doctoral, Image Blending Techniques and their Application in Underwater Mosaicing, a la proposició d’estratègies i solucions al problema de la generació de fotomosaics submarins de grans dimensions, els anomenats giga-mosaics. La recerca de l’investigador del Grup de Recerca en Visió per Computador i Robòtica de la UdG, VICOROB, presenta novetats en les etapes de processament, realçat i fusió de les imatges, la qual cosa proporciona una qualitat visual millorada del fotomosaic resultant i la possibilitat de construir giga-mosaics de manera satisfactòria.
A la tesi, Prados, proporciona una revisió exhaustiva de les tècniques actuals i més destacades de l’estat de l’art per portar a terme la fusió d’imatges, i n’avalua l’aplicació en el context submarí. Així mateix, presenta un criteri de classificació dels diferents mètodes que s’utilitzen, que basa en les característiques principals i en el rendiment que aporten. A continuació, presenta una proposta completa per a la generació de mosaics i la fusió d’imatges submarines a gran escala. En l’etapa de pre-processament de les imatges, introdueix una funció de compensació de la il·luminació dependent de la profunditat per solucionar l’aparença no uniforme de la il·luminació, en les imatges, deguda a l’atenuació de la llum i a l’ús de fonts de llum artificial de potència limitada.
Addicionalment, aporta una solució per quan no es disposa d’informació precisa de la distància entre la càmera i el fons del mar. Prados resol la limitació amb l’ús d’una estimació de l’altitud basada en la mida de les imatges projectades (un cop registrades) en diferents etapes del processament.
Pel que fa a la millora de les imatges, la variabilitat en el seu contrast, deguda a les diferents altituds d’adquisició i a la presència de partícules en suspensió en el medi aquàtic, la compensa amb un realçat adaptatiu que es basa en la utilització d’una imatge de referència de qualitat, seleccionada segons el criteri que ha anomenat de variació total. El mateix criteri també l’aplica per donar prioritat a la informació que prové d’imatges d’alta qualitat, prioritzant la contribució de les imatges més nítides i informatives que no pas la de les que presenten un contrast baix i escàs nivell de detall.
En l’etapa de fusió, proposa una estratègia de tall de graf que opera en el domini del gradient de les imatges sobre la regió de superposició. Aquest enfocament permet trobar una línia d’unió adequada, fins i tot en el cas que les imatges hagin estat adquirides amb diferents temps d’exposició. La proposta de l’investigador del VICOROB realitza una transició suau al voltant d’una línia d’unió seleccionada de forma òptima, per tal d’assegurar la més alta nitidesa, al mateix temps que evita els problemes de dobles contorns. Finalment, presenta una estratègia de fusió per a fotomosaics de molt grans dimensions en un ordinador de prestacions estàndard. L’estratègia ha estat testejada sobre dades reals i ha donat lloc a imatges que sobrepassen l’ordre del giga-pixel. La proposta presenta, com a única limitació, la mida màxima de la sub-imatge que pot ser processada per la memòria de l’ordinador. Com a resultat de la tesi han estat generats els que són, avui per avui, els giga-mosaics submarins en 2D més grans en el seu gènere, pel que fa a la resolució de la imatge i a l’àrea coberta, que corresponen a la Dorsal atlàntica.♦