Főoldal arrow Főoldal arrow Forradalmi változások a digitális fotótechnikában (5)
Forradalmi változások a digitális fotótechnikában (5)
Írta: Nagy Sándor (nasa@http.hu)   
2012. május 30.
Forrás: http://en.wikipedia.org/wiki/File:Lytro_light_field_camera_-_front_and_back.jpg
Az első Lytro fény-tér fényképezőgép (elől- és hátulnézet)
 
 
 
 
 
Cikksorozatunk ötödik folytatásával elérkeztünk azokhoz az újdonságokhoz, amelyekről elképzelhető, hogy nem egyhamar befolyásolják jelentős mértékben az átlagos fotósok eszözkészletét, ha egyáltalán ez valaha bekövetkezik. Erre leginkább a Light Field Photography eljárásnak van bizonyos esélye (de alighanem csak több év múlva, bár már megjelentek az első, kereskedelmi forgalomra szánt modellek – furcsaságok iránt érdeklődők próbálgatják). Az MIT gyorsfényképezőgépe, és esetleges hozzá hasonló konstrukciók csak a tudományos, és műszaki fényképezésben számíthatnak felhasználásra (bár a kifejlesztett technológia – szerényebb paraméterekkel – hosszabb távon átszivároghat a „hétköznapi” fotótechnikába. Az Egypixeles kamera pedig még a tudományos fényképezésben történő alkalmazástól is távol van (valószínűleg), és lehet, hogy csak szélesebb értelemben vett alapelve kerül konkrét (tudományos) felhasználásra. Kuriózumként viszont mindhárom rendkívül érdekes, és szigorúan kötődik a digitális technikához, annak teljesen újszerű alkalmazását jelenti.
 
 
 
 
 
 
A digitális fényképezőgép egy célszámítógép. A benne levő processzor (hozzá tartozó programmal) nélkülözhetetlen, bizonyos képfeldolgozás, átalakítás (Bayer-interpoláció, a tónusgörbe átalakítása) nélkül az érzékelőből kiolvasott képek szinte élvezhetetlenek. És ha már ott a processzor, akkor sok egyéb képmódosításra is kihasználják: fehéregyensúly, kontraszt, élesség igazítása, sőt a dinamikatartomány kiterjesztése több kép kombinálásával, panorámakép készítése képek ősszefűzésével, lencsehibák korrigálása, stb. Tehát már  a mai mindennapi digitális fényképezőgépekről is elmondhatjuk, hogy azok nem egyszerűen rögzítik a képet
(ahogyan azt az analóg (filmes) gépek tették/teszik, hanem „létrehozzák, megalkotják” az érzékelő éltal rögzített nyers képből, tetemes számítási művelet eredmáényeképpen, bonyolult algoritmusok szerint.

Kézenfekvő a gondolat, hogy radikálisan kiterjeszthetjük a fényképezés teljesítőképességét, ha az érzékelés, leképezés folyamatát átértelmezzük, az érzékelőben levő fénydetektorokat (fotocellákat) másképpen használjuk, olyan inforációt rögzítünk, ami nagyon távol áll a hagyományos képtől, a képet célirányos számítással alkotjuk meg. Az alább ismertetendő eljárások ezt a gondolatmenetet követik egy-egy olyan cél elérése érdekében, amelyek közvetlen képrögzítéssel megoldhatatlanok.
 
Light Field Photography

Ren Ng  a Stanford Egyetemen, 2006-ban elkészült PhD értekezésében a fényképkészítés egyik alapvető beállításával, az élességállítással kapcsolatos probléma újszerű megközelítésével foglalkozott (a pontatlan élességállítás a fényképezés kezdeteitől mind a mai napig megkeseríti a fotósok életét – ezen ugyan javított az automatikus élességállítás bevezetése, de teljeskörű megoldást nem hozott, például időigényessége miatt, ami különösen zavaróvá válhat gyengébb fényviszonyok között, de az is előfordul, hogy az élesség beállítása nem a kívánt főtémára, hanem a háttérben, vagy az előtérben levő más objektumokra történik). Amennyiben nem egyszerűen az érzékelőre leképezett képet rögzítjük (azaz az egyes pixelekhez érkező fény intenzitását), hanem azon kívül az érzékelőhöz érkező fénysugarak irányát is, ebből a bővebb információhalmazból számítással olyan képek állíthatók elő, amelyek megfelelnek a fénysugarak iránya megváltoztatásának. Ez azt jelenti, hogy a felvétel elkészítése előtti pontos élességállítás jelentősége csökken, az egyes képelemek élessége utólag megváltoztatható!

Ennek a fényképezést jelentősen átformáló újításnak (hiszen nemcsak az élességállítás végezhető utólag, hanem megváltoztatható a mélységélesség, vagy akár az azonos távolságra levő objektumok élessége is eltérően módosítható utólag) az ára, hogy jóval több információt kell rögzíteni. Ugyanakkor megfigyelhető, hogy az érzékelők felbontóképessége (pixelszáma) rohamosan növekszik, gyakran az ésszerűség határain túl (és a technológia fejlődésével további növelésére nyílik lehetőség). Tehát a radikálisan nagyobb mennyiségű információ rögzítésének már ma sincs komoly technológiai akadálya (és e téren a jövőben további jelentős javulás várható). Az alábbi táblázatban bemutatjuk a manapság (2012. március) a különböző méretű érzékelőkben alkalmazott legnagyobb pixelszámot és ennek megfelelő legkisebb pixelméretet, valamint a legkisebb pixelmérettel elérhető pixelszámot.
 
Érzékelő    
Jelenleg alkalmazottPixelszám 1,3 mkm
pixelmérettel
típusméretpixelszám  pixelméret
 1/2,33”
 4,56mmx6,08mm
 16 MP 1,3 mkm 16 MP
     
 APS-C
 16 mm x 24 mm  24 MP 4,0 mkm 220 MP
 „full-farme”
 24 mm x 36 mm 36 MP 4,9 mkm 510 MP

Fogalmak tisztázása.

Ahogy fentebb már utaltunk rá, a hagyományos fényképezés során a fényképezőgépben a leképező fénynyaláb egy síkmetszetét, egy kétdimenziós (2D) információt rögzítünk: az érzékelő síkjában, annak minden egyes pontjába (valójában az egyes, véges kiterjedésű fotodiódákra – pixelekbe) bármely irányból beérkező fény intenzitását, azaz az adott pontba bármely irányból érkező fény összegét. A fejezet címében is használt fogalom, a „Light field”
Forrás: http://en.wikipedia.org/wiki/4D_light_field#The_4D_light_field
A plenoptic function öt változója
(fény-tér, fény-mező
– pl, az elektromos, vagy gravitációs tér, mező mintájára) a térben haladó fénysugarak teljes leírására utal, azaz a tér minden egyes pontjában, és ott minden egyes irányban haladó fény mennyiségét rögzítő függvényt jelenti. Amennyiben a fényképezőgépben csak az objektív utolsó lencséje és az érzékelő közötti üres térrészre korlátozzuk, ahol a fénysugarak mind egyenes vonalban haladnak, kimutatható, hogy ennek teljes leírásához elegendő két, egymással párhuzamos síkban megadni a fentebb említett 2D információt (4D Light field). Ezt a leírást az 1990-es években, komputer-grafikai problémák megoldásához dolgozták ki, a fogalom kialakulásának részletes ismertetése megtalálható Ng disszertációjában. A szóban forgó fényképezőgépre egy másik elnevezést is használnak: „Plenoptic camera”, ami a fény-teret teljes általánosságban leíró függvényre, az 5D „plenoptic function”-re utal (az x,y,z 3 dimenziós tér minden pontjában, minden irányban – ez két szöggel, pl, az x-y síkban levő   és az x-z síkban levő   adható meg – haladó fény mennyisége, ötváltozós függvény: L(x,y,z, , ) – lásd az ábrán). Ha egyetlen síkban (az érzékelő síkjában) tekintjük a plenoptikus függvényt, az négyváltozós – L(x,y, , ), összhangban a fentebb hivatkozott 4D fény-térrel.
 
A módosított fényképezőgép

Ahogyan a bevezetőben utaltunk rá, a Ng által kitűzött cél megvalósítása érdekében ezt a 4D fény-teret, azaz az érzékelő síkjában a négyváltozós L(x,y, , ) plenoptikus függvényt kell rögzíteni. Ennek érdekében az érzékelő előtt már általában meglevő, a fényt az egyes fotódiódákra fókuszáló mikrolencsék mögött az érzékelőt távolabb helyezte el (lásd az ábrán).
Forrás: http://graphics.stanford.edu/papers/lfcamera/lfcamera-150dpi.pdf nyomán
A Lytro fényképezőgép sematikus elrendezése

Az objektív a tárgy egy pontjából kiinduló fénysugarakat a mikrolencsék síkjára fókuszálja, de a mikrolencsék az egy pontba összegyűjtött fénysugarakat irányuk szerint szétválasztják.  Az érzékelő pixelszáma jóval nagyobb a mikrolencsék darabszámánál, így az érzékelő a teljes négydimenziós L(x,y, , ) függvényt rögzíti. Az így módosított optikai leképező rendszer részletesebb ismertetése és az így előállított információból a különböző távolságban levő tárgyakra élesre állított kép meghatározásának matematikai módszereiről a Stanfordi Egyetem közleményében (Stanford Tech Report CTSR 2005-02) és Ng értekezésében  olvashat.
 
Ng 2006-ban a PhD munkája során kifdolgozott fény-tér fényképezőgép gyakorlatban is alkalmazható változatának kifejlesztésére és gyártására  Lytro Inc. néven Startup céget alapított. 2011. októberben mutatott be két, kereskedelmi forgalomra szánt gépet (lásd a címlap-képet), amelyek tényleges forgalmazása 2012. februárban meg is kezdődött. Az érzékelő pixelszáma mindkét gép esetén 11 MPixel (a félreértések elkerüláse érdekében az érzékelő felbontását 11 Megaraynek, 11 millió fénysugárnak mondják, mivel a rögzített információból előállítható kép felbontása, pixelszáma ennek csak töredéke, mintegy 1,2 Mpixel), belső memóriájuk 8 (350 fotó) ill. 16 GB (750 fotó tárolására alkalmas), induló áruk 400 ill. 500 USD. Objektívjük f/2 fényerejű, 8x zoomos. A gép újszerű formai kialakításával is sugallni kívánják, hogy teljesen új fényképezési eljárást valósít meg, ami (az előzetes élességállítás szükségtelenné válása miatt sokkal egyszerűbb, mint a hagyományos. Mindössze három gomb található rajta: egy bekapcsoló- és egy exponáló-gomb, és egy zomm-csúszka. A hátlapján levő 1,46” (33 mm) méretű, 49.000 pont felbontású érintő képernyőn megjelenő képen a kép tetszőleges pontját megérintve, arra a tárgyra átállítódik az élesség. Jelenleg csak Apple gépeken lehet megjeleníteni és újra fókuszálni az áttöltött képeket, de várhatóan még ebben az évben megjelenik a szoftver Microsoft Windows változata is. Egy adott élesség-állítással előállított kép szabályos JPEG fájlba menthető. A képek átfókuszálásához szükséges szoftver, a „light-field engine” (fénytér motor) a képfájlba beágyazható, így a Facebook-ra, vagy a Lytro.com-ra feltöltött képek is érintéssel átfókuszálhatók.
 
Alkalmazási lehetőségei

Ezzel az új eljárással készült felvételeket a Lytro „élő képek”-nek nevezi. Nemcsak az utólagos interaktív élességállítást teszik lehetővé (az újrafókuszálást kipróbálhatja az elérhető képek tetszőleges pontjának megérintésével),Forrás: http://www.raytrix.de/index.php/Cameras.html hanem akár térhatású képek is előállíthatók a többlet-információ felhasználásával, vagy a lencsehibák (aberrációk) is korrigálhatók utólag (az aberrált fénysugarak átrendezésével, a „torzítatlan”, ideális fókuszálás irányába).

Míg a Lytro cég a hobby kategóriát célozza, a német Raytrix cég már 3 MP-es, újra fókuszálhatóképet előállító gépet is készít, elsősorban ipari és tudományos felhasználásra (sokkal húzósabb áron).
 
Az egyetlen síkra leképezett kép rögzítése (hagyományos fényképezés) helyett a teljes leképező fénynyaláb térbeli eloszlásának rögzítése, a fény-tér fényképezés valóban forradalmi (talán a holográfiához fogható)változás a mintegy 170 éves fényképezéshez képest. Mivel az így rögzített információ-halmazból az „élő képek” csak jelentős számítással állíthatók elő, csak a digitális fényképezés tette lehetővé megjelenését. Sokféle alkalmazási lehetőségeit ma még nehéz lenne megítélni.
 
MIT gyorsfényképezőgép

Talán helyesebb gyors mozgókép-rögzítésnek nevezni, amit az MIT-ben (Massachusetts Institute of Technology – Messechusettsi Műegyetem) kifejlesztettek. Mindenesetre a képváltások mintegy 2 ps-onként követik egymást (1 ps = 1 pikoszekundum = 0,000.000.000.001 s = 10-12 s), azaz másodpercenként fél billió felvétel készülne, ha ilyen „sokáig” működtetnék (1 billió (US: trillion) = milliószor millió = 1.000.000.000.000 = 1012). Két felvétel elkészítése közötti idő alatt a fény 0,6 mm utat tesz meg, tehát ez a sorozatsebesség elegendő arra, hogy a fény terjedését rögzítsük néhány cm távolságon belül! Természetesen, talán mondanunk sem kell, hogy az erre a teljesítményre képes berendezés egyáltalán nem hasonlít a hagyományos fényképezőgépre, vagy videofelvevőre. Nem is egyszerre rögzíti az egyes képkockákat, hanem egyszerre csak az időben egymást követő képek egy-egy sorát, majd a sorra merőleges eltolással a következő sort, azaz szkenneli a képeket. 480 felvétel készül, időben egymás után, mindegyik 1.71 ps megvilágítási idővel (egy-egy képsor), majd kb. 13 ns múlva (1 ns = 1 nanoszekundum = 10-9 s) ismételve, a következő képsorra. Sőt, a teljes folyamatot többször meg kell ismételni, hogy elegendő számú fotont regisztráljunk a képek minden egyes pixeléhez. A 480 teljes felvétel elkészítése eltart néhány percig. Ez azt jelenti, hogy csak szabályosan ismétlődő folyamatokról készülhet ilyen sebességű sorozatfelvétel. A kamerát megalkotói videofelvétel en mutatják be, magyarázzák el működését. A kamerával készült "videoklippek" - lassítva - a projekt honlapján tekinthetők meg .

A eljárás kulcsa egy indirekt „sztroboszkópikus” (periódikusan, villogó fénnyel történő) megvilágítás, több millió ismételt mérés, miközben nagypontossággal időben és térben szkennelik a vizsgált látványt. A sztroboszkópikus megvilágítást egy titán-zafír lézer szolgáltatja: 1 ps-nál rövidebb fényimpulzusokat bocsát ki, kb 13 ns idóközönként. A lézer fényfelvillanásai világítják meg a témát (a hagyományos fotós vakukhoz hasonlóan, csak jóval rövidebb időtartamra), és indítja az egymás után 480 darab, egy vonalnyi képet rögzítő felvevőt. A következő sorok rögzítése úgy történik, hogy a témáról a felvevőre egy tükör vetíti a fényt, és az egymást követő sorozatok között a tükör billen annyit, hogy a felvevő a következő képsort rögzítse. Az ily módon, részletekben és ismétlésekkel rögzített felvételek összefűzését és ősszeadását utólag, számítógépes program végzi, így jön létre a 480 felvételből álló sorozat. Az eljárást megalkotóik Femto-Fotográfiának nevezik (femto = billiomod rész = 10-15 ).

Az alkotók az alábbiakat említik a módszer lehetséges alkalmazásaiként: művészi és oktatási célú megjelenítés, ipari folyamatok „filmezése” hibák és anyagjellemzők feltárása érdekében, ultragyors folyamatok megismerése tudományos célból, a test felszín alatti részeinek vizsgálatát célzó orvosi képalkotás („fény-ultrahang”). De a fotonok pályájának vizsgálata önmagában is új lehetőségeket nyithat a számítógépes grafika, az úgynevezett „computational photography" (számításos fényképezés) terén. Ezen a területen nyit soha nem látott lehetőségeket ez a sorozatsebesség! A hagyományos fényképezés során állandó fénytranszport vesz részt a leképezésben, nem ad információt a fénynek a felvételre kerülő témán belüli terjedéséről. Valójában minden egyes fénysugár (foton) meghatározott pályát fut be a témán belül. Ennek követéséből származó információ-özön elvész, ha az összes fénysugár hatása összegzésre kerül a hagyományos fényképezőgép pixelében.
 
Az új gyorsfényképező rendszer jelenlegi állapotában meglehetősen terjedelmes: A lézert, a tükröt és a képrögzítőt egy laborasztalon levő optikai padon kell gondosan összehangolni, szinkronizálni. A felhasznált technológiák fejlesztése reménykeltő egy kompaktabb rendszer későbbi kialakítása szempontjából, de egyelőre laboratóriumi alkalmazásokra gondolnak.

Ismét olyan újdonságról van szó, aminek lehetőségét kizárólag a digitális technika nyitotta meg, és annak határait a mai csúcstechnikák kombinálásával a végsőkig igyekszik kitolni.
 
Egypixeles kamera

E fejezet címe egy kissé régebbi újdonságra utal (még a FotoAgóra indítása előtt, 2006. decemberben írtam róla a Pixinfó portálra), de a fentebb bemutatott újdonságokkal rokon. Sőt, merészségben alighanem túltesz amazokon.

A kiinduló ötlet a következő: Egy-egy (digitális) kép teljes információhalmaza (pixelekkel leírva) rendkívül terjengős. Akár veszteségmentesen is leírható sokkal tömörebb formában, de kis információ-veszteséget vállalva (ami szinte egyáltalán nem látszik a rekonstruált képen) akár tized részére (sőt, már észrevehető, de bizonyos felhasználásnál még nem zavaró torzulásokat vállalva) akár ötvened részére is tömöríthető (például a JPEG formátumban). A „tömörítő leképezés” kutatói annak lehetőségeit vizsgálják, hogy már a digitális kép információ-gyűjtése (a leképezés) során tömöríthető-e a kép oly módon, hogy később „jó minőségben” rekonstruálható legyen. Ez széleskörű információ-elméleti kutatások tátgya. A Rice egyetem kutatói egy gyakorlatban is kipróbált, optilai „tömörítő” leképezési eljárást dolgoztak ki, amelynek során egyetlen pixelből (fotodiódából) álló érzékelő rögzíti a képet – igaz, egymást követően jó sokszor.
 
Forrás: http://dsp.rice.edu/cs/cscamera
Az egypixeles fényképezőgép felépítésének vázlata
A képet nem fotodiódákból álló érzékelő bontja pixelekre, hanem mikrotükrökből  (a kísérleti berendezésben 1024x768 darab tükörből) álló lapka. A tükrök két meghatározott irány valamelyikébe állíthatók be (és ténylegesen véletlen eloszlásban kerülnek beállításrra). Egyik állásukban egy gyűjtölencsén keresztül az összes kiválasztott pixel fénye az egyetlen fotodiódára kerül (a többi pixel fénye máshova irányul). Kimutatható, hogy ha így, más-más véletlenszerűen kiválasztott pixelek fényét összeadva, sokszor rögzítjük, ebből, megfelelő algoritmussal rekonstruálható a kép (lásd az ábrákat).
Forrás: http://dsp.rice.edu/cs/cscamera
Az egypixeles géppek készült felvételek, számítógépen rekonstruálva
 

A módszer előnyei jól érzékelhetőek olyann speciális alkalmazások esetében, amikor nem a látható fény tartományába eső elektromágneses hullámokkal állítjuk elő a képet.  A detektor ilyen esetekben jóval költségesebb lehet, mint az egyszerű fotodióda, tehát korántsem mindegy, hogy egyetlen detektorra, vagy akár több millióra van szükság (esetleg a multipixeles érzékelő nem is nagyon képzelhető el). A másik előny abból származik, hogy a készülék összehasonlíthatatlanul kisebb adathalmazt állít elő, mint a szokásos digitális fényképezőgép, tehát jóval kisebb kapacitású átviteli csatornán továbbítható az érzékelés helyétől távoli számítógépre.  A téma iránt érdeklődők részletesebben tájékozódhatnak korábbi  ismertetőmből, ahol további linkeket találnak.
A „tömörítő érzékelés” problematikájának időszerűségét a közelmúltban megjelent cikkben mutatta be az egypixeles kamerát kidolgozó csoport vezetője, Richard Baraniuk. Korábban a legkülönbözőbb érzékelőkkel dolgozó rendszerekben a szűk keresztmetszetet az érzékelők jelentették. A felgyorsult fejlesztések eredményeként (pl. a digitális fényképezőgép-érzékelők ára 1 dollár / megapixel körüli értékre csökkent) olyan adat-áradat keletkezik napjainkban, amelynek tárolására, feldolgozására jelenleg nincs esély. A fordulópont 2007-ben következett be, amikor világszerte több adat jött létre, mint a rendelkezésre álló teljes tároló-kapacitás (2011-ben már kétszer több). Az olló tovább nyílik: a 2010. évben pl. a létrejött adatmennyiség (1250 milliárd GigaByte – több bit, mint ahány csillag van a Világegyetemben) egy év alatt 58 %-kal növekedett, míg a tároló kapacitás csak 40 %-kal. A szűk keresztmetszet az érzékelőkről áttevődött az adatfeldolgozó, -továbbító és -tároló alrendszerekre. Ennek fényében az adatoknak az érzékelés folyamatában történő tömörítése jelentős hangsúlyt kap. A Rice egyetem honlapján a tömörítő érzékelés (Compressive Sensing) szakirodalmának rendkívül széleskörű gyűjteményét találja az érdeklődő.
Hozzászólások
HozzáadásKeresés
Hozzászólást csupán a bejegyzett felhasználó tehet hozzá!
 
< Előző   Következő >
Advertisement
Advertisement
Advertisement