Консерватизм китов цифровой фотографии лишает нас удивительных возможностей?
На иллюстрации – современная цифровая зеркалка (бренд в данном случае не играет роли, все они примерно такие же). Не находите, что это очень странный девайс? А напрасно.
В ней всё функционально, но не для «цифры», а для «пленки». Выросты c боков объектива – для кассет. Горб сверху – для призмы, доставляющей отражённые в зеркале изображения в видоискатель. В цифровой камере – ни плёнки, ни кассет, ни необходимости в колесе для перемотки, для работы видоискателя здесь не нужна сложная конструкция из подвижного зеркала и призмы. А внешние изменения после перехода на «цифру» оказались минимальными. Разве что на задней панели появился дисплей. Даже колесо перемотки осталось на прежнем месте, хотя сменило функции.
Застой в дизайне неплох, если дизайн хорош. Плохо, что он отражает подход производителей. Вместо использования возможностей новых технологий на всю катушку они делают обычные фотоаппараты и не хотят двигаться дальше. Многие технологии поначалу подгоняются под предшественников: первые авто выглядели как кареты с мотором, ПК – почти как пишущие машинки. Обычно эта стадия быстро заканчивалась. Цифровые фотоаппараты на ней застряли.
В пленочном фотоаппарате объектив фокусирует свет на покрытой фоточувствительной эмульсией плёнке (или пластинке), на эмульсии формируется изображение, проявляющееся после обработки. В цифровых камерах место плёнки заняла светочувствительная матрица, химической обработки – считывание информации, чем всё и ограничилось. Суть осталась прежней: зафиксированное при срабатывании затвора изображение считается готовым снимком. Однако возможности матрицы – гораздо шире, чем у фотоплёнки. У нее нет нужды ограничиваться записью единственного кадра. Собранные ей данные можно пропускать через различные алгоритмы, которыми занимается особая дисциплина – вычислительная фотография.
В начале июня вышла новая прошивка Google Glass. По аннотации Гугла, обновление ощутимо улучшило качество снимков. Как новый софт может улучшить качество, если железо прежнее? Встроенная камера гугл-очков состоит из тех же 5-мегапиксельного сенсора и, мягко говоря, средней оптики, которые кажутся уместнее в недорогих смартфонах 3-летней давности. А разница налицо. Тестовые фотографии демонстрируют рост чувствительности, динамического диапазона, и даже, кажется, чёткости. Последнее связано с нехваткой деталей на пересвеченных кадрах, снимавшихся с прошлой прошивкой.
Новая прошивка повысила качество с помощью слегка модифицированного, неплохо работающего даже на движущихся объектах варианта самого старого и известного алгоритма вычислительной фотографии – HDR. Вместо одного кадра камера снимает последовательность. Первый кадр – с минимальной выдержкой, на нём лучше проработаны самые яркие детали, остальное тонет в тени. Выдержка второго дольше и так далее до последнего, с максимальной выдержкой. Он ужасно пересвечен, но позволяет разглядеть самые тёмные детали. Далее софт сливает все кадры в один, с идеально проработанными деталями и в светлых, и в темных областях. Информацию о тенях этот софт извлекает из кадров с долгой экспозицией, о свете – из снимков с короткой.
Фотографы давно пользуются HDR получения особых художественных эффектов: почти сверхъестественной освещённости и детализации, далеких от реальности. А на мобильных девайсах HDR позволяет выжимать максимум из слабых матриц и оптики. HDR с некоторых пор имеется в айфонах и других смартфонах, а nVidia включил аппаратную поддержку алгоритма в свой чипсет Tegra 4.
Извлечение информации из последовательности кадров с разными настройками – один из важнейших методов вычислительной фотографии. Кроме переменной выдержки, используются переменные диафрагма, резкость и освещённость.
Так, Майкрософт создал алгоритм Flash – No Flash. Как ясно из названия, он объединяет снимки со вспышкой и без. Чёткий кадр со вспышкой – источник информации о деталях сцены, а без нее – о цветах и естественной освещённости, он используется снятия эффекта красных глаз, улучшения ББ и интерактивной настройки вспышки.
Съёмка последовательности кадров может повысить чёткость при низкой освещённости: процессор автоматически выбирает самый чёткий кадр и сохраняет только его.
Амит Агравал из исследовательского центра Мицубиси использовал для борьбы со смазыванием движущихся объектов алгоритмы машинного зрения. Эффект превзошел ожидания.
Самый радикальный на сегодня метод вычислительной фотографии – запись светового поля. Камера светового поля записывает ещё и направления лучей света, составляющих сцену. Но пока это дорого.
Между матрицей и объективом в камере светового поля (она же плёноптическая камера) – сетка с тысячами микролинз. Для фиксации направления луча определяется его путь от линзы до сенсора. Зная направление луча, можно вычислить, что с ним произойдёт, если фокальная плоскость изменит своё положение. Таким образом, информация камеры светового поля позволяет моделировать фокусировку объектива на готовых снимках. Чтобы сфокусировать размытую часть снимка, достаточно по ней кликнуть. Глубина резкости изменится, выбранная область станет чёткой.
Кроме того, объектив плёноптических камер может состоять из неподвижных деталей (фокусировка выполняется после съёмки). Это упрощает его конструкцию и позволяет снимать практически мгновенно, убирая потери времени на автофокус. Кроме того, поскольку диафрагма таких камер фиксируется в максимально открытой позиции, они не требуют больших выдержек при плохой освещённости.
В такой бочке мёда должна быть ложка дёгтя. Вот она: разрешение плёноптических камер зависит от числа микролинз, и оно не так велико. Пока эти камеры снимают с разрешением 525х525 пикселей – по нынешним временам слёзы.
Немногочисленные элементы, порожденные вычислительной фотографией, встречаются в мобильных девайсах и дешёвых мыльницах. Более серьёзные фотоаппараты – крайне консервативные устройства, с трудом раскрывающие свою компьютерную сущность.
Дело осложняет неправдоподобная по меркам компьютерной индустрии степень проприетарности, нормальная для производителей фотокамер. Открытых стандартов здесь раз-два и обчелся, а электронная начинка держится в строгом секрете. Интерфейс обычных фотоаппаратов не позволяет перехватывать «сырые» данные с матриц, перепрограммировать автофокус и т. п.
Один из пионеров вычислительной фотографии, Марк Ливой из Стэнфорда, пользуется для своих экспериментов самодельными «франкенкамерами», собранными из деталей других устройств. Некоторые из них сделаны на основе Нокии N900 под Линуксом.
В статье для журнала IEEE Computer Graphics and Applications Марк Ливой рассуждает о причинах ситуации в отрасли. Любовь к секретности – защитная реакция на засилье патентов, пишет он. Современную цифровую камеру вообще невозможно сделать, не нарушив собственности на патенты конкурентов. Ситуацию спасает то, что, пока нарушение не всплывает, судиться здесь не принято.
Еще одна причина – производители камер освоили производство софта вынужденно, это в общем не их поле. Механика и оптика им по-прежнему ближе.
Никон и Кэнон гордятся качеством продукции и предпочитают надёжность новизне. У подхода есть плюсы, но он не способствует прогрессу.
Отрасли не помешал бы приход свежих игроков, но их появление не так уж вероятно. Кто захочет продираться сквозь чащу патентов, чтобы начать бизнес с мизерной для стартапа прибыльностью? Возможно, переворот начнётся (и уже начался) снизу – со стороны встроенных камер мобильных девайсов, качество которых год от года всё выше.
Дата публикации: 2013.07.03
Источник: Компьютерра
|