Команда инженеров Apple разработала модель на основе искусственного интеллекта под названием Depth Pro. Инструмент может отображать глубину 2D-изображения, сообщает TechXplore. Это позволит преобразовывать обычные фотографии в трехмерные.
Способность человека и животных воспринимать глубину обусловлена бинокулярным зрением. Мозг обрабатывает два слегка различающихся изображения, получаемых от каждого глаза, и на основе этих различий определяет пространственное расположение объектов. Некоторые видеокамеры работают по схожему принципу для создания 3D-видео.
Смартфоны, полагаясь только на одну камеру для фотосъемки и создания видео, имеют различные аппаратные и программные дополнения, позволяющие добавлять некоторую степень глубины. Инженеры Apple разработали алгоритм, позволяющий создавать полные карты глубины исключительно на основе данных, содержащихся в исходном изображении, без использования дополнительных метаданных о камере.
Карта глубины — это визуальное представление трехмерной информации, полученной из двумерного изображения. Каждый пиксель на ней содержит данные о расстоянии от соответствующей точки объекта до камеры. Такая карта позволяет добавить еще одно измерение к плоскому изображению. Это позволяет генерировать 3D-эффекты, более четкие, чем те, что создаются с помощью стандартных технологий смартфона.
Команда Apple утверждает, что приложения, использующие эту модель, смогут создавать карту глубины всего за 0,3 секунды при запуске на стандартном графическом процессоре. Для этого не требуются дополнительные данные о камере, обычно используемые при построении трехмерных моделей. Такая быстрая модель позволит создавать 3D-изображения с помощью однообъективной камеры в реальном времени. Технология найдет применение в робототехнике и других областях, требующих построения трехмерных карт в реальном времени, например, в системах автономного вождения.
Ранее YouTube-блогер собрал первый прозрачный iPhone.