您的位置: 西安视窗 > 资讯 > 正文

【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!!

2021-02-07 06:21:38来源:阅读:-


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


你离礁石越来越近,仿佛还有一秒就要触礁了。


不过这张动图,并不是从人类拍摄的视频里截下来的。


是Adobe放出的新魔法,把这张静态照片变出了立体感,整个过程只需要2-3秒:

【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!

这种特效处理,常常用于纪录片等视频的后期制作,名为Ken Burns Effect。


原本只是2D缩放 (下图左) ,通过对静止图像的平移和缩放,来产生视差,从而实现动画效果。

【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


但Adobe这种3D效果 (上图右) ,不仅有平移和缩放,还有视角转换,给人更沉浸的体验。想要实现,需要专业的设计师在Photoshop等软件中花费数个小时时间。


而且制作成本也很高,一张照片大概需要40-50美元 (约合人民币280-350元) 。Adobe也登上了ACM主办的计算机图形学顶级期刊TOG。


完全不是简单的缩放


透视原理决定,前景比背景的移动/缩放更剧烈。所以,前景移动的时候,背景除了移动,也要跟着修复。AI的背景修复十分自然,手法明显比“前辈”更高超:


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


形状有点奇怪的教堂


并且,不论背景简单复杂,AI都不怕。


背景的色彩和结构都很复杂,但AI并没有蒙蔽。


如果你觉得,刚才的视角变化只是由远及近,不够复杂。那就看一眼这古老的台阶吧:

【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


当然,不只是风景,人像也可以处理。


比如,草地上的新娘,可以远观,也可以近距离欣赏:

【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!

就像开头说的那样,所有的变换,只靠一张静态图来完成。

这自然不是普通的缩放可以做到的:

【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!

左为普通缩放,右为3D魔法


所以,究竟是怎样的技术做到的?


三步定边界,结合上下文感知


用单个图像合成逼真的相机移动的效果要解决两个基本问题。首先,要设置一个新的相机位置,合成新视图,并且需要准确地恢复原始视图的场景几何结构。其次,根据预测的场景几何结构,要将新视图在连续的时间线上合成,这就涉及到去遮挡这样的图像修复手段。


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


研究人员们用了三个神经网络来构建处理框架。


用以训练的数据集是用计算机生成的。研究人员从UE4 Marketplace2收集了32种虚拟环境,用虚拟摄像机在32个环境中捕获了134041个场景,包括室内场景,城市场景,乡村场景和自然场景。每个场景包含4个视图,每个视图都包含分辨率为512×512像素的颜色、深度和法线贴图。


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


指定一张高分辨率图像,首先根据其低分辨率版本估计粗糙深度。这一步由VGG-19来实现,根据VGG-19提取的语义信息指导深度估计网络的训练,并用具有ground truth的计算机合成数据集进行监督。如此,就能提取出原始图像的深度图。


第二个网络,是Mask R-CNN。为了避免语义失真,平行于VGG-19,用Mask R-CNN对输入的高分辨率图像进行分割,而后用分割的结果来对深度图进行调整,以确保图中的每个对象都映射到一个相干平面上。


最后,利用深度细化网络,参考输入的高分辨率图像,对提取出的粗糙深度进行上采样,确保深度边界更加精确。


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


之所以要采用深度细化网络,是因为裁切对象的过程中,对象很可能在边界处被撕开。


有了从输入图像获得的点云和深度图(注:点云指通过3D扫描得到的物品外观表面的点数据集合),就可以渲染连续的新视图了。


不过,这里又会出现一个新的问题——当虚拟摄像机向前移动的时候,对象本身会产生裂隙(下图中高塔右侧像被网格切开了)。

【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


为了解决这个问题,研究人员采取了结合上下文感知修复的方法。


结合上下文信息能够产生更高质量的合成视图。上下文信息划定了相应像素在输入图像中位置的邻域,因此点云中的每个点都可以利用上下文信息来进行扩展。


具体而言,第一步,是进行颜色和深度图像修复,以从不完整的渲染中恢复出完整的新视图,其中每个像素都包含颜色,深度和上下文信息。


而后,利用图像修复深度,将图像修复颜色映射到点云中新的色调点。


重复这一过程,直到点云充分扩展,填补空隙,可以实时地呈现完整且连续的画面。


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


“用过都说好”


研究人员觉得好,那不算好。新方法效果如何,还是用户说了算。


于是,研究团队搞出了一个“非正式用户调研”。他们在YouTube上搜集了30个人类创造的3D Ken Burns视频,将其分成“风景”,“肖像”,“室内”,“人造室外环境”四组,每组随机抽取三个视频作为样本。


8位志愿者参与到了这个测试之中。团队为每个志愿者分配了一张静态图,并提供了人类作品作为参考,要求志愿者使用新方法和Adobe After Effects模板、移动App Viewmee这两种Ken Burns制作工具创作类似的效果。


志愿者会依据自己的主观意见评价每种工具的可用性和质量。


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


在志愿者们看来,不论是从效果上,还是易用性上,Adobe的这个新工具显然好得多。



内容来源:量子位(ID:QbitAI)

编辑排版:爱游汇团队


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!


【全民学科技】黑科技来了!2D图片3秒变立体,视角流畅自然!

推荐阅读:深圳网

滚动推荐
21:38【全民学科技】黑科技来了!2D图片
你离礁石越来越近,仿佛还有一秒就要触礁了。不过这张动图,并不是从人类拍[详细]
13:54华为手机竟自带PDF转换功能?网页
相信很多经常接触电脑的人对文件转换都很熟悉,因为在很多时候都需要将各种[详细]
01:16现在买手机你们还会选 128G 存
中国网民人均安装56款APP中国网民人均安装56款APP信息爆炸的时代[详细]
37:39国产最美手机十大排行榜,颜值爆表!
Top10 魅族PRO 5手机正面的 2.5D 弧度屏幕玻璃,摸起来十[详细]
29:05三星又一部小屏神机横空出世:正中小
从流出的图片可以看到,三星SamsungGalaxyA10E的机身采用[详细]
07:46雪佛兰创酷全系降价1.5万,最低仅
近日,小编从广西桂海富达汽车销售公司了解到,雪佛兰创酷全系降价1.5万[详细]
01:17360努比亚华为nova 三款17
在1-2年前,我们还是会比较一下1500元有哪几款热门手机可以选。但是[详细]