赞！网红程序员 AI 修复多国古老街景视频

查看原文

其他

赞！网红程序员 AI 修复多国古老街景视频

程序人生 2020-12-18

The following article is from HyperAI超神经 Author 神经小兮

作者 | 神经小兮

来源 | HyperAI超神经（ID:HyperAI）

内容提要：油管上一位 Up 主，修复历史视频上了瘾。目前，他已经利用 AI 技术修复了百年前的纽约、东京等地的街头视频。继上次感受百年前老北京街景之后，让我们穿越到百年前的东京、纽约街头看看吧！

关键词：视频修复卷积神经网络

还记得曾火爆全网，用 AI 修复的百年前北京街景视频吗？（参见《AI 修复民国北京街景视频，火遍全网带你穿越》）

同一时期，全球其它城市又是什么模样？一位来自俄罗斯的工程师 Denis Shiryaev（丹尼斯·谢里亚耶夫），用 AI 技术修复了多部老视频，也在 YouTube 上火了一把。

从 1896 年的莫斯科，到 1911 年的纽约，再到 1913 年的东京，Denis 让网民们感受到了百年前，这些城市的风情。

修复《火车进站》一战成名

今年 2 月，Denis Shiryaev 在 YouTube 上传了一段用 AI 技术修复的人类史上第一部电影——《火车进站》。

让他意外的是，这段视频一夜走红，截至目前这段修复电影已达到 400 多万次的播放量。

修复后的彩色有声版《火车进站》

125 年后，原本仅仅 50 秒的无声黑白电影，被 Denis 利用 AI 技术加上了色彩，并将其升级为 4K、60 fps 画质的高清版本，让现在的我们，得以看到更加真实的历史画面。

纽约、东京、莫斯科视频修复：给网友交作业

在第一次的修复作品获得巨大反响之后，Denis 应广大网友请求，接着又修复了多段老视频，带大家感受百年前的莫斯科、纽约和东京。

中图为Denis Shiryaev

1896 莫斯科：热闹的商业街头

Denis 的 AI 时光机，首先选择了 1896 年的莫斯科，这座城市于 1147 年沿莫斯科河而建，至今已有近 900 年历史。

19 世纪末的俄罗斯，刚刚完成工业革命，各类工业和贸易的企业已达两万多个，工人人数达到了 12 万。

特维尔大街，至今仍是莫斯科最繁华的商业、娱乐中心

视频中所记录的正是莫斯科的特维尔大街，商铺林立，马车、警察、商人熙熙攘攘。

沿着这条街步行不到 2 公里，即可到达当时的沙皇住所，也是现在俄罗斯的总统府 —— 著名的克林姆林宫。

1911 纽约：欧洲移民的美国梦

Denis 还选择了 1911 年纽约市的一段著名视频，进行了修复。

这段时长 8 分 35 秒的视频，把人们带回到 1911 年，当时的美国，正处于快速城市化时期，第二次工业革命在美国创造了大量就业机会。

原片由瑞典某公司拍摄，名为《纽约之旅》，由现代艺术博物馆于 2018 年公开19 世纪末 20 世纪初，大批因社会停滞而陷入失业的欧洲人，选择远渡重洋去追寻「美国梦」。

来自欧洲的移民潮达到高峰。其中最著名的就是 1912 年 4 月，从英国出发的泰坦尼克号。

在《纽约之旅》的开头中，也是一艘游轮缓缓驶向高楼林立，车水马龙，繁华热闹的纽约。

1913-1915 东京：明治维新后的稳定繁荣

这段原素材，由外国摄影师在 1913 年至 1915 年间的日本东京拍摄，拍摄期间，第一次世界大战（1914-18 年）刚刚拉开序幕。

而此时的日本，经过明治维新后的数十年平稳发展，正是一片盛世。东京的人口恢复到明治维新前的最高水平，超过 200 万人。

网友评论：那时候人们盯着摄像头就像它是一个外星探测器一样

街头上身着西服的日本老师，头戴礼帽的路人，无不体现着当时的日本，正经历着西方文化与东方文化交融的变革时刻。

感觉还不过瘾的同学，可以去 Denis 的 YouTube 主页，继续时光之旅哦：

https://www.youtube.com/c/DenisShiryaev/videos

能够实现这些结果，Denis Shiryaev 谦虚地表示，都要归功于 DAIN、ESRGAN、DeOldify 等 AI 技术。通过这些技术，任何人都可以做到。

老视频修复三步套路：提升画质、插帧、上色

提升画质利器：Gigapixel AI

据 Denis 介绍，他首先使用了 Topaz Labs 开发的商业图像编辑软件 Gigapixel AI，将原本分辨率极低的视频，按比例放大 600%，提升为 4K 画质。

Gigapixel AI 的工作原理类似于 ESRGAN（一种超分辨率复原技术），利用其专有的插值算法（interpolation algorithm），可以分析图像并识别细节和结构，进一步「完成」图像。

为了避免放大后的图像模糊，该软件利用深度卷积神经网络技术，分析了数百万张成对的图像，了解图像中的细节如何丢失，然后在新图像中将细节填充进去。

该软件已支持常见的视频格式无损放大

补帧模型：DAIN

接着，Denis 使用深度感知视频帧插值模型 DAIN，在现有视频片段的关键帧之间，靠模型的「想象」创建并插入视频里以前并不存在的帧，以此将视频的帧率增加到 60 帧每秒。

DAIN（Depth-Aware Video Frame Interpolation）是上海交通大学一位博士生包文博开发的插帧算法，该算法可以从把 30 帧的视频「脑补」成 480 帧，让视频更流畅。

项目地址：https://github.com/baowenbo/DAIN

将 30 fps 视频补帧到 60 fps 后的效果对比

上色：DeOldify

在上色环节，作者使用了 DeOldify，该技术的开发者目的就是为旧照片着色。其原理是使用 NoGAN 技术，它结合了 GAN 训练的优点，比如出色的上色效果，同时也消除了一些副作用，比如画面着色不稳定、闪烁的现象。

项目作者给出的上色示例，原照片拍摄于 1890 年代后期

项目地址：https://github.com/jantic/DeOldify

最后，对于早期的一些无声视频，Denis 还为其加上了一些和视频相对应的音效素材，让整体的视听效果更为真实。

Denis 表示，自己热爱机器学习技术领域，修复古老视频只是他对这种技术应用的结果展示。他会继续在 GitHub 上寻找此类技术，并在博客持续分享自己的学习结果。

1988 年出生的 Denis 经常在 Instagram 上晒一些旅行照，看来是一位热爱技术也热爱生活的小哥哥

更多精彩推荐

☞终于！朋友圈可以删除别人评论了……

☞空指针，段错误，这场面试我栽倒在这里了！

☞CSDN送你互联网大厂面试机会啦！

☞赠书 | 人工智能识万物：卷积神经网络的前世今生

☞MySQL 索引分析除了 EXPLAIN 还有什么方法？

☞医疗数字化：区块链或成最强辅助

点分享

点点赞

点在看

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？