人工智能正在让手机摄像头发生爆炸吗?
人工智能正在让手机摄像头发生爆炸
从移动AI芯片的诞生起,这个系列已经追踪分析和报道过很多手机领域的新变化。但假如让我来总结AI和手机发生碰撞之后,最大的变化发生在哪里,答案可能只有一个:摄像头。
从技术逻辑上讲,搭载AI运算处理单元后的手机,结合本身GPU的图像处理能力,最显著的能力提高就是在图像内容生成、识别和处理上。无论是美颜、美景还是美视频,算法都能给你美出来。
但事实上,高端机们不得不齐齐拥抱AI背后,或许还有更深层次的产业矛盾和现实问题。手机AI也不止带来了“拍照更好看”的简单提升。
我们将引用华为Mate 10、iPhone X和谷歌Pixel 2三款加入了AI能力与运算单元的智能手机,来讨论AI带给手机摄像头与拍摄功能的改变。
曾经我们认为手机只能打电话发短信,之后buang的一声,手机被炸成了今天“无所不能”的智能机。随着AI的到来,摄像头可能也在经历一场类似的爆炸。
手机摄影已经进入深水区,创造差异只能用AI
为什么在短短几个月之间,苹果、谷歌、华为的主流旗舰机都宣布进入了AI时代?
最直接的原因,显然在于高端机之间不可避免年年上演的拍照能力大战,打到如今已经进入了无比惨烈的拼刺刀阶段。
也有人觉得,在手机光学硬件和摄像单元上,摩尔定律已经接近失效了。随着双镜头、大光圈、千万以上像素摄像头成为标配,摄像头的核心单元群落似乎已经被固化。但手机还是要年年出,年年有改进。更要命的是对于高端机来说,摄像部分是绝对的血海厮杀,绝不能落人一头——想想手机背后的研发者和产品经理们,也是够头疼的。
即使领军的苹果,这几年在摄像头也是前进的举步维艰。甚至打开一些专业评测网站的照片,普通用户很可能分辨不清两代机型,以及竞品机型拍摄照片之间到底有什么差别。
毕竟不是每个人都是摄影师和艺术家,有那么细致的分辨能力。所以为了让消费者继续感知拍照能力在变化,必须在摄像单元之外想办法——于是AI似乎成了最好的选择。
人工智能技术的引入,或许意味着手机可以凭借基础硬件的改变和大量算法助阵,来提升手机在拍摄、录制时的体验。创造更多的玩法、更简单的体验,摆脱在光圈、像素等少数几个领域的无尽纠缠。对于渴望新消费增长点的手机厂商来说绝对是一场惊喜。
更重要的是,AI算力与算法在手机拍摄中的应用,可以有多种模式和方法。很难想象秘密研发的旗舰机会在AI应用细节上撞车。这点在华为Mate 10和iPhone 8/X之间的差异化中已经可见一斑,而这只是个开始,更多技术与开发生态成熟后,两款旗舰机之间的差距只会越来越大。这是手机厂商们求之不得的。
脱离同质化竞争的苦海,恐怕只能靠AI。所以,AI来了......
最后的战役:算法和硬件能力填补特殊场景
当然,AI可能改变手机的拍摄战争,绝不是说这场战役就不继续下去了。
事实上,在开创新玩法之前,AI帮助手机拍摄完成的最后一场战役,还是会聚焦在主流手机攻坚了许多年的战场:特殊场景拍摄。
这里所谓的特殊场景,包括夜景、强光、暗光、动态捕捉几个方面,具体应用的例子更是花样繁多。因为手机的摄像头注定没有纵深,所以无法像单反摄像头一样来处理极限光环境下的成像效果。因此暗光、强光环境下的拍摄,也逐渐成为评价一款手机摄像能力好坏的基本要素。
看一下DxOMARK的手机拍摄评分排名,会发现前五已经基本被AI手机所占据。而这些手机拍照能力的重要加分项,就来自算法对光线环境的捕捉和平衡推导。比如谷歌谷歌Pixel 2会采用复杂的算法,比如对摄像头收集信息进行拆分和模块深度学习,来达成精神效果和光源重绘。因此在白光处理上获得了高分。
在DxOMARK的这张评测图中,可以看出应用了AI算法帮忙之后,各家旗舰机在处理光影关系时都较以前的纯光学模式有了显著改善,尤其是在匹配阴影与光亮的结构关系上。
算法捕捉技术不仅作用于静态拍照中,更多体现在高速运动环境下通过算法来实现超高速对焦,以及在暗光环境下完成的识别+拍摄。
AI+手机拍摄,还能在比较复杂的动作和特殊光线下实现动态美颜与视频美化。利用底层硬件+算法,智能机可以实现了单靠摄像头无法达成的很多功能。
但这只是提升,AI到来的真正意义在于让很多所谓“常识”发生改变…..
直男救星:用AI的识别能力解放人类拍照
请假设你是一位不热爱拍照,但热爱女朋友的直男……当你使用昂贵手机给女友拍照的时候,第一感觉是什么?
开心?忐忑?NO,你的第一感觉是复杂到心累。你会发现手机上一大堆功能,一会要HDR,一会要美颜美肤,一会要大光圈背景虚化,一会要景深模式......这要是赶上个暴脾气,不是扔手机就是扔女朋友。
事实上,会产生如此复杂的操作和专有名词。是因为为了处理不同的拍摄对象和场景,手机必须模仿相机的模式,给出不同的曝光、白平衡和对焦策略。但更多的功能意味着更复杂的操作,世界上还是手残党多一点,是否能免去这一步呢?
对于AI加入手机这件事,或许一个十分值得兴奋的点在于,AI的主要能力之一在于识别和理解图像。换言之,通过识别后的图像信息自动触发功能对应,或许意味着可以把拍照无能的直男们解放出来。
比如谷歌的Pixel 2就很大程度上利用了AI的识别能力来拍照。在它的摄像单元里,隐藏着一个神经网络算法,专门用来分辨拍摄中的人物信息。然后传输到后端进行不同阶段的对应图片处理。
当然,谷歌的这个技术主要目的是让但摄像头来获取双摄的美颜拍照背景虚化能力。而华为Mate 10的识别+拍摄,也即其宣传的“智慧摄影”模式似乎是更激进的方案。Mate 10的处理方式,是通过NPU来先期学习图片的信息特征,从而获得给拍照对象分类的能力。然后组织成13种拍照模式。
当摄像头在拍摄时触发了这种模式,手机将自动调到对应的模式。
事实上,这种先识别后拍摄的模式很可能在短期内成为通行的标配,甚至取代一部分常用功能。毕竟在我们日常生活和社交中,拍摄照片的目的和期望效果是有高度一致性的。通过AI带来的深度学习能力归纳这些特性,智能化完成用户期许,或许才是未来摄影的常态。
也许不久的将来,你到了海边结果下雨,到了景区遇上雾霾,到了好莱坞没有大明星,就可以用AI来造蓝天白云青山绿水,甚至弄出来几个偶尔路过的明星侧影.....
当然,AI的识别+拍摄能力,真正应该解放的是老人、孩子以及大多数只是偶尔采用手机拍照的普通人。毕竟我们大多数人无暇学习复杂的教程,锤炼高超的审美,但我们还是希望让精心准备的一刻留下更漂亮的记忆。
AI让世界更公平,也许正是如此。
已经发生的大爆炸:摄像头不只用来拍照
上面介绍了两种可见的AI+摄像头模式:AI提升拍摄和AI改变拍摄。而AI还带给摄像头另一种赋能:不只用来拍摄。
目前所见,这重功能已经有两种思路:第一种iPhone X为代表的,在感知能力上做文章,将摄像头与传感部件结合生成新的体验与功能。
iPhone X摄像头在结合了新的感光元件以外,更重要的是加入了相当复杂的传感器系统。尤其是在前置摄像头上,用“刘海”里原深感摄像头实现了生物识别和动态捕捉,达成了Animoji和人像光效等特色功能。
另外Face ID也是通过类似功能来实现的结构光识别。泛光感应元件还能在暗光状态下帮助用户解锁手机。这种思路或许意味着,摄像头以后不仅仅是“看见”,而更多可以“感知”外在。目前作用仅仅是人脸识别和一些特色功能,但距离运用硬件和算法基础开发更多功能应该已经不远了。
而另一种模式,是通过摄像头本身的机器视觉能力来获得数据学习和智能体成长能力。加入记忆和学习能力的AI摄像头不仅是记录影像信息,并且还会在本地完成对这些信息的学习和理解。从而适应用户习惯,达成更好的拍摄体验。
这两种方式都意味着,手机AI带来的不仅是摄像能力本身的提升。而是将摄像头作为信息采集方式之一,纳入更庞大的能力体系里。以此培养出手机的精准识别能力、多元数据处理能力、内容输出能力,这对于未来才是至关重要的。
或许等到开发者开始集体思考这些能力意味着什么,移动AI带给影像世界的真正价值才会浮现出来。
AI可以改变手机的很多方面,但从根本上说,它想改变的是被看做常识的人机交互方式。
2024-10-28 广告