使用rgb和只是有灰度进行深度学习有多大差距
3个回答
2017-08-12
展开全部
计算机视觉,通过RGB或者RGBD信息,让计算机能对其中包含的信息,如图片中主要有什么,感兴趣的物体(人)在图中什么位置。最近有一项研究关于NBA篮球赛,可从视频中分析出要进行大动作的"焦点人物"。计算机视觉中,会用到一些传统的图像处理方法,不过越来越多的计算机视觉研究基于机器学习和深度学习。之前视觉总需要提取特征,sift,stip等,而特征的好坏直接影响到视觉识别结果,通过无监督特征学习,如稀疏自编码,能从数据中得到一个比较靠谱的特征,后续直接通过分类器等进行处理即可。机器学习是数据驱动,在获得大量数据后,通过数据构建模型从而完成预测,分类等任务。机器学习包含较多方面,只说神经网络。通过人工神经元构建的神经网络,只要两三层便能较好的拟合任意函数,对于简单的任务只要把数据扔进去训练即可。后来有人发现如果多几层,神经网络的准确率会更好,不过层数过多时,提升不明显,训练时间极具提高。此外对于很多复杂的任务,简单的神经网络不足以应付。比如对于20*20的数字灰度图片,只要把这400个像素值输入网络即可。但是对于640*480的彩色图片,要识别图中是什么动物,那简单的神经网络结果就不怎么样了,而且通常需要预先从图中提取特征向量,而不能直接把图片当成特征向量。深度学习对神经网络进行了多种改进,比如卷及神经网络,循环神经网络等,无一例外就是网络层数提高,而且直接输入原始数据,学习特征,再学习分类模型。
澳谱特
2024-11-25 广告
2024-11-25 广告
动态光散射纳米粒度仪是澳谱特科技(上海)有限公司重要产品线之一,它基于布朗运动原理,通过测量微粒在溶液中散射光的强度波动,精确分析溶液中微粒的大小分布及动态特性。该仪器具有高分辨率、快速测量、操作简便等优势,广泛应用于材料科学、化学工程、生...
点击进入详情页
本回答由澳谱特提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询