百度图片搜索引擎原理是如何实现的

在百度图片搜索页面只有上传一张图片就可以搜出想要的东西请问这是基于什么原理？而且我是本地上传图片无标题等标识文字... 在百度图片搜索页面只有上传一张图片就可以搜出想要的东西请问这是基于什么原理？而且我是本地上传图片无标题等标识文字展开

 我来答

4个回答

#热议# 海关有哪些禁运商品？查到后怎么办？

zczawzed
2015-10-17

知道答主

回答量：63

采纳率：0%

帮助的人：19.5万

我也去答题访问个人页

关注

展开全部

图片搜索的原理有三个步骤
1. 将目标图片进行特征提取，描述图像的算法很多，用的比较多的是：SIFT描述子，指纹算法函数，bundling features算法，hash function（散列函数）等。也可以根据不同的图像，设计不同的算法，比如图像局部N阶矩的方法提取图像特征。
2. 将图像特征信息进行编码，并将海量图像编码做查找表。对于目标图像，可以对分辨率较大的图像进行降采样，减少运算量后在进行图像特征提取和编码处理。
3. 相似度匹配运算：利用目标图像的编码值，在图像搜索引擎中的图像数据库进行全局或是局部的相似度计算；根据所需要的鲁棒性，设定阈值，然后将相似度高的图片预保留下来；最后应该还有一步筛选最佳匹配图片，这个应该还是用到特征检测算法。
其中每个步骤都有很多算法研究，围绕数学，统计学，图像编码，信号处理等理论进行研究。

根据Neal Krawetz博士的解释，原理非常简单易懂。我们可以用一个快速算法，就达到基本的效果。
这里的关键技术叫做"感知哈希算法"（Perceptual hash algorithm），它的作用是对每张图片生成一个"指纹"（fingerprint）字符串，然后比较不同图片的指纹。结果越接近，就说明图片越相似。下面是一个最简单的实现：
第一步，缩小尺寸。
将图片缩小到8x8的尺寸，总共64个像素。这一步的作用是去除图片的细节，只保留结构、明暗等基本信息，摒弃不同尺寸、比例带来的图片差异。
第二步，简化色彩。
将缩小后的图片，转为64级灰度。也就是说，所有像素点总共只有64种颜色。
第三步，计算平均值。
计算所有64个像素的灰度平均值。
第四步，比较像素的灰度。
将每个像素的灰度，与平均值进行比较。大于或等于平均值，记为1；小于平均值，记为0。
第五步，计算哈希值。
将上一步的比较结果，组合在一起，就构成了一个64位的整数，这就是这张图片的指纹。组合的次序并不重要，只要保证所有图片都采用同样次序就行了。
得到指纹以后，就可以对比不同的图片，看看64位中有多少位是不一样的。在理论上，这等同于计算"汉明距离"（Hammingdistance）。如果不相同的数据位不超过5，就说明两张图片很相似；如果大于10，就说明这是两张不同的图片。
具体的代码实现，可以参见Wote用python语言写的imgHash.py。代码很短，只有53行。使用的时候，第一个参数是基准图片，第二个参数是用来比较的其他图片所在的目录，返回结果是两张图片之间不相同的数据位数量（汉明距离）。
这种算法的优点是简单快速，不受图片大小缩放的影响，缺点是图片的内容不能变更。如果在图片上加几个文字，它就认不出来了。所以，它的最佳用途是根据缩略图，找出原图。
实际应用中，往往采用更强大的pHash算法和SIFT算法，它们能够识别图片的变形。只要变形程度不超过25%，它们就能匹配原图。这些算法虽然更复杂，但是原理与上面的简便算法是一样的，就是先将图片转化成Hash字符串，然后再进行比较。

已赞过 已踩过<

评论收起

柠蜂乐和瘾候10
2012-12-17 · TA获得超过1307个赞

知道小有建树答主

回答量：834

采纳率：50%

帮助的人：304万

我也去答题访问个人页

关注

展开全部

原理：百度看不见图片，但是百度索引擎可以识别文字，只要你在上传图片的时候写上ALT（图片属性，属性就是这图片的内容），然后引擎才能知道你这张图片是表达什么意思的，百度才会收录。收录后你百度一下你之前在图片里面写的文字，然后搜索百度图片可以找到你的图片了

更多追问追答

追问

【淘淘搜】是国内第一个基于视觉计算的图片购物搜索网站！其工作原理是由图像分析软件自动抽取图像的颜色、形状、纹理等特征，建立特征索引库，用户只需将要查找的图像的大致特征描述出来，就可以找出与之具有相近特征的图像我貌似找到答案了但是也谢谢你你说的那是传统的搜索逻辑

追答

你问的是百度，我当然回答的是百度

试用了一下你说的那个图片搜索引擎，按你所说的图像分析软件自动抽取图像的颜色、形状、纹理搜索出来的精确度的差距在70%，有待改进这软件，也算是一个综合型图片搜索引擎。

我搜索上了黑色皮衣，竟然出了两个别的不同的颜色





本回答被提问者采纳

已赞过 已踩过<

评论收起

改浩涆Qf
2015-09-25 · TA获得超过343个赞

知道小有建树答主

回答量：233

采纳率：100%

帮助的人：81万

我也去答题访问个人页

关注

展开全部

已赞过 已踩过<

评论收起

飞龙在天由
2015-04-01 · 知道合伙人互联网行家

飞龙在天由
知道合伙人互联网行家

采纳数：62 获赞数：224

向TA提问私信TA

关注

展开全部

这个涉及到和复杂的模式识别以及人工智能的算法

已赞过 已踩过<

评论收起

更多回答（2）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

没有广告，直达结果-搜索引擎-秘塔AI搜索

没有广告的搜索引擎，快速筛选信息，整合优质结果，一键体验极简搜索，满足你的所有需求。

www.metaso.cn广告

图片内容搜索-批量搜索图片中文字的方法

图片内容搜索:在文件夹中搜索图片中的文字，也可在Word中搜索图片中的文字，快速找出含有搜索词的所有本地图片，支持图片分类，图片内文字查找/复制，功能齐全

www.zhsh10000.com广告

百度图片搜索引擎原理是如何实现的

您可能关注的内容

其他类似问题

为你推荐：