搜索引擎如何实现用户图片检索的需求？

 我来答

1个回答

#热议# 发烧为什么不能用酒精擦身体来退烧？

百度网友f11af658
2016-11-08 · 超过16用户采纳过TA的回答

知道答主

回答量：30

采纳率：100%

帮助的人：17.9万

我也去答题访问个人页

关注

展开全部

针对输入有两种：

一、以文字搜图片

在采集图片的时候，如果是来自网页HTML中的img标签，通常会有alt属性，作为图片的注解，这可以作为图片的标签，还可能有页面的标题。如果是普通的图片，没有alt，那通过图片分类器，对图片打上标签。

有了图片对应的标签之后，文字搜图片的过程就变成了文字匹配标签的过程了，按照匹配度高低先后展示出来即可。

二、以图片搜图片

这个一般指的是识图功能，即找到相似的图片，需要计算图片之间的相似度。

首先需要缩小图片，灰化，然后取图片的hash，也就是图片的指纹。图片都是由像素组成，每个像素点都是由红绿蓝三原色（RGB）构成的，其中每种颜色取值为0~255，因此每个像素点的取值有16777216个（256^3），像素的大小信息会在文件格式中描述出来，假如说两张图片的所有像素点都一样，那肯定是同样的图片。但是这样的计算量太大了，而且也容不得一点、一像素的差异，而我们想要的其实是看起来一样的图片。因此需要提取出图片的hash，作为图片的特征。

这类算法比较多，也是关键点，比如说：pHash（感知哈希算法），大致是缩小图片至8X8大小，去掉了图片尺寸明暗上的差异，灰化去掉颜色，然后计算平均灰度，将每个像素与平均灰度比较，大于等于计1，小于计0，这样的差值序列就是hash，作为图片的特征。

pHash有对应的开源实现，然后还有SIFT、DCT等等算法。复杂的算法对抗图片的变形效果也会比较好。

在得到hash之后，通过计算两者的汉明距离，取汉明距离小的作为相似图片，大概是要低于5，而高于某个阈值就认为不相似。

本回答由提问者推荐

已赞过 已踩过<

评论收起

柚鸥ASO
2024-03-16 广告

「柚鸥ASO」在ASO这块就做的蛮不错的,一直专注于应用商店优化,因为专注所以专业;专注应用商店下载量优化、评分优化、关键词排名优化、关键词覆盖、产品权重提升等等整体方案优化服务柚鸥网络-全球ASO优化服务商专注ASO优化已11年！（效果说... 点击进入详情页

本回答由柚鸥ASO提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

怎么通过文字搜索图片-批量搜索图片中文字的方法

怎么通过文字搜索图片:在文件夹中搜索图片中的文字，也可在Word中搜索图片中的文字，快速找出含有搜索词的所有本地图片，支持图片分类，图片内文字查找/复制，功能齐全

www.zhsh10000.com广告

搜索引擎如何实现用户图片检索的需求？

您可能关注的内容

其他类似问题

为你推荐：