搜索引擎如何实现用户图片检索的需求?

 我来答
百度网友f11af658
2016-11-08 · 超过16用户采纳过TA的回答
知道答主
回答量:30
采纳率:100%
帮助的人:17.9万
展开全部

    针对输入有两种:

一、以文字搜图片

    在采集图片的时候,如果是来自网页HTML中的img标签,通常会有alt属性,作为图片的注解,这可以作为图片的标签,还可能有页面的标题。如果是普通的图片,没有alt,那通过图片分类器,对图片打上标签。

    有了图片对应的标签之后,文字搜图片的过程就变成了文字匹配标签的过程了,按照匹配度高低先后展示出来即可。


二、以图片搜图片

    这个一般指的是识图功能,即找到相似的图片,需要计算图片之间的相似度。

    首先需要缩小图片,灰化,然后取图片的hash,也就是图片的指纹。图片都是由像素组成,每个像素点都是由红绿蓝三原色(RGB)构成的,其中每种颜色取值为0~255,因此每个像素点的取值有16777216个(256^3),像素的大小信息会在文件格式中描述出来,假如说两张图片的所有像素点都一样,那肯定是同样的图片。但是这样的计算量太大了,而且也容不得一点、一像素的差异,而我们想要的其实是看起来一样的图片。因此需要提取出图片的hash,作为图片的特征。

    这类算法比较多,也是关键点,比如说:pHash(感知哈希算法),大致是缩小图片至8X8大小,去掉了图片尺寸明暗上的差异,灰化去掉颜色,然后计算平均灰度,将每个像素与平均灰度比较,大于等于计1,小于计0,这样的差值序列就是hash,作为图片的特征。

    pHash有对应的开源实现,然后还有SIFT、DCT等等算法。复杂的算法对抗图片的变形效果也会比较好。

    在得到hash之后,通过计算两者的汉明距离,取汉明距离小的作为相似图片,大概是要低于5,而高于某个阈值就认为不相似。

柚鸥ASO
2024-03-16 广告
「柚鸥ASO」在ASO这块就做的蛮不错的,一直专注于应用商店优化,因为专注所以专业;专注应用商店下载量优化、评分优化、关键词排名优化、关键词覆盖、产品权重提升等等整体方案优化服务柚鸥网络-全球ASO优化服务商专注ASO优化已11年!(效果说... 点击进入详情页
本回答由柚鸥ASO提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式