淘宝是如何实现sql大量数据模糊查询的？ 100

我的数据库有上千万条书籍信息，按关键字查找都很慢不管是like还是用全文索引的方法，至少都要10多秒，非常慢，淘宝是用什么方法把他的几百万个商家的上亿条商品信息在1秒里模... 我的数据库有上千万条书籍信息，按关键字查找都很慢不管是like还是用全文索引的方法，至少都要10多秒，非常慢，淘宝是用什么方法把他的几百万个商家的上亿条商品信息在1秒里模糊查询出来给用户的？展开

 我来答

5个回答

#合辑# 机票是越早买越便宜吗？

平静的心753
2017-02-06

知道答主

回答量：37

采纳率：0%

帮助的人：2.1万

我也去答题访问个人页

关注

展开全部

首先淘宝的商品数据以及图片不只是存放在数据库里的，而是分布式数据库和全文检索引擎同步，比如Whoosh,比如solr。了解solr之前需要先了解lucene,通常后台会隔一段时间把数据库里的数据同步到solr中，您查询内容其实是通过solr进行检索的。图片通常也会单独存放在分布式文件系统里，比如HDFS或者FastDFS，都可以实现海量的小文件吞吐。再多的细节我也不太清楚了，我有朋友在阿里，但也只是个p6，您如果有条件，可以和一些阿里研究院的人沟通下，反正我是找不到哈哈，水平太差。

已赞过 已踩过<

评论收起

百度网友f649fa1
2015-09-08 · TA获得超过107个赞

知道小有建树答主

回答量：95

采纳率：100%

帮助的人：20.1万

我也去答题访问个人页

关注

展开全部

关系型数据库的Like不是用来解决这个问题的，你需要建一套索引系统，1000万条，用lucene就可以了。lucene吃内存，你要准备大内存。

已赞过 已踩过<

评论收起

cruze的家
2016-09-06

知道答主

回答量：17

采纳率：0%

帮助的人：3.6万

我也去答题访问个人页

关注

展开全部

那是事先生成好的key-value。比如书籍名称是《如何学会泡妞》《如何学会JAVA》，系统默认处理
key=如何学会，value=《如何学会泡妞》，《如何学会JAVA》
key=学会，value=《如何学会泡妞》，《如何学会JAVA》
key=泡妞，value=《如何学会泡妞》
key=JAVA，value=《如何学会JAVA》

计算机为何能看出来泡妞是一个词，而 “会泡”不是一个词呢，是通过大量数据统计训练出来的

最后其实lucene可以解决，如果不做研究性

已赞过 已踩过<

评论收起

匿名用户
2015-09-08

展开全部

http://www.open-open.com/lib/view/open1428633540781.html
可能会帮到你

已赞过 已踩过<

评论收起

把酒醉颜欢
2015-09-08 · TA获得超过600个赞

知道小有建树答主

回答量：1042

采纳率：53%

帮助的人：448万

我也去答题访问个人页

关注

展开全部

跟百度的技术是一样的，我要知道我就进阿里了，

已赞过 已踩过<

评论收起

1条折叠回答

更多回答（3）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

自动采集软件-数据采集就用后羿采集器-小白神器

后羿采集器是新一代智能网页采集工具，不需要配置采集规则，为技术小白设计量身打造。导出数量无限制，可导出多种文件格式/网站/数据库，支持Win/Mac/Linux系统。

www.houyicaiji.com广告

【羽山数据】手机运营商核验数据API服务供应商

www.yushanshuju.com

下载转大师数据恢复_专业U盘_硬盘数据问题恢复_下载

下载转大师数据恢复是业内专业的数据恢复软件，专注于硬盘数据恢复、U盘数据恢复、电脑误删数据恢复、格式化恢复、回收站清空恢复等领域的服务，软件操作简单，点击下载...

www.guantie.cn广告

淘宝是如何实现sql大量数据模糊查询的？ 100

您可能关注的内容

其他类似问题

为你推荐：