搜索引擎原理与实践 Indexer类怎么写啊

袁津生的搜索引擎原理与实践Indexer类怎么写啊,我照着书的代码怎么调试都不对。publicstaticintindex(FileindexDir,FiledataDi... 袁津生的搜索引擎原理与实践 Indexer类怎么写啊,我照着书的代码怎么调试都不对。
public static int index(File indexDir,File dataDir)throws IOException{
if(dataDir.exists()==false||dataDir.isDirectory()==false){
throw new IOException(dataDir+"does not exist or is not a diretory");
}
IndexWriter writer=new IndexWriter(indexDir, new StandardAnalyzer(null), true);
writer.setUseCompoundFile(false);
indexDiretory(writer,dataDir);
int numIndexed=writer.docCount();
writer.optimize();
writer.close();
return numIndexed;
}
这里面一直有错。
我整了半天终于成功了,生成的索引记事本打开是乱码,也不知道对不对。贴代码如下:
public static int index(File indexDir,File dataDir)throws IOException{
if(dataDir.exists()==false||dataDir.isDirectory()==false){
throw new IOException(dataDir+"does not exist or is not a diretory");
}
FSDirectory dir = SimpleFSDirectory.open(indexDir);
IndexWriter writer = new IndexWriter(dir, new StandardAnalyzer(Version.LUCENE_30), true, MaxFieldLength.UNLIMITED);
writer.setUseCompoundFile(false);
indexDiretory(writer,dataDir);
int numIndexed=writer.numDocs();
writer.optimize();
writer.close();
return numIndexed;
}
展开
 我来答
LastAreas
2011-03-16 · 超过15用户采纳过TA的回答
知道答主
回答量:31
采纳率:0%
帮助的人:32.6万
展开全部
索引文件不是文本格式。。你用记事本打开当然是乱码。
想验证索引是否正确,可以用IndexReader来验证。
美林数据技术股份有限公司
2020-10-29 广告
Tempo大数据分析平台,是一款面向企业用户的数据分析与应用工具,为用户提供报表设计、可视化分析、机器学习、文本分析等自助式数据分析与探索。平台基于大数据架构,集数据接入、数据分析探索、成果管理与应用为一体,面向企业全民用户提供从数据到业务... 点击进入详情页
本回答由美林数据技术股份有限公司提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式