搜索引擎原理与实践 Indexer类怎么写啊
袁津生的搜索引擎原理与实践Indexer类怎么写啊,我照着书的代码怎么调试都不对。publicstaticintindex(FileindexDir,FiledataDi...
袁津生的搜索引擎原理与实践 Indexer类怎么写啊,我照着书的代码怎么调试都不对。
public static int index(File indexDir,File dataDir)throws IOException{
if(dataDir.exists()==false||dataDir.isDirectory()==false){
throw new IOException(dataDir+"does not exist or is not a diretory");
}
IndexWriter writer=new IndexWriter(indexDir, new StandardAnalyzer(null), true);
writer.setUseCompoundFile(false);
indexDiretory(writer,dataDir);
int numIndexed=writer.docCount();
writer.optimize();
writer.close();
return numIndexed;
}
这里面一直有错。
我整了半天终于成功了,生成的索引记事本打开是乱码,也不知道对不对。贴代码如下:
public static int index(File indexDir,File dataDir)throws IOException{
if(dataDir.exists()==false||dataDir.isDirectory()==false){
throw new IOException(dataDir+"does not exist or is not a diretory");
}
FSDirectory dir = SimpleFSDirectory.open(indexDir);
IndexWriter writer = new IndexWriter(dir, new StandardAnalyzer(Version.LUCENE_30), true, MaxFieldLength.UNLIMITED);
writer.setUseCompoundFile(false);
indexDiretory(writer,dataDir);
int numIndexed=writer.numDocs();
writer.optimize();
writer.close();
return numIndexed;
} 展开
public static int index(File indexDir,File dataDir)throws IOException{
if(dataDir.exists()==false||dataDir.isDirectory()==false){
throw new IOException(dataDir+"does not exist or is not a diretory");
}
IndexWriter writer=new IndexWriter(indexDir, new StandardAnalyzer(null), true);
writer.setUseCompoundFile(false);
indexDiretory(writer,dataDir);
int numIndexed=writer.docCount();
writer.optimize();
writer.close();
return numIndexed;
}
这里面一直有错。
我整了半天终于成功了,生成的索引记事本打开是乱码,也不知道对不对。贴代码如下:
public static int index(File indexDir,File dataDir)throws IOException{
if(dataDir.exists()==false||dataDir.isDirectory()==false){
throw new IOException(dataDir+"does not exist or is not a diretory");
}
FSDirectory dir = SimpleFSDirectory.open(indexDir);
IndexWriter writer = new IndexWriter(dir, new StandardAnalyzer(Version.LUCENE_30), true, MaxFieldLength.UNLIMITED);
writer.setUseCompoundFile(false);
indexDiretory(writer,dataDir);
int numIndexed=writer.numDocs();
writer.optimize();
writer.close();
return numIndexed;
} 展开
美林数据技术股份有限公司
2020-10-29 广告
2020-10-29 广告
Tempo大数据分析平台,是一款面向企业用户的数据分析与应用工具,为用户提供报表设计、可视化分析、机器学习、文本分析等自助式数据分析与探索。平台基于大数据架构,集数据接入、数据分析探索、成果管理与应用为一体,面向企业全民用户提供从数据到业务...
点击进入详情页
本回答由美林数据技术股份有限公司提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询