Lucene 3.5 提供深度分页支持 searchAfter方法方法的应用-白红宇

Lucene 3.5 提供深度分页支持 searchAfter方法方法的应用

阅读量：6857 次

发布时间：2019-06-26

本文共 5320 字，大约阅读时间需要 17 分钟。

最近Lucene项目管理委员会宣布Apache Lucene 3.5.0和Apache Solr 3.5.0已经可以使用。Lucene是一个高性能、支持全文搜索的文本搜索开发库。Solr是一个独立的搜索服务器，其核心使用了Lucene来做索引和搜索。

Lucene 3.5其中一个最新的特征就是深度分页支持，在之前的版本是提供分页的方法，只能根据自己的应用场景去写分页的方法！在《lucene in action》一书中提现两种分页的方法：1、将首次搜索获得的多页搜索结果收集起来并保存在ScoreDocs和IndexSearcher实例中，并在用户换页浏览时展现这几页的结果。

2、每次用户换页浏览时都重新进行查询操作。

按这两个方法是可以做出分页的，只是效果及性能影响大小而已！

现在Lucene 3.5 加入IndexSearcher.searchAfter方法，它在特定的ScoreDoc之后会返回结果。你可以将上一页的最后一个document传递给searchAfter方法，以得到下一页的结果。

实例如下：

View Code

1 @Override  2     public List
      
        searchBlogsList(String content,String bTypeId,String sDate,String eDate,Page page) throws IOException, ParseException {
     3         List
       
         blogList=new ArrayList
        
         () ;  4         // TODO Auto-generated method stub  5          TokenStream tokenStream=null;  6          try{
     7                 analyzer = new IKAnalyzer();  8                 //获取IndexSearcher 对象  9                 IndexSearcher indexSearch =commonIndexWriter.getIndexSearcher(); 10                 QueryParser queryParser= commonIndexWriter.getQueryParser(); 11                 //搜索条件的结合 12                 String str=""; 13                 if(StringUtils.isNotEmpty(content)){
    14                     str="title:"+content+" content:"+content; 15                 } 16                 if(StringUtils.isNotEmpty(bTypeId) && !bTypeId.equals("-1")){
    17                    if(StringUtils.isNotEmpty(str)){
    18                      str=str+" AND bTypeId:"+bTypeId; 19                    }else{
    20                      str=str+" bTypeId:"+bTypeId; 21                    } 22                 } 23                 if(StringUtils.isNotEmpty(sDate)){
    24                      if(StringUtils.isNotEmpty(str)){
    25                          str=str+" AND gmt_create:["+sDate+" TO "+eDate+"]"; 26                      }else{
    27                          str=str+" gmt_create:["+sDate+" TO "+eDate+"]"; 28                      } 29                 } 30                 //设置搜索条件 31                 Query query=queryParser.parse(str); 32                 //查询搜索引擎 33                 TopDocs result = indexSearch.search(query, 10); 34                 //上一页的最后一个document索引 35                 int index=(page.getCurrentPage()-1)*page.getPerPageSize(); 36                 ScoreDoc scoreDoc=null; 37                 //如果当前页是第一页面scoreDoc=null。 38                 if(index>0){
    39                     //因为索引是从0开始所以要index-1 40                     scoreDoc=result.scoreDocs[index-1]; 41                 } 42                 //分页处理 43                 TopDocs hits= indexSearch.searchAfter(scoreDoc, query, page.getPerPageSize()); 44                 //设置分页的总记录数 45                 page.setCounts(hits.totalHits); 46                 BlogsDO blog=null; 47                 //循环hits.scoreDocs数据，并使用indexSearch.doc方法把Document还原，再拿出对应的字段的值 48                 for (int i = 0; i < hits.scoreDocs.length; i++) {
    49                     ScoreDoc sdoc = hits.scoreDocs[i]; 50                     Document doc = indexSearch.doc(sdoc.doc); 51                     blog=new BlogsDO(); 52                     String title=doc.get("title"); 53                     String mark=doc.get("content"); 54                     //加亮处理 55                     SimpleHTMLFormatter simplehtml=new SimpleHTMLFormatter("
         ", ""); 56                     Highlighter highlighter = new Highlighter(simplehtml,new QueryScorer(query));  57                     if(title!=null){
    58                             tokenStream = analyzer.tokenStream("title",new StringReader(title));    59                             String highLightText = highlighter.getBestFragment(tokenStream, title); 60                             blog.setTitle(highLightText==null?title:highLightText); 61                     }else{
    62                         blog.setTitle(title); 63                     } 64                     //加亮处理 65                     if(mark!=null){
    66                         tokenStream = analyzer.tokenStream("content",new StringReader(mark));    67                         String highLightText = highlighter.getBestFragment(tokenStream, mark); 68                         blog.setContent(highLightText==null?mark:highLightText); 69                     }else{
    70                         blog.setContent(mark); 71                     } 72                     blog.setBlogsId(Integer.valueOf(doc.get("blogsId"))); 73                     blog.setNickName(doc.get("nickName")); 74                     blog.setbTypeId(doc.get("bTypeId")); 75                     blog.setbTypeName(doc.get("bTypeName")); 76                     blog.setRevDate(doc.get("gmt_create")); 77                     SimpleDateFormat sdf =  new  SimpleDateFormat("yyyyMMddHHmmss"); 78                     blog.setGmtCreate(sdf.parse(doc.get("gmt_create"))); 79                     blogList.add(blog); 80                 }    81                 indexSearch.close(); 82          }catch (java.text.ParseException e) {
    83                 // TODO Auto-generated catch block 84                 e.printStackTrace(); 85          }catch (InvalidTokenOffsetsException e) {
    86                 // TODO Auto-generated catch block 87                 e.printStackTrace(); 88          } 89          return blogList;

Lucene 3.5 在学习中，请多多指教！呵呵！

转载地址：http://fpjyl.baihongyu.com/

你可能感兴趣的文章