为什么Lucene使用maxDoc而不是numDocs来计算术语idf？ [英] Why Lucene uses maxDoc instead of numDocs to compute term idf?

查看：210 发布时间：2018/12/28 23:10:00 java search lucene

本文介绍了为什么Lucene使用maxDoc而不是numDocs来计算术语idf？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我发现这是在Lucene的相似性类 public float idf（术语，Searcher搜索者）方法javadoc：

I found this on Lucene's Similarity class public float idf(Term term, Searcher searcher) method javadoc:

请注意，使用Searcher.maxDoc（）代替IndexReader＃numDocs（）
，因为Searcher.docFreq（Term）也是使用，当后者是
不准确时，Searcher.maxDoc（）和同一方向也是如此。在
中，Searcher.maxDoc（）的计算效率更高。

Note that Searcher.maxDoc() is used instead of IndexReader#numDocs() because also Searcher.docFreq(Term) is used, and when the latter is inaccurate, so is Searcher.maxDoc(), and in the same direction. In addition, Searcher.maxDoc() is more efficient to compute.

这对我来说没有多大意义。这是否与IndexReader中的文档删除有关？

This does not quite make sense to me. Does this have something to do with Document deletion in an IndexReader?

为什么Lucene使用maxDoc而不是numDocs来计算术语idf？ [英] Why Lucene uses maxDoc instead of numDocs to compute term idf?

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录关闭

为什么Lucene使用maxDoc而不是numDocs来计算术语idf？ [英] Why Lucene uses maxDoc instead of numDocs to compute term idf?

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录 关闭

登录关闭