分布式计算/Hadoop
首先我有仅包含“url”(分析)和“respsize”(not_analyzed)字段的文档。我想要更新匹配url的文档,并添加新的字段“category” 我的意思是 at first doc1: { “url”:“http://stackoverflow.com/用户/ 4005632 / mehmet-yener-yilmaz“, ”respsize“:”500“ }
..
我的所有文档都有一个 uid 字段,其中的ID将文档链接到用户。有多个文档具有相同的 uid 。 我想对所有只返回/ code>。 选择相关文档的查询是一个简单的 解决方案 你需要一个 top_hits 聚合。 p> 根据您的具体情况: { “查询“:{ ”multi_match“:{ ... } }, ”aggs“:{ ”top-uids“ “条款”:{
..
我一直在尝试在弹性搜索中使用日期直方图聚合,并将日期作为纪元或yy-mm-dd-mm-ss格式返回。但是我想要的是每周星期一获得文件数量,星期二等。有没有办法可以做到这一点? 解决方案 你需要采取不同的方法。 使用脚本,您可以将日期时间转换为星期几。 如果您使用术语聚合,则该值将适用。 将日期时间值转换为工作日的脚本 Date date = new Date(doc ['
..
我正在使用Java API for Elasticsearch。 将实体保存到索引中,可以与完整的源一起检索它们。但是,我只想检索所选的字段,而且这不起作用。 下面的示例代码: SearchResponse response = client.prepareSearch(“my-index”) .setTypes(“my-type”) .setSearchType(Search
..
我试图禁用仅针对特定索引的动态映射创建,而不是全部。由于某种原因,我无法使用'dynamic':'false'放置默认映射。 所以,这里留下两个可以看到的选项: 指定属性'index.mapper.dynamic' / em>在文件 elasticsearch.yml 中。 将'index.mapper.dynamic'在索引创建时间,如下所述 https://www.elastic.c
..
我有一个文档,我有一些字段,我从来没有查询过,所以我想转换这些字段的索引,以节省资源。我相信我需要禁用 _all 字段,但是如何指定哪些字段被索引? 解决方案 默认情况下,所有字段都在 _all 特殊字段也提供所谓的即时功能盒子外面。但是,您可以通过 include_in_all 选项,为映射中的每个字段指定是否要将其添加到_all字段: “person”:{ “properties
..
我有一个使用elasticsearch-jetty项目的嵌入式弹性搜索,我需要设置比默认值更好地使用tokenizer。我想使用关键字tokenizer。 我无法弄清楚我通过配置文件如何做到这一点。任何人都可以指出我通过配置文件来做到这一点吗? 除此之外,可以通过对索引执行POST来调整索引,同时启动和运行索引?我真的很想了解如何使用这个,谢谢。 编辑/更新:我无法将curl -
..
有没有办法告诉弹性搜索不返回任何元数据?目前我可以选择要在源中返回哪些字段。但我只想要来源的字段。我不喜欢没有返回的元数据,因为我不需要它,并将节省一些不必要的解析和传输等。 我发现
..
我是Elasticsearch的新手,目前正在努力实施一个 geo_distance 过滤器进行搜索。到目前为止,我的索引具有以下映射(我已经删除了一些字段): { advert_index:{ 映射:{ advert_type:{ 属性:{ __v:{ 类型:“long” }, caption:{ 类型:“string” }, 类别:{ 类型:“string” }, **位
..
我们有一个符合OData的API,将其全部搜索需求的一部分委派给Elasticsearch集群。 由于OData表达式可能会变得相当复杂,因此我们决定将它们简单地转换为相同的Lucene查询语法,并将其提供给 query_string 查询。 我们支持一些文本相关的OData过滤器表达式,例如: startswith(field,'bla') endswith(field,'bla
..
该文件已编入索引,但搜索结果返回0次匹配。 我需要搜索结果才返回文档ID和高亮结果 (不含base64内容) 这是代码: 我会感谢在这里的任何帮助, 谢谢, class Program { static void Main (string [] args) { //创建客户端 string index =“myindex”; var set
..
我有一些文件: {“name”:“John”,“district”:1}, {“name”:“Mary”,“district”:2}, {“name”:“Nick”,“district”:1}, {“name” ,“区”:3}, {“name”:“肯尼”,“区”:1} 如何按区划过滤/选择不同的文件? {“name”:“John” “区”:1}, {“
..
我有一组通过NLP algos从文本中提取的单词,每个文档中的每个单词都有相关的分数。 例如: 文档1:{“vocab” [{“wtag”:“James Bond”,“rscore”:2.14}, {“wtag”:“world”,“rscore”:0.86}, ...., {“wtag”:“somemore”,“rscore”:3.15} ] } 文档2:{“vocab
..
在阅读 轮胎 文档时,我的印象是你应该使用映射或 to_indexed_json 方法,因为(我的理解是..)映射用于提供 to_indexed_json 。 问题是,我发现一些使用两个教程。为什么? 基本上,我的应用程序现在使用 to_indexed_json ,但我无法弄清楚如何设置某些属性的增强值(因此我开始关注映射的原因),我想知道如果使用两者会产生一些冲突。 解决方案
..
如何过滤具有一个数组的字段并具有多个N元素的文档? 如何过滤具有字段的文档?空数组? 是解决方案吗?如果是,那么怎么样? 解决方案 我将看看脚本过滤器。以下过滤器应仅返回 fieldname 字段中至少有10个元素的文档,这是一个数组。请记住,这可能是昂贵的,具体取决于你的索引中有多少文件。 “filter”:{ “script”:{ “script”:“doc ['fi
..
我正在对汇总进行以下查询: aggs:{ total:{ 总和:{ script:“doc ['comments']。value + doc ['likes']。value + doc ['shares']。value” } } } ,并引发以下异常: ScriptException [动态脚本禁用] 任何想法如何解决这个问题。参考:
..
我是Elasticsearch的新手,我在这里阅读 https:// www .elastic.co / guide / en / elasticsearch / plugins / master / mapper-attachments.html 在弹性搜索5.0.0中不推荐使用mapper-attachments插件。 我现在尝试使用新的摄取附件插件索引pdf文件并上传附件。 我迄
..
我知道可以通过deleteByQuery删除某个类型的所有文档。 示例: curl -XDELETE'http:// localhost:9200 / twitter / tweet / _query'-d'{ “query”:{ “term”:{“user “:”kimchy“} } }' 但是我没有而且只需要删除该类型的所有文档,无论什么条件。实现这一目标的最
..
在我的弹性搜索服务器中,我有一个索引 http:// localhost:9200 / blog 。 (博客)索引包含多种类型 例如: http:// localhost:9200 / blog / posts , http :// localhost:9200 / blog / tags 。 在标签类型中,我创建了超过1000个标签和10个帖子类型。 例如:帖子
..
我有一个带有以下映射的类型 PUT / testindex { “mappings”: { “products”:{ “properties”:{ “category_name”:{ “type”:“string”, “index”:“not_analyzed “ } } } } } 我想搜索一个确切的单词。这是为什么我设置为not_analyzed。
..