search-engine相关内容

在Google自定义搜索API上无法获得超过100个结果

我需要使用Google自定义搜索API https://developers.google.com/custom-search/v1/overview .在该页面上,它说: 对于CSE用户,该API每天免费提供100个搜索查询. 如果您需要更多服务,可以在开发人员中注册以进行结算 安慰.额外的请求每1000个查询需支付$ 5,最多1万次 每天的查询次数. 我已经在开发者控制台中注册了计 ..
发布时间:2020-11-16 20:12:30 其他开发

单机性能上的多个碎片

如果我仅使用一台机器,在Elasticsearch中具有多个分片是否有意义?会以任何方式提高性能吗? Apache Solr的相同问题-将Solr Cloud与ZooKeeper一起用于单个服务器实例还是只创建一个没有任何分片的内核有意义吗? 假设我将来不会使用其他计算机,那么重点是单机上的分片如何影响搜索引擎的性能? 解决方案 Lucene的某些部分是单线程的,即使在单台计算 ..

expressjs node.js为google/etc bot和人流量提供不同的数据

我想确定传入的请求是来自机器人(例如Google,Bing)还是人类,并为每个请求提供不同的数据,例如JSON数据,以供客户端JavaScript构建站点或预处理的html. 使用expressjs,有一种简单的方法吗?谢谢. 解决方案 我建议您根据请求的MIME类型(在"Accept"标头中)进行响应.您可以通过Express这样操作: app.get('/route', f ..
发布时间:2020-11-02 07:09:35 前端开发

Elasticsearch全局搜索多个索引上的不同过滤器

Elastic Search中有多个索引,想在所有索引中搜索数据,但是我们想对不同的索引应用不同的过滤器。 例如: 很少有索引取决于 client_id ,因此需要client_id 过滤器 我们在少数索引中具有 is_deleted 标志,因此 is_deleted 过滤器是必需的 在Elastic Search中应该如何处理? 此外,我们正在使用突出显示功能,应该向用 ..
发布时间:2020-10-28 02:08:08 Java开发

如何在elasticsearch中配置同义词_路径

我是Elasticsearch的新手,我想使用同义词,我在配置文件中添加了以下几行: 索引: 分析: 分析器: 同义词: 类型:自定义 标记生成器:空格 过滤器:[同义词] 过滤器: 同义词: 类型:同义词 同义词_路径:同义词.txt 然后我创建了一个索引测试: “映射”:{ “ test”:{ “属性“:{ ” text_1“:{ ” type“:”字符串“, ..
发布时间:2020-10-28 02:02:39 其他开发

ElasticSearch:在对象数组内搜索

查询数组中的对象时遇到问题。 让我们创建一个非常简单的索引,添加一个具有一个字段的类型并添加一个包含对象数组的文档(我使用感知控制台): PUT / test / PUT / test / test / _mapping { “ test”:{ “ properties”:{ “ parent”: {“ type”:“ object”} } } } POST / tes ..
发布时间:2020-10-28 01:58:41 其他开发

Drupal搜索引擎不会索引我的自定义节点!

大约一个小时前有人发布了一个关于drupal搜索引擎的问题,大概是这样的: 我知道drupal应该为 node_view()返回的任何内容编制索引,但是对于我的自定义内容,这没有发生。另外:Drupal内置功能还有更好的选择吗? 由于我在回答时问题已被删除,并且没有?不想一辈子扔掉20分钟;)我想第二次重提这个问题。希望这按SO的规则很好! :) 解决方案 Drupal搜索引擎 ..
发布时间:2020-10-26 22:16:10 其他开发

在草垛的弹性搜索中忽略重音符号

我正在与干草堆一起使用elasticsearch以便提供搜索。我希望用户搜索英语以外的其他语言。例如。目前正在尝试使用希腊语。 在搜索任何内容时如何忽略重音符号。例如。假设我输入Ανδρέας(带有重音符号)时,其返回结果与其匹配。 但是当我输入Ανδρεας时,它不返回任何结果。搜索引擎应带任何包含“Ανδρέας”但也带有“Ανδρεας”的结果(第二个不带重音)。 有人可以 ..

robots.txt允许除少数子目录外的所有子目录

除了少数子目录外,我希望在搜索引擎中为我的网站建立索引。以下是我的 robots.txt 设置: robots.txt 在根目录中 用户代理:* 允许:/ 在子目录中将 robots.txt 分开(不包括在内) 用户代理:* 不允许:/ 是正确的方法还是根目录规则将覆盖子目录规则? 解决方案 否,这是错误的。 子目录中不 ..
发布时间:2020-10-10 22:08:03 其他开发

JavaScript RegExp AKA中的LIKE'%$ word%'的相等性如何制作JavaScript搜索引擎

我有一个localStorage对象,其中包含是的,我已经解析过了。 在该数据中,我希望在数组中搜索某些内容,例如“此处所有内容” +关键字+“此处所有内容”;就像SQL“ Like’’”查询一样。 啊,是的,indexOf似乎可以很好地工作。我现在要做的只是制作一个简单的RegExp来验证搜索输入(仅用于长度和字符-没什么。) 您知道,我在工作希望可以在一个本地应用程序上将Go ..
发布时间:2020-09-24 23:37:19 前端开发

torrentz.eu之类的网站如何收集其内容?

我想知道一些搜索网站如何获得其内容。 我在标题中使用了“ torrentz.eu”示例,因为它包含来自多个来源的内容。 我想知道这个系统的背后;他们只是“解析”他们支持的所有网站,然后显示内容吗?还是使用某些Web服务?还是两者都用? 解决方案 您正在寻找信息检索的Web_crawler“ rel =” nofollow noreferrer“>爬网。 基本爬网是:假设初始设置的 ..
发布时间:2020-09-24 07:06:42 其他开发

如何撤消301重定向?

现在,我对301重定向没有任何问题,但是有人问我如何为浏览器和搜索引擎撤消缓存的301重定向,因此我回答“通过将301重定向回原始网址” ,至少那是我认为的解决方案,直到我看到有人提到您无法执行301重定向回 http://getluky.net/2010/12/14/301-redirects-cannot-be-undon/ http://www.velocityreviews.com/f ..

如何阻止不良身份不明的漫游器爬网我的网站?

我该如何抵抗不良的身份不明的漫游器来抓取我的网站?一些名称不存在于Apache cPanel中的不良bot严重访问了我的网站带宽. 我曾在batgap.com/robots.txt上尝试过robots.txt,但也使用.htaccess进行了阻止,但带宽使用率没有任何改善.我不知道这些漫游器的IP,因此无法通过IP地址阻止它们.这些漫游器占用了太多的站点带宽,因此,我需要从服务器上增加它. ..
发布时间:2020-09-23 00:08:46 其他开发

搜索组合框(如Google搜索)

我正在制作Windows窗体,其中有一个组合框,已从SQL Server 2010中装入一些“发票编号". 我想在用户在“组合"框中键入时显示发票编号. 例如,如果用户键入"100",则下拉列表中应显示以"100"开头的发票编号. 请帮助, 在此先感谢... 解决方案 DataTable temp; DataTable bank; private void F ..
发布时间:2020-09-14 04:55:37 C#/.NET

我如何找到哪些搜索词(如果有的话)将用户吸引到我的网站?

我想基于此创建动态内容.我知道它在某个地方,因为Web分析引擎可以获取这些数据来确定人们如何访问您的网站(引荐来源,使用的搜索字词等),但我不知道自己如何获得它. 解决方案 您可以使用用户发送的请求的“引荐来源"部分来找出他要搜索的内容.来自Google的示例: http://www.google.no/search?q=stack%20overflow 因此,您必须在字符串( ..
发布时间:2020-08-24 04:53:45 其他开发

计算忽略搜索引擎的页面的观看次数?

我注意到StackOverflow对每个问题都有一个视图计数,并且这些视图编号相当低且准确. 我在一个网站上也有类似的事情.当页面在后端代码中加载时,它基本上记录“命中".不幸的是,它也会对搜索引擎中的点击数产生giving肿且不准确的数字. 我猜不算机器人的一种方法是在页面加载后通过AJAX调用进行视图计数,但是我敢肯定还有其他更好的方法可以忽略点击计数器中的搜索引擎,同时仍然让他们 ..
发布时间:2020-08-06 19:07:00 其他开发

可以搜索引擎读取jquery动作

我想要一个包含iframe内容的弹出div. 当我使用jquery创建搜索引擎时,搜索引擎可以读取此信息吗? 或者,有没有办法检测服务器端的搜索引擎并删除此弹出窗口的选项? 解决方案 最好的方法是正常降级,例如通过使用标准 链接指向在弹出窗口中打开的资源. 然后,您将JQuery代码添加到链接中,使它在弹 ..
发布时间:2020-07-08 04:16:04 前端开发

搜索引擎如何抓取Javascript?

如果我使用jQuery document.ready向图像中添加随机关键字alt attrb(认为该页面已经加载),它将如何影响搜索引擎? 搜索引擎会完全获得我用任何JavaScript添加的alt attrb吗?如果没有,它怎么能理解通过JavaScript发送的Ajax调用? 我想将alt attrb添加到客户站点中没有任何图像的图像中,以防它们忘记放置alt文本. jQuery将 ..
发布时间:2020-07-08 03:20:43 前端开发