open-uri - IT屋-程序员软件开发技术分享社区

Ruby 的“open-uri"和“Net:HTTP"gem 有什么区别?

看起来这两个 gem 执行的任务非常相似.谁能举例说明一种宝石比另一种更有用的地方?我没有我所指的特定代码，我更想知道每个 gem 的一般用例.我知道这是一个简短的问题，我会根据要求填写空白.谢谢. 解决方案它们看起来执行类似任务的原因是 OpenURI 是 Net::HTTP、Net::HTTPS 和 Net::FTP 的包装器.p> 通常，除非您觉得需要较低级别的接口，否则使用 O ..

发布时间：2022-01-18 18:04:11 ruby gem net-http open-uri 其他开发

open-uri 从以 iso-8859 编码的网页返回 ASCII-8BIT

我正在使用 open-uri 读取一个声称以 iso-8859-1 编码的网页.当我读取页面内容时，open-uri 返回一个以 ASCII-8BIT 编码的字符串. open("http://www.nigella.com/recipes/view/DEVILS-FOOD-CAKE-5310") {|f|p f.content_type, f.charset, f.read.encoding ..

发布时间：2022-01-18 13:54:12 ruby encoding internationalization open-uri 其他开发

如何在使用 Ruby 的 OpenUri 下载之前获取 HTTP 标头

我目前正在使用 OpenURI 在 Ruby 中下载文件.不幸的是，如果不下载完整文件，似乎不可能获得 HTTP 标头: open(base_url,:content_length_proc =>λ {|t|如果 t &&0 t)结尾},:progress_proc =>λ {|s|pbar.progress = s 如果 pbar}) {|io|放 io.sizeputs io.meta[' ..

发布时间：2022-01-17 17:39:48 ruby http-headers open-uri 其他开发

Nokogiri、open-uri 和 Unicode 字符

我正在使用 Nokogiri 和 open-uri 来获取网页上标题标签的内容，但在处理重音字符时遇到了问题.处理这些问题的最佳方法是什么?这是我正在做的: 需要'open-uri'需要'nokogiri'doc = Nokogiri::HTML(打开(链接))title = doc.at_css("title") 此时，标题是这样的: 抹布\303\271 代替: 抹布 ..

发布时间：2021-12-26 13:48:36 ruby unicode screen-scraping nokogiri open-uri 其他开发

如何修复“Errno::ENOENT:没有这样的文件或目录@rb_sysopen"?

编码的新手！我用 rails new 创建了一个新项目. 我正在尝试抓取网站，但出现错误Errno::ENOENT:没有这样的文件或目录@rb_sysopen 需要'open-uri'需要'nokogiri'需要“撬"def get_page链接 = "https://www.pokemon.com/us/pokedex/";doc = Nokogiri::HTML(打开(链接))#其余代 ..

发布时间：2021-09-24 19:02:48 ruby-on-rails ruby web-scraping open-uri 其他开发

如何指定“http请求头"在 OpenURI 中

我正在尝试使用 Ruby 的 OpenURI gem 调用 URL，但是它需要我在其 HTTP 请求标头中传递某些值. 知道怎么做吗? 解决方案根据文档，您可以将http标头的散列作为第二个参数传递给open: open("http://www.ruby-lang.org/en/",“用户代理" =>"红宝石/#{RUBY_VERSION}",“来自"=>"foo@bar.in ..

发布时间：2021-07-11 20:31:18 ruby open-uri 其他开发

从网页解析产生 405 Not Allowed

在提出这些问题之前，我一直在寻找解决方案，但不幸的是，它们都没有产生好的结果.访问此特定 url 时，我收到 OpenURI::HTTPError: 405 Not Allowed: 需要'open-uri'doc = Nokogiri::HTML(open("http://streeteasy.com"))#=>OpenURI::HTTPError: 405 不允许来自/Users/cyrus ..

发布时间：2021-06-08 18:50:51 ruby web-scraping nokogiri open-uri 其他开发

想要将Facebook图像保存到我的Rails应用程序中

我正在使用ominauth在Rails应用程序中注册用户.我还有一个基本的注册选项，也包含电子邮件地址.因此，对于这两个用户，我都必须将上传用户图片保存在我的文件系统中，对于电子邮件用户，我要定期上传文件，但对于FB用户，我希望将其图片保存在我的光盘中，以便我可以使用相同的代码，而在不使用FB图形链接的情况下显示. FB使用图形API发送这种格式的图像 http://graph.face ..

发布时间：2021-05-06 20:09:29 ruby-on-rails facebook facebook-graph-api open-uri omniauth-facebook 其他开发

从URL打开大文件时防止超时

我正在编写一个Ruby 1.8.7脚本，该脚本必须从服务器请求非常大的XML文件(1-5MB)，这非常慢(1MB需要1min30sec).所请求的文件已写入磁盘. 我将脚本中的超时设置为一些荒谬的秒数，因为我真的想获取文件，而不是花费太长时间继续前进.仍然有很高的秒数，我一直在超时. 这是否有最佳实践? 现在我使用 open(DIR + "" + number + "" ..

发布时间：2020-07-02 03:28:28 ruby open-uri 其他开发

如何从远程URL的长CSV的前几行中快速获得一个字符串?

我正在做一个作业，我使用Yahoo的股票价格系统从网上检索了几个股票价格.不幸的是，我必须使用的 Yahoo API 返回该文件显然每天包含一个交易行，对于我正在使用的股票，该行至少包含5000行，而对于其中一些股票，则至少包含1万行(不过，我只关心当前的价格，该价格在第二行. 我目前正在这样做: require 'open-uri' def get_ticker_price(stoc ..

发布时间：2020-07-02 03:28:25 ruby csv open-uri 其他开发

Rails open-uri在路径上中断

我正在尝试使用open-uri获取网址. 我的代码非常简单 url = open("http://localhost:3000/descriptions") return render :text => url.to_json 运行此代码时，出现超时错误. 当我只请求"http://localhost:3000"时，我得到了我的主页(正确). 因此，这似乎在某处 ..

发布时间：2020-07-02 03:28:21 ruby-on-rails ruby-on-rails-3 ruby-on-rails-3.1 open-uri 其他开发

循环访问多个URL以使用Nokogori解析HTML

我想做的是使用Nokogiri刮擦多个供应商的商品名称和价格.我使用方法参数将CSS选择器(传递给查找名称和价格)传递给了Nokogiri. 关于如何将多个URL传递到"scrape"方法同时传递其他参数(例如:vendor，item_path)的任何指导?还是我要以一种完全错误的方式来解决这个问题? 这是代码: require 'rubygems' # Load Ruby Ge ..

发布时间：2020-07-02 03:28:19 ruby nokogiri open-uri 其他开发

红宝石使用open-URI从S3读取文件

从S3读取文件时遇到一些问题.我希望能够远程加载ID3标签，但是使用open-URI不起作用，它给我以下错误: ruby-1.8.7-p302 > c=TagLib2::File.new(open(URI.parse("http://recordtemple.com.s3.amazonaws.com/music/745/original/The%20Stranger.mp3?12920965 ..

发布时间：2020-07-02 03:27:16 ruby-on-rails ruby id3 open-uri ruby-on-rails-3 其他开发

Ruby 2升级破坏了Nokogiri和/或open-uri编码吗?

将Rails3.2 Ruby 1.9应用程序升级到Rails3.2 Ruby 2.1.2时，我有一个谜需要解决. Nokogiri似乎中断了，因为它使用open-uri更改了行为.没有宝石的版本被改变，只有红宝石的版本(这在OSX Mavericks上全部使用brew，gcc4等). 复制步骤: $ ruby -v ruby 1.9.3p484 (2013-11-22 revision ..

发布时间：2020-07-02 03:27:14 ruby-on-rails ruby nokogiri open-uri 其他开发

open-uri和sax解析大型XML文档

我需要连接到外部XML文件进行下载和处理(超过300MB). 然后遍历XML文档并将元素保存在数据库中. 我已经在使用 Saxerator 的生产服务器上做到这一点没问题，以节省内存.效果很好.现在是我的问题- 我需要使用open-uri(尽管可能有其他解决方案?)来抓取要解析的文件.问题是open-uri必须先解析整个文件，然后再开始解析，这违背了使用SAX解析器保存在内存中的整个目 ..

发布时间：2020-07-02 03:27:11 ruby xml sax open-uri 其他开发

调整Nokogiri连接的超时

当服务器繁忙且我正在一页一页地请求页面时，为什么nokogiri等待几秒钟(3-5)，但是当这些请求处于循环中时，nokogiri不会等待并抛出超时消息. 我正在使用超时块包装请求，但nokogiri根本不等待该时间. 有建议的程序吗? # this is a method from the eng class def get_page(url,page_type) begin tim ..

发布时间：2020-07-02 03:27:07 ruby timeout nokogiri open-uri net-http 其他开发

使用OpenURI或net/http进行Ruby代理身份验证GET/POST

我正在使用ruby 1.9.3，并尝试使用open-uri获取URL并尝试使用Net:HTTP 发布我试图同时使用代理身份验证: 尝试使用net/http发出POST请求: require 'net/http' require 'open-uri' http = Net::HTTP.new("google.com", 80) headers = { 'User-Agent' => ..

发布时间：2020-07-02 03:27:05 ruby-on-rails ruby proxy open-uri net-http 其他开发

"open_http":对于字符串"Steve_Jobs"，禁止使用403(OpenURI :: HTTPError).但不适用于任何其他字符串

我正在浏览 http://ruby.bastardsbook.com/提供的Ruby教程，并且遇到了以下代码: require "open-uri" remote_base_url = "http://en.wikipedia.org/wiki" r1 = "Steve_Wozniak" r2 = "Steve_Jobs" f1 = "my_copy_of-" + r1 + ".html" ..

发布时间：2020-07-02 03:26:02 ruby open-uri http-error 其他开发

在使用open-uri和nokogiri完全加载HTML之前，已读取HTML

我将open-uri和nokogiri与ruby一起使用来进行一些简单的Web爬网. 有一个问题，有时html在完全加载之前会被读取.在这种情况下，除了加载图标和导航栏之外，我无法获取任何其他内容. 告诉open-uri或nokogiri等待页面完全加载的最佳方法是什么? 当前我的脚本如下: require 'nokogiri' require 'open-uri' url = "h ..

发布时间：2020-07-02 03:25:58 ruby nokogiri open-uri 其他开发

有没有一种解决方法可以在Ruby中打开包含下划线的URL?

我正在使用open-uri打开URL. resp = open("http://sub_domain.domain.com") 如果其中包含下划线，则会出现错误: URI::InvalidURIError: the scheme http does not accept registry part: sub_domain.domain.com (or bad hostname?) ..

发布时间：2020-07-02 03:25:55 ruby open-uri 其他开发

open-uri相关内容