google-scholar相关内容

谷歌学者验证码验证问题

我正在研究一个项目,需要从Google Scholar中提取一些数据.我的PHP程序从我的本地计算机上获取一个字符串,并将其传递给Google Scholar,然后在搜索结果页面上,它获取第一个结果并将其保存到数据库中. 我必须对近9万个字符串/查询执行此操作.问题在于,在输入数百行之后,该程序会停止运行,因为Google Scholar要求进行验证码验证.我该怎么办? 解决方案 由 ..
发布时间:2021-04-21 19:24:38 其他开发

从Google Scholar中提取文本

我正在尝试从Google学术搜索针对特定查询提供的测试代码段中提取文本.文字片段是指标题下方的文字(黑色字母). 目前,我正在尝试使用python从html文件中提取它,但它包含许多额外的测试,例如 /div> ..
发布时间:2020-07-23 03:37:41 Python

Google学术搜索个人资料抓取PHP

我想使用SimpleHtmlDom从Google学者个人资料中删除出版物. 我有用于剪贴项目的脚本,但是问题是,我只能剪贴显示的项目. 当我使用这样的网址 $ html-> load_file(" http://scholar.google.se/citations? user = Sx4G9YgAAAAJ “); 仅显示20个项目.更改网址 时,我可以增加数字 $ h ..
发布时间:2020-07-23 03:37:37 PHP

为什么urlopen可以下载Google搜索页而不下载Google Scholar搜索页?

我正在使用 Python 3.2.3的 urllib.request模块下载Google搜索结果,但是出现一个奇怪的错误,因为urlopen可用于指向Google搜索结果的链接,但是不是Google学术搜索.在此示例中,我正在搜索"JOHN SMITH".这段代码成功打印了HTML: from urllib.request import urlopen, Request from urlli ..
发布时间:2020-07-23 03:37:27 Python

使用网址抓取大量Google学术搜索页面

我正在尝试使用BeautifulSoup从Google学术搜索中的作者那里获取所有出版物的完整作者列表.由于作者的主页只有每篇论文的被删节的作者列表,因此我必须打开论文的链接以获取完整列表.结果,我每隔几次尝试就遇到CAPTCHA. 是否有避免CAPTCHA的方法(例如,在每次请求后暂停3秒钟)?还是将原始的Google学术搜索个人资料页面显示为完整的作者列表? 解决方案 最近我遇到 ..
发布时间:2020-07-23 03:36:24 其他开发

任何人都可以分享使用Mathematica和Google Scholar提取学术研究信息的简单示例

如何使用Mathematica和Google学术搜索来查找一个人在2011年发表的论文数量? 解决方案 由于没有正式的API AFAIK,Google Scholar不太适合该目标.它还不提供结构化(例如XML)格式的结果.因此,我们必须诉诸快速(而且非常脆弱!)的文本模式匹配技巧,例如: searchGoogleScholarAuthor[author_String] := ..
发布时间:2020-07-23 03:36:23 其他开发

使用Python(或R)提取Google Scholar结果

我想使用python抓取Google Scholar搜索结果.我发现有两种不同的脚本可以做到这一点,一种是 gscholar.py ,另一种是scholar.py(可以用作python库?). 现在,我也许应该说我是python的新手,如果错过了显而易见的内容,请对不起! 问题是当我按照README文件中的说明使用gscholar.py时,我得到了 query() takes a ..
发布时间:2020-07-23 03:35:21 Python

如何使用R在Google Scholar上下载搜索结果?

我想使用R提取Google学术搜索的前100个结果(例如).有人知道该怎么做吗? 准确地说,我只需要论文的名称,作者和引用次数即可. Ps这合法吗? 解决方案 请考虑更新的biobucket-post: http://thebiobucket.blogspot.com/2011/11/r-function-google-scholar-webscraper.html ..
发布时间:2020-07-23 03:35:16 其他开发

Google Server在私有浏览模式下的第一个请求给出服务器错误

每当我在Safari和Google Chrome的私有窗口中运行网址https://scholar.google.com/citations?user=N7m4vIQAAAAJ&hl=en时,Google都会给出错误消息. 仅在具有私有浏览模式的第一个请求上发生. 任何人都知道为什么仅在特定环境下会发生这种情况吗? 自3天前开始发生这种情况. -错误消息和捕获内容 Serv ..

带有Matlab的Google学术搜索

我想通过matlab脚本自动从Google学术搜索中获取一些数据.我对诸如Google Scholar的Bibtex条目和正向引文功能之类的数据最感兴趣.但是,似乎没有没有适用于Google学术搜索的API ,有没有一种方法可以使用Matlab从Google学术搜索中自动获取书目数据?为此已经有一些工具或代码了吗? 解决方案 如果您真的想为此使用Matlab(我不太建议),那么您可以查看一 ..
发布时间:2020-05-06 13:36:39 其他开发

如何在没有相同来源政策的情况下将Google搜索结果放入我们的网页

我们的网页中有自己的表格.我们想将google(www.google.com/scholar)结果显示到我们的网页中.我们尝试了 jQuery, Ajax HTML framing (iFrame, frameset) 所有这些都有SAMEORIGIN问题. 我们还尝试使用new tab,发现它具有相同的问题此处.所有这些解决方案似乎只能与 http://www.googl ..