首页
Python
通过结合使用scrapy在python中从图像中获取文本的基本网址?

通过结合使用scrapy在python中从图像中获取文本的基本网址? [英] by combining base url getting text out of image in python using scrapy?

查看：61 发布时间：2021/7/17 18:37:42 python scrapy

本文介绍了通过结合使用scrapy在python中从图像中获取文本的基本网址?的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我试过这个代码:

src1 = "https://hms.harvard.edu/"<br/>
src = response.css('div.person-line > div > 
      img::attr("src")').extract_first()<br/>
src = sites/default/files/hms-faculty-emails/BX0UVXkP.jpg <br/>
import urlparse <br/>
urlparse.urljoin(src1, src)<br/>
https://hms.harvard.edu/sites/default/files/hms-faculty-emails/BX0UVXkP.jpg<br/>
src2 = urlparse.urljoin(src1,src)<br/>
email = pytesseract.image_to_string(Image.open(src2))<br/>

我收到此错误

ioerror errno 22 invalid mode ('rb') or filename

如何从文本图像中获取电子邮件文本..有人可以帮忙吗?

how to get email text out of text image..can any one help please?

推荐答案

你应该使用 io.BufferIO 缓冲区，因为你用 http<调用函数 image_to_string/代码> 路径.你需要写这样的代码:


You should use io.BufferIO buffer, because you call function image_to_string with http path. You need write code like this:
def get_text(src):
    response = urlopen(src)
    buffer = io.BytesIO(response.read())
    return pytesseract.image_to_string(Image.open(buffer))


                        这篇关于通过结合使用scrapy在python中从图像中获取文本的基本网址?的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            在scrapy中将基本网址与结果href结合起来;
                        
                    
                    
                        
                            如何通过Python从Chrome获取网址?;
                        
                    
                    
                        
                            获取基本网址;
                        
                    
                    
                        
                            Scrapy/Python 从收益请求中获取项目;
                        
                    
                    
                        
                            使用Scrapy从Python中的Microsoft Word文件中提取文本;
                        
                    
                    
                        
                            如何在javascript中获取基本网址;
                        
                    
                    
                        
                            如何获取角度5中的基本网址?;
                        
                    
                    
                        
                            如何结合scrapy和htmlunit用javascript抓取网址;
                        
                    
                    
                        
                            python scrapy没有抓取抓取列表中的所有网址;
                        
                    
                    
                        
                            Laravel:获取基本网址;
                        
                    
                    
                        
                            使用Google App Engine在python中获取网址;
                        
                    
                    
                        
                            我可以获取“基本网址”吗？在WordPress中的模板文件中？;
                        
                    
                    
                        
                            无法在python中获取当前网址;
                        
                    
                    
                        
                            在ios上从图像中获取文本(图像处理);
                        
                    
                    
                        
                            如何使用python中的scrapy从图像元素中提取imdb中电影的评分;
                        
                    
                    
                        
                            如何使用 Scrapy 从网站获取所有纯文本?;
                        
                    
                    
                        
                            如何从 XPath(Python/scrapy) 中的类属性获取标题;
                        
                    
                    
                        
                            在Python中从XML获取文本值;
                        
                    
                    
                        
                            使用scrapy从多个网站中查找特定文本;
                        
                    
                    
                        
                            使用Google App Engine在python中获取很多网址;
                        
                    
                    
                        
                            在CodeIgniter中设置动态基本网址;
                        
                    
                    
                        
                            使用python和PIL如何获取图像中的文本块?;
                        
                    
                    
                        
                            在Python中获取Chrome标签页网址;
                        
                    
                    
                        
                            我如何使用Scrapy从网站获取所有纯文本？;
                        
                    
                    
                        
                            在Google Analytics中结合相似的网址;


    
        
            Python最新文章
            
                    
                        
                            类型错误：只有长度为1的阵列可以尝试拟合指数的数据转换到Python标量;
                        
                    
                    
                        
                            bs4.FeatureNotFound：找不到一棵树建设者您所要求的功能：LXML。你需要安装一个解析器库？;
                        
                    
                    
                        
                            系列的真值是不明确的。使用a.empty，a.bool（），a.item（），a.any（）或a.all（）;
                        
                    
                    
                        
                            （unicode错误）'unicodeescape'编解码器无法解码位置2-3中的字节：truncated \UXXXXXXXX escape;
                        
                    
                    
                        
                            将pandas dataframe中的列从int转换为string;
                        
                    
                    
                        
                            Python：由实例对象调用方法：“missing 1 required positional argument：'self'”;
                        
                    
                    
                        
                            Sparksql过滤与多个条件（与where子句中选择）;
                        
                    
                    
                        
                            JSONDe codeError：期待值：1行1列（CHAR 0）;
                        
                    
                    
                        
                            Cmake不能找到Python库;
                        
                    
                    
                        
                            Python  - 将Dataframe中的所有项目转换为字符串;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.