data-science相关内容

如何绘制多个熊猫列

我有数据框 total_year,其中包含三列(year、action、comedy).> total_year 我想在 x 轴上绘制 year 列,以及 action &喜剧 y 轴. 如何在y轴上绘制两列( action 和 comedy )? 我的代码仅在 y 轴上绘制一列. total_year[-15:].plot(x='year', y='action', fig ..
发布时间:2021-06-01 18:32:32 Python

将代码转换为python中的列表理解

密码是一种语言的密码.在本案例研究中,我们将探索当代希腊历史学家报道的一种密码,该密码在战争时期被尤利乌斯·凯撒(Julius Caesar)用来向将军发送秘密信息. Caesar密码将邮件的每个字母移到与原始字母有固定距离的字母表中的另一个字母.如果我们的加密密钥为1,我们将h移至下一个字母i,i移至下一个字母j,依此类推.如果到达字母表的结尾(对我们来说是空格字符),我们只需循环回到a. ..
发布时间:2021-04-29 18:45:51 Python

Python:将开始日期和结束日期分为开始日期和结束日期之间的所有天数

我有名为“计划休假"的数据,其中包括“开始日期",“结束日期",“用户ID"和“休假类型". 我希望能够创建一个新的数据框,该数据框按照“用户ID"显示从开始日期到结束日期之间的所有日期. 到目前为止,我只能创建一个date_list,它提供开始日期和结束日期之间的日期范围,但是我找不到一种为每个“用户ID"和“离开类型"包括此日期的方法./p> 这是我当前的功能: def da ..
发布时间:2021-04-29 18:45:48 Python

编写最小-最大缩放器功能

我想在python中编写一个用于计算最小-最大比例的函数,以返回列表. x = [1、2、3、4]def normalize(x):对于范围内的我(len(x)):返回[(x [i]-min(x))/(max(x)-min(x))] 然后调用该函数: normalize(x): 结果: [0.0] 我期望结果是: [0.00,0.33,0.66,1.00] 解决方案 ..
发布时间:2021-04-29 18:45:42 Python

ValueError:视图限制最小值0.0小于1,并且是无效的Matplotlib日期值

我已经得到了使用matplotlib的python脚本,在运行脚本时它将打开窗口并显示图形.它可以在我的笔记本电脑上正常工作.但是,当我在AWS Elasticbeanstalk上上传文件时会发生此错误.我通过使用 在笔记本电脑中成功重现了此错误 import matplotlibmatplotlib.use('agg') 引发的错误 文件"/Library/Frameworks/Py ..
发布时间:2021-04-29 18:45:39 Python

如何将互连的ID对列表转换为ID集群?

我有一张桌子,桌子上有成对的ID(有时是三对),它们是链中的一种链接 + ------ + ----- +|来自|到|+ ------ + ----- +|id1 |id2 ||id2 |id3 ||id4 |id5 |+ ------ + ----- + 我想创建一个新表,其中所有链接都聚集到链/族中: + ----- ++ ---------- +|id |家庭成员|+ ----- ..
发布时间:2021-04-29 18:45:36 数据库

熊猫群使用时间频率

我的问题是关于大熊猫数据框的分组依据.样本数据集如下所示: cust_id |日期|类别A0001 |2016年2月20日|猫1A0001 |2016年2月24日|猫2A0001 |2016年2月3日|猫3A0002 |2015年3月4日|猫2 现在,我要对cust_id进行分组,然后查找彼此之间30天内发生的事件,并为这些事件编制类别列表.到目前为止,我已经想到的是按以下方式使用pd.g ..
发布时间:2021-04-29 18:45:33 Python

如何使用Tweepy从用户的时间轴实时获取推文

我正在尝试从用户的时间轴中实时提取推文.然后,我想对这些推文进行一些分析.阅读文档后,看来此用例需要使用tweepy.Stream.我已完成以下操作: stream.filter(follow ='25073877') 但是Twitter的过滤器API声明以下内容: 用户创建的推文. 由用户转发的推文. 回复用户创建的任何推文. 由用户创建的任何Tweet的转发. 手动回 ..
发布时间:2021-04-29 18:45:30 Python

从数据集中排除噪声数据以训练模型是一个好主意吗?

从数据集中排除噪声数据(可能会降低模型准确性或导致测试数据集出现意外输出)是一个好主意,以生成训练和验证数据集吗? 假设:嘈杂的数据是我们已知的 任何建议深表感谢! 解决方案 这取决于您的应用程序.如果嘈杂的数据 有效 ,则可以将其包括在内以找到最佳模型. 但是,如果嘈杂的数据为 无效 ,则应在拟合模型之前将其清除. 噪声是一个广义术语,您最好将它们视为离群值或离群 ..
发布时间:2021-04-29 18:45:24 AI人工智能

ML模型无法估算值

我试图创建一个ML模型来做出一些预测,但是我一直遇到绊脚石.即,代码似乎忽略了我给它的插补指令,从而导致以下错误: ValueError:输入包含NaN,无穷大或对于dtype('float64')而言太大的值. 这是我的代码: 将pandas导入为pd将numpy导入为np从sklearn.ensemble导入AdaBoostRegressor从category_encoders导 ..
发布时间:2021-04-29 18:45:21 Python

使用Python中的matplotlib进行多个绘图

我要使用Python并边做边学.我想用Python中的matplotlib绘制两个图.第二个情节保留了第一个情节的极限.想知道如何改变上一个下一个图的极限.请帮忙.推荐的方法是什么? X1 = [80,100,120,140,160,180,200,220,240,260]Y1 = [70,65,90,95,110,115,120,140,155,150]从matplotlib导入pyplot ..
发布时间:2021-04-29 18:45:18 AI人工智能

与Seaborn进行绘图时,如何根据年份传播绘图的日期轴?

我正尝试通过使用Google股价来训练Python线性回归模型: https://www.kaggle.com/medharawat/google-stock-price 并尝试通过给定功能预测未来库存.之后,我打算将其与当前数据集中的值一起绘制. 首先,我使用日期解析器读取具有日期值的数据框,并将这两个数据框汇总为一个,以便自己拆分: parser = lambda日期:pd.date ..

使用make和Makefile从包含空格的文件路径中处理原始源数据

我有一个使用python脚本和Makefile的存储库.我想要一个设置程序使他们能够轻松设置环境并从我们的服务器复制必要的数据文件. 在Makefile中包含源数据文件的问题是公司服务器使用驱动器名称中的空格,这个空格不太喜欢,因此我可以将这些文件作为依赖项列出用于目标输出文件. 我当前的Makefile基本上仅执行以下操作: .PHONY:全部全部:output.csv.PHON ..
发布时间:2021-04-29 18:45:06 Python

Python连接文本中的组合关键字

因此,我的关键字列表是小写的.假设 关键字= ['机器学习','数据科学','人工智能'] 和小写文本列表.比方说 texts = [谷歌建立的新机器学习模型对于人工智能的当前状态而言是革命性的.可能会改变我们的思维方式",尽管数据科学和人工智能是相互联系的,但它们是两个不同的领域.哈佛大学的科学家正在详细的介绍中对此进行了解释,可以在我们的页面上找到."] 我需要将文本转换为: ..
发布时间:2021-04-29 18:45:03 Python