data-science 第3页 - IT屋-程序员软件开发技术分享社区

在KERAS中安装模型时，批量大小和纪元数应该有多大？

我正在对970个样本进行培训，并对243个样本进行验证。在KERAS中拟合模型以优化val_acc时，批大小和纪元数应该有多大？是否有任何基于数据输入大小的经验法则可供使用？推荐答案因为您的数据集非常小(大约1,000个样本)，所以使用批大小为32可能是安全的，这是非常标准的。它不会对你的问题产生巨大的影响，除非你在进行数十万或数百万次的观察训练。回答您有关批次大小和纪 ..

发布时间：2022-03-02 09:51:39 python machine-learning keras data-science AI人工智能

matplotlib-打印多条线时奇怪的y轴

为什么这段代码会产生如此奇怪的输出？我希望绘图重叠，以便可以看到重叠的数据点。看起来这些地块堆叠在一起。 def read_csv(name): file = open(folder+name,newline='') reader = csv.reader(file,delimiter=";") data = [] for row in rea ..

发布时间：2022-03-02 09:48:45 python matplotlib plot data-science Python

MySQL中的大表每次都基于CSV更新行

我有一个包含50万行的表，我假设我每小时都会收到CSV文件，我需要根据CSV更新我的MySQL表。它可能包含新行，或者某些行可能会被修改。该表有一个主键(名为SKU) Product表列： SKU 产品详情价格我希望尽快完成此操作，其中一个条件是我不能删除表并再次加载，因为我的主要要求是"；支持将给定文件常规非阻塞并行接收到表"；中。我可以使用Py ..

发布时间：2022-03-02 09:46:26 python mysql csv data-science 数据库

TypeError：init()获取意外的关键字参数'；iid'；

我使用GridSearchCV和RandomizedSearchCV为我的TCSVM模型找到了最佳参数和最佳分数。现在我想使用BayesSearchCV来与以前的方法进行比较，但是我收到了这个错误__init__() got an unexpected keyword argument 'iid' 这是我使用的代码： model2 = make_pipeline(Standa ..

发布时间：2022-03-02 09:43:49 python data-science svm bayessearchcv Python

如何从Pandas DataFrame中的路径获取基本文件名

我有一个包含文件路径列的DataFrame。我只想将其更改为文件名。我的DataFrame如下所示： df = pd.DataFrame({ 'Sr No': [18, 19, 20], 'Email': ['Test@test.com', 'Test@test.com', 'Test@test.com'], 'filename': [r'C:/Use ..

发布时间：2022-03-02 09:41:41 python pandas dataframe data-science Python

如何将嵌套的字典转换为数据帧

假设我有一个API响应，如下所示： { "fact": { "UP": [{ "SCODE": "CNB", "SNAME": "Kanpur Central" }, { "SCODE": "JHS", "SNAME": "Jhansi Junction" ..

发布时间：2022-03-02 09:39:11 python json pandas dictionary data-science Python

单击matplotlib散点图可以显示另一个基于点的元数据的图形。

我已经让this在我的计算机上运行，它给了我一个想法：我可以根据点的元数据显示新的图形，而不是打印字符串吗？为了了解我的数据，我有一个包含实验名称和结果的SQL表，然后还有一个包含整个实验过程的表。使用matplotlib绘制图形也很容易。我想创建一些交互式的东西，我可以在其中绘制实验的最终结果(某种散点图)，允许用户更深入地深入研究，并查看单击点的整个实验的图形。我似乎应该能够修 ..

发布时间：2022-03-02 09:37:01 python matplotlib plot graph data-science Python

在 pandas 身上，如何在一行中收集重复的数据行呢？

我有一个数据集，其中包含NBA球员每场比赛的平均统计数据。有些球员的统计数据是重复的，因为他们本赛季在不同的球队。例如： Player Pos Age Tm G GS MP FG 8 Jarrett Allen C 22 TOT 28 10 26.2 4.4 9 Jarrett Allen C ..

发布时间：2022-03-02 09:33:35 python pandas dataframe data-science Python

比较Pandas Dataframe的列名

如何比较2个不同 pandas 数据框的列名。我想比较测试数据帧中缺少某些列的列车数据帧和测试数据帧？？推荐答案 pandas.Index对象(包括数据框列)具有有用的set类方法，如intersection和difference。例如，给定数据帧train和test： train_cols = train.columns test_cols = test.column ..

发布时间：2022-03-02 09:30:13 python pandas numpy machine-learning data-science AI人工智能

如何在海运重新绘制中自定义标题和y标签

我当前有一个海运重新绘图 harker = sns.relplot(data = majorsLong, x = "SiO2", y = "Wt %", palette = colors, markers = marks, style = "Lithology", hue = "Lithology", kin ..

发布时间：2022-02-27 17:13:48 python matplotlib graph seaborn data-science Python

每小时的行数

我正在浏览自行车共享数据。我组合了两个表：一个包含自行车共享数据，另一个包含天气数据。“开始日期”列在自行车共享数据中。“日期”列位于天气数据中。我想对每小时的ID计数进行分组，以便可以查看天气对自行车使用的影响。 ID 开始结束开始日期持续时间日期雨临时 wdsp 1754125 爱广场南 Glenina 2019年1月1日00：17 00：15：02 201 ..

发布时间：2022-02-26 21:11:19 pandas dataframe pandas-groupby data-science etl Python

如何对具有重复列名行进行切片，并按顺序堆叠这些行

我有一个如图所示的数据帧，我希望在不更改顺序的情况下将其转换为多行。 RESP HR SPO2 PULSE 1 46 122 0 0 2 46 122 0 0 3 4 推荐答案一种可能解决方案是使用reshape，仅需要的列长模数为0(因此可以将所有数据转换为4列DataFrame)： df1 = pd.Dataframe(df.va ..

发布时间：2022-02-26 20:55:47 python pandas pandas-groupby data-science google-colaboratory Python

如何将活生生的可乐笔记本嵌入网站？

我想构建一个网站并将其部署到GitHub页面或Heroku。我的问题是：是否可以在我将要托管的网站中嵌入一个实时(我可以在那里运行代码)Google Colab笔记本？我想让这个嵌入式CoLab笔记本执行电光代码！！谢谢！推荐答案即使回答有点晚，我也遇到了同样的问题，并且得出的结论是目前仍不可能做到这一点。但是，不久前有一个功能请求打开here。我认为你最多只能 ..

发布时间：2022-02-21 11:27:20 apache-spark web deployment data-science embed 其他开发

密谋失踪的逆戟鲸

使用 plotly 导出静态图表时遇到小问题. Plotly 无法正确识别我已安装 orca，并且仍然存在与缺少 orca 相关的错误.我尝试更改 orca 目录，但它仍然无法正常工作.有谁知道怎么回事? 我的代码: 导入 plotly.graph_objects进口逆戟鲸导入情节#%%fig = go.Figure(data=go.Candlestick(x=pricedata.i ..

发布时间：2022-01-21 15:46:20 python plotly data-science orca Python

Plotly/如何更改 Plotly 中的默认调色板?

..

发布时间：2022-01-21 15:20:52 python plotly data-science plotly-python Python

使用 python {census} 计算每个州的县数

我很难用著名的 cenus.csv 数据. 任务:统计每个州的县数. 面对比较(我认为)/请阅读以下内容? 我试过了: df = pd.read_csv('census.csv')dfd = df[:]['STNAME'].unique()//给出状态名称serr = pd.Series(dfd)//转换为系列(从数组) 在此之后，我尝试了两种方法: 1: df[d ..

发布时间：2022-01-21 13:13:16 python pandas dataset data-science Python

pandas 如何在时间序列数据上“get_dummies"

如果我有一些时间序列数据:(弥补) 将 numpy 导入为 np将熊猫导入为 pdnp.random.seed(11)行，列 = 50000,2数据 = np.random.rand(行，列)tidx = pd.date_range('2019-01-01', period=rows, freq='H')df = pd.DataFrame(data, columns=['Temperature' ..

发布时间：2022-01-11 10:00:14 python pandas time-series data-science Python

没有频率的差异 pandas.DateTimeIndex

一个不规则的时间序列data存储在一个pandas.DataFrame中.DatetimeIndex 已设置.我需要索引中连续条目之间的时间差. 我以为会很简单 data.index.diff() 但是得到了 AttributeError: 'DatetimeIndex' 对象没有属性 'diff' 我试过了 data.index - data.index.shift(1) 但是 ..

发布时间：2022-01-11 09:55:31 python pandas time-series data-science Python

'Conda' 未被识别为内部或外部命令

我在我的 Windows 7 Professional 机器上安装了 Anaconda3 4.4.0(32 位)，并在 Jupyter 笔记本上导入了 NumPy 和 Pandas，所以我假设 Python 安装正确.但是当我在命令提示符下键入 conda list 和 conda --version 时，它说 conda is not Recognized as internal or exte ..

发布时间：2022-01-10 20:43:20 python anaconda conda data-science Python

cv2.approxPolyDP() , cv2.arcLength() 这些是如何工作的

这些功能是如何工作的?我正在使用 Python3.7 和 OpenCv 4.2.0.提前致谢. approx = cv2.approxPolyDP(cnt, 0.01*cv2.arcLength(cnt, True), True) 解决方案如果您正在寻找示例代码段，以下是一个: 导入 cv2导入 imutils# edged 是边缘检测到的图像cnts = cv2.findContour ..

发布时间：2022-01-09 18:52:29 python opencv computer-vision data-science image-manipulation Python

data-science相关内容