data-science相关内容

在KERAS中安装模型时,批量大小和纪元数应该有多大?

我正在对970个样本进行培训,并对243个样本进行验证。 在KERAS中拟合模型以优化val_acc时,批大小和纪元数应该有多大?是否有任何基于数据输入大小的经验法则可供使用? 推荐答案 因为您的数据集非常小(大约1,000个样本),所以使用批大小为32可能是安全的,这是非常标准的。它不会对你的问题产生巨大的影响,除非你在进行数十万或数百万次的观察训练。 回答您有关批次大小和纪 ..
发布时间:2022-03-02 09:51:39 AI人工智能

matplotlib-打印多条线时奇怪的y轴

为什么这段代码会产生如此奇怪的输出? 我希望绘图重叠,以便可以看到重叠的数据点。 看起来这些地块堆叠在一起。 def read_csv(name): file = open(folder+name,newline='') reader = csv.reader(file,delimiter=";") data = [] for row in rea ..
发布时间:2022-03-02 09:48:45 Python

MySQL中的大表每次都基于CSV更新行

我有一个包含50万行的表,我假设我每小时都会收到CSV文件,我需要根据CSV更新我的MySQL表。它可能包含新行,或者某些行可能会被修改。该表有一个主键(名为SKU) Product表列: SKU 产品详情 价格 我希望尽快完成此操作,其中一个条件是我不能删除表并再次加载,因为我的主要要求是";支持将给定文件常规非阻塞并行接收到表";中。 我可以使用Py ..
发布时间:2022-03-02 09:46:26 数据库

单击matplotlib散点图可以显示另一个基于点的元数据的图形。

我已经让this在我的计算机上运行,它给了我一个想法:我可以根据点的元数据显示新的图形,而不是打印字符串吗? 为了了解我的数据,我有一个包含实验名称和结果的SQL表,然后还有一个包含整个实验过程的表。使用matplotlib绘制图形也很容易。我想创建一些交互式的东西,我可以在其中绘制实验的最终结果(某种散点图),允许用户更深入地深入研究,并查看单击点的整个实验的图形。 我似乎应该能够修 ..
发布时间:2022-03-02 09:37:01 Python

比较Pandas Dataframe的列名

如何比较2个不同 pandas 数据框的列名。我想比较测试数据帧中缺少某些列的列车数据帧和测试数据帧?? 推荐答案 pandas.Index对象(包括数据框列)具有有用的set类方法,如intersection和difference。 例如,给定数据帧train和test: train_cols = train.columns test_cols = test.column ..
发布时间:2022-03-02 09:30:13 AI人工智能

每小时的行数

我正在浏览自行车共享数据。 我组合了两个表:一个包含自行车共享数据,另一个包含天气数据。“开始日期”列在自行车共享数据中。“日期”列位于天气数据中。 我想对每小时的ID计数进行分组,以便可以查看天气对自行车使用的影响。 ID 开始 结束 开始日期 持续时间 日期 雨 临时 wdsp 1754125 爱广场南 Glenina 2019年1月1日00:17 00:15:02 201 ..
发布时间:2022-02-26 21:11:19 Python

如何将活生生的可乐笔记本嵌入网站?

我想构建一个网站并将其部署到GitHub页面或Heroku。我的问题是:是否可以在我将要托管的网站中嵌入一个实时(我可以在那里运行代码)Google Colab笔记本? 我想让这个嵌入式CoLab笔记本执行电光代码!! 谢谢! 推荐答案 即使回答有点晚,我也遇到了同样的问题,并且得出的结论是目前仍不可能做到这一点。 但是,不久前有一个功能请求打开here。我认为你最多只能 ..
发布时间:2022-02-21 11:27:20 其他开发

密谋失踪的逆戟鲸

使用 plotly 导出静态图表时遇到小问题. Plotly 无法正确识别我已安装 orca,并且仍然存在与缺少 orca 相关的错误.我尝试更改 orca 目录,但它仍然无法正常工作.有谁知道怎么回事? 我的代码: 导入 plotly.graph_objects进口逆戟鲸导入情节#%%fig = go.Figure(data=go.Candlestick(x=pricedata.i ..
发布时间:2022-01-21 15:46:20 Python

使用 python {census} 计算每个州的县数

我很难用著名的 cenus.csv 数据. 任务:统计每个州的县数. 面对比较(我认为)/请阅读以下内容? 我试过了: df = pd.read_csv('census.csv')dfd = df[:]['STNAME'].unique()//给出状态名称serr = pd.Series(dfd)//转换为系列(从数组) 在此之后,我尝试了两种方法: 1: df[d ..
发布时间:2022-01-21 13:13:16 Python

没有频率的差异 pandas.DateTimeIndex

一个不规则的时间序列data存储在一个pandas.DataFrame中.DatetimeIndex 已设置.我需要索引中连续条目之间的时间差. 我以为会很简单 data.index.diff() 但是得到了 AttributeError: 'DatetimeIndex' 对象没有属性 'diff' 我试过了 data.index - data.index.shift(1) 但是 ..
发布时间:2022-01-11 09:55:31 Python

'Conda' 未被识别为内部或外部命令

我在我的 Windows 7 Professional 机器上安装了 Anaconda3 4.4.0(32 位),并在 Jupyter 笔记本上导入了 NumPy 和 Pandas,所以我假设 Python 安装正确.但是当我在命令提示符下键入 conda list 和 conda --version 时,它说 conda is not Recognized as internal or exte ..
发布时间:2022-01-10 20:43:20 Python