dataset相关内容

大型 DAG 上的拓扑排序示例

我正在寻找在大图大小上执行拓扑排序的现实世界应用程序. 我认为您可以找到此类实例的一些领域是生物信息学、依赖性解析、数据库、硬件设计、数据仓库......但我希望你们中的一些人可能已经遇到或听说过任何特定的算法/项目/应用程序/需要 topsort 的数据集. 即使数据/项目可能无法公开访问,任何提示(以及对潜在图形大小数量级的估计)也可能会有所帮助. 解决方案 以下是我目前看 ..

.NET - 如何从数据集中检索特定项目?

我有以下代码连接到数据库并将数据存储到数据集中. 我现在需要做的是从数据集中获取一个值(实际上它是第一行第 4 列和第 5 列的两个值) OdbcConnection conn = new OdbcConnection();conn.ConnectionString = ConfigurationManager.ConnectionStrings["ConnectionString2"]. ..
发布时间:2022-01-21 13:07:48 C#/.NET

Matlab 表/数据集类型优化

我正在 Matlab 中为“观察变量"表搜索一些优化的数据类型,可以通过列(通过变量)和行(通过观察)快速轻松地访问这些数据类型. 这是现有 Matlab 数据类型的比较: Matrix 非常快,但是,它没有内置的维度索引标签/枚举,而且您不能总是按列索引记住变量名称. 表格的性能很差,尤其是在 for 循环中读取单个行/列时(我想它运行一些缓慢的转换方法,并且设计得更像 Excel ..
发布时间:2022-01-21 13:07:17 其他开发

循环遍历数据表

嗯.我有一个包含多列和多行的 DataTable. 我想动态循环遍历 DataTable,基本上输出应该如下所示,不包括大括号: 名称(数据列)汤姆(数据行)彼得(数据行)姓氏(数据列)史密斯(数据行)棕色(数据行)foreach(rightsTable.Columns 中的 DataColumn col){foreach(rightsTable.Rows 中的 DataRow 行){// ..
发布时间:2022-01-21 13:07:05 C#/.NET

为数据集插入关闭 IDENTITY_INSERT

我正在使用数据集插入从旧数据库转换的数据.要求是保持当前的 Order_ID 编号. 我尝试过使用: SET IDENTITY_INSERT 订单开启; 当我在 SqlServer Management Studio 中时,这有效,我能够成功 INSERT INTO orders (order_Id, ...) VALUES (1, ...); 但是,它不允许我通过我在转换脚本中使用 ..
发布时间:2022-01-21 13:06:59 数据库

Spark 默认空列数据集

我无法让 Spark 将 json(或 csv )作为具有 Option[_] 字段的案例类的 Dataset 读取并非所有字段都在源代码中定义. 这有点神秘,但假设我有一个名为 CustomData 的案例类 给定以下 json 文件 (customA.json): {"id":123, "colA": "x", "colB": "z"}{“id":456,“colA":“y"}{ ..
发布时间:2022-01-21 13:06:52 其他开发

C# DataTable 内连接与动态列

我正在尝试以与此问题类似的方式将两个数据表连接在一起: C#中DataTables的内连接 我试图让输出成为一个“组合"表,其中包含两个原始表中的列.它们都有一个共同的日期戳列. 给出的答案对于具有固定列的 DataTables 来说很好,但是如果它们是动态创建的,并且可以有任意数量的列,我该如何加入它们呢? 例如 T1 (dateamp, t1Column1, t1Co ..
发布时间:2022-01-21 13:06:45 C#/.NET

具有大型数据集的 DC 和交叉过滤器

我一直在研究 dc 和 crossfilter js,我目前有一个包含 550,000 行和 60mb 大小的 csv 的大型数据集,并且面临很多问题,例如浏览器崩溃等 所以,我试图了解 dc 和 crossfilter 如何处理大型数据集.http://dc-js.github.io/dc.js/ 他们主站点上的示例运行非常顺利,在查看时间线->内存(在控制台中)后,它达到最大 34 ..
发布时间:2022-01-21 13:06:20 前端开发

Pandas 数据框中的 MultiIndex Group By

我有一个数据集,其中包含按年份划分的国家和经济指标统计数据,组织方式如下: 国家指标 2011 2012 2013 2014美国 GDP 7 4 0 2美国流行音乐.2 3 0 3国标 GDP 8 7 0 7GB流行音乐.2 6 0 0法国 GDP 5 0 0 1法国流行音乐.1 1 0 5 如何在 pandas 中使用 MultiIndex 来创建仅按年份显示每个国家/地区的 GDP 的数据 ..
发布时间:2022-01-21 13:06:10 Python

如何在 Spark 中显示 KeyValueGroupedDataset?

我正在尝试学习 Spark 中的数据集.我想不通的一件事是如何显示 KeyValueGroupedDataset,因为 show 对它不起作用.另外,KeyValuGroupedDataSet 的 map 等价物是什么?如果有人举一些例子,我将不胜感激. 解决方案 好的,我从给出的示例中得到了这个想法 这里 和 这里.我在下面给出一个我写的简单例子. val x = Seq(("a", ..
发布时间:2022-01-21 13:06:00 其他开发

类型化数据集的缺点是什么

我来自一个喜欢自己构建而不是依赖他人构建的库和框架的世界.逃离这个世界后,我发现在 Visual Studio 中使用 Typed DataSets 等工具的乐趣和轻松.那么除了失去灵活性之外,你还失去了什么?是否有性能因素(忽略 procs 与动态 sql 的争论)?限制? 解决方案 到目前为止,类型化数据集是经典 ADO 断开连接记录集的升级版.我发现它们仍然很适合在需要执行一些面向行 ..
发布时间:2022-01-21 13:05:54 C#/.NET

如何从 RDD 创建 Spark 数据集

我有一个 RDD[LabeledPoint] 打算在机器学习管道中使用.我们如何将 RDD 转换为 DataSet?请注意较新的 spark.ml api 需要 Dataset 格式的输入. 解决方案 这是一个遍历额外步骤的答案 - DataFrame.我们使用 SQLContext 创建一个 DataFrame,然后使用所需的对象类型创建一个 DataSet - 在本例中为 Labele ..
发布时间:2022-01-21 13:05:46 其他开发

在 ASP.NET 中拉多个记录集时的 DataReader 或 DataSet

我有一个 ASP.NET 页面,其中包含一堆需要填充的控件(例如下拉列表). 我想单次访问数据库并带回多个记录集,而不是为每个控件进行往返. 我可以带回一个 DataSet 中的多个表,或者我可以带回一个 DataReader 并使用“.NextResult"将每个结果集放入一个自定义业务类中. 我是否会看到使用 DataReader 方法获得足够大的性能优势,还是应该只使用 D ..
发布时间:2022-01-21 13:05:33 C#/.NET

如何确定 VB.Net DataRow 中是否存在列

我正在将一个 XML 文件读入 DataSet,并且需要从 DataSet 中取出数据.由于它是用户可编辑的配置文件,因此字段可能存在也可能不存在.为了很好地处理丢失的字段,我想确保 DataRow 中的每一列都存在并且不是 DBNull. 我已经检查了 DBNull,但我不知道如何确保该列存在而不引发异常或使用循环遍历所有列名的函数.最好的方法是什么? 解决方案 DataRow 的 ..
发布时间:2022-01-21 13:05:23 C#/.NET

有用的库存 SQL 数据集?

有没有人知道有什么资源可以提供好的、有用的股票数据集?例如,我下载了一个包含美国所有州、城市和邮政编码的 SQL 脚本.这为我在最近的一个应用程序中节省了很多时间,我希望能够按地理位置进行查找.你们中有人知道其他可以免费下载的有用数据集吗? 例如: 列入黑名单的 IP 地址 学院/大学名称 公司名称/股票代码 有人有什么建议吗? 编辑: 作为一个例子,我在这里找到 ..
发布时间:2022-01-21 13:05:17 其他开发

用于情绪分析的好数据集?

我正在进行情绪分析,我正在使用此链接中给出的数据集:http://www.cs.jhu.edu/~mdredze/datasets/sentiment/index2.html 我已将我的数据集划分为 50:50 的比例.50%作为测试样本,50%作为训练样本,从训练样本中提取特征并使用Weka分类器进行分类,但我的预测准确率在70-75%左右. 任何人都可以建议一些其他数据集来帮助我提高结果 ..
发布时间:2022-01-21 13:05:02 其他开发

是否有 Python 的示例数据集?

为了快速测试、调试、创建可移植示例和基准测试,R 提供了大量数据集(在 Base R datasets 包中).R 提示符下的命令 library(help="datasets") 描述了近 100 个历史数据集,每个数据集都有相关的描述和元数据. Python 有这样的东西吗? 解决方案 可以使用rpy2 包从 Python 访问所有 R 数据集. 设置界面: >>>从 r ..
发布时间:2022-01-21 13:04:55 Python

在 List 中选择方法收藏

我有一个 asp.net 应用程序,现在我正在使用数据集进行数据操作.我最近开始将此数据集转换为 List 集合.但是,在某些地方它不起作用.一是在我的旧版本中,我使用的是 datarow[] drow = dataset.datatable.select(searchcriteria).但在 List 集合中,没有可用于查找特定值的方法.我有什么办法可以根据我的搜索条件选择一些值吗?我想知道这是 ..
发布时间:2022-01-21 13:04:46 C#/.NET

无法使用 pandas 在 python3 中加载 csv 文件

大家好,我不知道为什么,但是 pandas 确实无法在我的 python 代码中加载我的 csv 文件.该文件位于我的 python 项目的同一文件夹中,我正在使用 tensorflow、theano、pandas、numpy 和 matplotlib 库.已经 2 小时了,我尝试使用 pip3 命令卸载所有内容并再次重新安装.我卸载了 tensorflow、pandas、theano、numpy ..
发布时间:2022-01-21 13:04:20 Python