data-modeling相关内容

如何将复杂的方程放入R公式中?

我们将树木的直径作为预测变量,将树木高度作为因变量.此类数据存在许多不同的方程,我们尝试对其中一些方程进行建模并比较结果. 但是,我们无法弄清楚如何将一个方程正确地放入相应的R formula 格式. 可以以R中的trees数据集为例. 数据(树)df 首先,一个似乎运行良好的等式示例: form1 系数a、b和c是估计出来的,这是我们感兴趣的. 现在有问题的等式 ..
发布时间:2022-01-07 23:21:34 其他开发

用于简单消息应用程序的 Cassandra 数据模型

我正在尝试学习 Cassandra,并且总是发现最好的方法是从创建一个非常简单和小型的应用程序开始.因此,我正在创建一个基本的消息传递应用程序,它将使用 Cassandra 作为后端.我想执行以下操作: 用户将使用用户名、电子邮件和密码创建一个帐户.这电子邮件和密码可以随时更改. 用户可以添加另一个用户作为他们的联系人.用户将添加一个通过搜索他们的用户名或电子邮件联系.联系人不需要如果我添 ..
发布时间:2021-12-31 18:10:19 其他开发

在 Cassandra 中跨分区聚合

我有一个如下所示的数据模型, 创建表 appstat.nodedata (节点文本,时间戳时间戳,flashmode 文本,物理使用整数,readbw int,readiops int,总容量 int,writebw int,writeiops int,writelatency int,PRIMARY KEY(节点IP,时间戳)) 与聚类顺序 BY (时间戳 DESC) 其中,nodeip - ..
发布时间:2021-12-31 17:22:02 其他开发

为什么许多人将 Cassandra 称为面向列的数据库?

在互联网上阅读了几篇论文和文档,我发现了许多关于 Cassandra 数据模型的矛盾信息.有很多人将其标识为面向列的数据库,其他人将其标识为面向行的数据库,然后将其定义为两者的混合方式. 根据我对 Cassandra 如何存储文件的了解,它使用 *-Index.db 文件在 *-Data.db 文件的正确位置访问它存储布隆过滤器、列索引,然后是所需行的列. 在我看来,这是严格面向行的. ..

如何在 Neo4j 中使用类型层次结构?

有什么方法可以在 Neo4j 中模拟类型层次结构吗?例如,如果我想构建汽车的类层次结构,我可能有一个基本类型“Car",然后有扩展它的子类,如“SportCar"等. 我希望能够创建“SportCar"的实例,但运行查询以获取所有“Car".这可能吗?如果是这样,技术是什么? 我认为我想要做的是创建一个“标签层次结构" - 但我只是认为 neo4j 不支持. 解决方案 Paul ..
发布时间:2021-12-28 17:48:07 其他开发

将实体与 Neo4j 中正确的关系相关联?

我正在尝试使用 Neo4j 为项目、员工和项目角色之间的关系建模.每个项目都有一个称为“项目经理"的角色和一个称为“主管"的角色.我试图在数据模型中实现的是能够说“对于项目 A,主管是员工 X".就我而言,重要的是“项目"、“人员"和“角色"都是实体(而不是属性).这在 Neo4j 中可能吗?简单来说,在 Neo4j 中关联实体是否可行?在 MySQL 中,这将用一个带有唯一 id 列和三个外键列 ..
发布时间:2021-12-28 17:35:30 其他开发

在 Neo4j 中,当粒度级别可以不受限制时,应该使用什么级别的特异性?

在使用图形数据库时,我最难理解的是选择粒度级别.假设我有一个图表,显示一周中某些日子发生的事情:垃圾日、墨西哥玉米卷星期二、BYOB 星期五等. 我可以将每一天设为一个节点(周一、周二、周三...),这样查询特定日期的速度会很快. 我可以创建一个名为 Day 的节点,并添加带有星期几的属性名称.这样,在图表中显示所有天数很容易查询. 我自己想,使节点非常具体是不好的,因为没有粒度限制 ..
发布时间:2021-12-28 17:18:41 其他开发

在 SQL Server 中设计 1:1 和 1:m 关系

在 SQL Server 2008 中,如何设计 1:1 和 1:m 的关系? 解决方案 任何关系都要求“父"表(一侧)有一个主(或唯一)键(PK),唯一标识每一行,并且“子"表(另一侧)有一个或多个外键列,必须填充与父表中主键的某些现有值相同的值.如果你想要一对多(1-M)的关系,那么外键应该是子表中可以重复的普通属性(一列或多列)(可以有很多行具有相同的值) 如果您想要一对一 ( ..

在数据库中存储多项选择值

假设我让用户检查她说的语言并将其存储在数据库中.重要的旁注,我不会在 db 中搜索任何这些值,因为我将有一些单独的搜索引擎进行搜索.现在,存储这些值的显而易见的方法是创建一个表,如 用户语言(用户 ID nvarchar(50),LookupLanguageID int) 但该站点将是高负载,我们正在尽可能地消除任何开销,因此为了避免在 UI 上显示结果时与主成员表连接,我想在主表中为用户存储 ..
发布时间:2021-12-26 21:16:06 其他开发

在 MySQL 中存储多对多关系的最佳方式?

假设我有一个包含“posts"和“tags"表的简单数据库.帖子可以有多个标签,标签可以属于多个帖子. 构建数据库的最佳方式是什么?我想过使用列表/序列化: 标签idx tag_id, str tag_name帖子idx post_id、str 标题、列表 tag_ids 或者有另一个带有关联的表.问题是使用这个我什至不知道如何构建查询以在收到帖子时提取关联的标签名称. 帖子idx p ..
发布时间:2021-12-26 21:15:10 数据库

多个但互斥的外键 - 这是要走的路吗?

我有三个表:用户、公司和网站.用户和公司都有网站,因此每个用户记录在网站表中都有一个外键.此外,每条公司记录都有一个指向网站表的外键. 现在我想将网站表中的外键包含回它们各自的“父"记录中.我怎么做?每个网站记录中是否应该有两个外键,其中一个始终为 NULL?或者还有别的方法吗? 解决方案 如果我们查看这里的模型,我们将看到以下内容: 一个用户只与一个网站相关 一家公司只与一 ..
发布时间:2021-12-26 21:14:14 数据库

MySQL好友表

我有一个 MySQL 数据库,我在其中存储有关每个用户的数据. 我想为每个用户添加一个朋友列表.我应该为数据库中的每个用户创建一个朋友表还是有更好的方法? 解决方案 假设你所有的朋友也在用户表中,你将需要一个朋友表,它定义了一个简单的一对多关系 - 将用户表链接回本身.所以 用户表UserID int 身份不为空[其他属性字段]朋友桌UserIDLink1 intUserIDLin ..
发布时间:2021-12-26 21:11:19 数据库

为什么在为数据库设计关系时应该避免循环?

有人告诉我在数据模型中有循环是糟糕的设计.我之前听说过几次,但没有太注意.例如,您有实体用户、项目、活动.一个项目归一个用户所有,所以我们有一个从用户到项目的一对多关系.一个活动可以分配给一个用户,另一个从用户到活动的一对多关系.当然,一个项目是由一组活动定义的,另一个是从项目到活动的一对多关系.这样就形成了一个循环. 我问这个人为什么设计不好,但他告诉我他也不知道,他也被告知,猴子学习是最 ..

如何在我的数据库中避免 NULL,同时也表示丢失的数据?

在 SQL 和关系理论(CJ Date,2009)第 4 章中提倡避免重复行,同时也避免 我们存储的数据中的 NULL 属性.虽然我可以轻松避免重复行,但我正在努力了解如何在不使用 NULL 的情况下对数据进行建模.以以下为例 - 这有点来自工作. 我们有一个 artist 表,其中包含一个 gender 列.这是 gender 表的外键.然而,对于一些艺术家,我们不知道他们的性别——例如, ..
发布时间:2021-12-26 21:08:51 其他开发

我应该为将两个表映射在一起的表命名什么?

假设我有两张桌子: 表格:颜色列:Id、ColorName、ColorCode表:形状列:Id、ShapeName、VertexList 将颜色映射到形状的表格应该怎么称呼? 表:???列:ColorId、ShapeId 解决方案 里面只有两件难事计算机科学:缓存失效和命名事物 -- Phil Karlton 为表示多对多关系的表起一个好名字会使这种关系更容易阅读和理解.有时 ..

表示“重复发生的事件"的最佳方式是什么?在数据库中?

我正在尝试用 C# 开发一个依赖于调度程序和日历的事件应用程序,其中一个关键要求是在数据库中表示重复发生的事件.在数据库中表示重复事件的最佳方式是什么? 更多详情: 在创建活动时,我还向某些用户发送邀请,应允许受邀者仅在指定的窗口(会议持续时间)内登录会议,或者在受邀者尝试登录时拒绝登录,例如,会议预定开始前 5 分钟. 解决方案 sysjobs、sysjobsschedule ..
发布时间:2021-12-26 21:02:33 C#/.NET

当 1NF 表没有复合候选键时,它是否在 2NF 中?

可以肯定地说,当 1NF 表没有复合候选键(主键由多列组成)时,该表自动处于 2NF 中吗? 当主键中只有一列时,表是否会违反 2NF? 解决方案 A relvar R,在 2NF 中,只要不存在非平凡的 FD,A->B,满足 R,其中 B 是非素数,其中 A是 R 的某个候选键的真子集. 您首先必须考虑所有候选键.如果所有候选键恰好是单个属性键,那么这些键中唯一可能的真子集是 ..

OLAP 数据库是否应该针对读取性能进行非规范化?

我一直认为数据库应该为读取性能进行非规范化,因为它是为 OLAP 数据库设计所做的,而不是为 OLTP 设计进一步夸大 3NF. PerformanceDBA 在各种帖子中,例如,在 针对基于时间的数据的不同方法的性能 捍卫了数据库应该始终通过规范化到 5NF 和 6NF(范式)来精心设计的范式. 我是否正确理解(以及我正确理解了什么)? OLAP 数据库(低于 3NF)的传统非 ..

在应用程序中支持自定义字段的设计模式是什么?

我们开发了一个商业应用程序.我们的客户要求自定义字段支持.例如,他们想在客户表单中添加一个字段. 存储字段值和有关字段的元数据的已知设计模式有哪些? 我现在看到这些选项: 选项 1:将 varchar 类型的 Field1、Field2、Field3、Field4 列添加到我的 Customer 表中. 选项 2:在客户表中添加一个 XML 类型的列,并将自定义字段的值存储 ..
发布时间:2021-12-26 20:55:37 其他开发

为客户建模的最佳方式 <-->地址

每个客户都有一个实际地址和一个可选的邮寄地址.您首选的建模方式是什么? 选项 1. Customer 有 Address 的外键客户(id、phys_address_id、mail_address_id)地址(身份证、街道、城市等) 选项 2.Customer 与 Address 具有一对多关系,其中包含一个字段描述地址类型 客户ID)地址(id、customer_id、addre ..
发布时间:2021-12-26 20:54:20 其他开发