normalization相关内容

优化大型查询和表结构的问题

我不是数据库专家,所以我已经有一段时间了,我会尽可能多地阅读,并且由于社区的回答,我可以对查询和表结构进行一些更改.即使阅读了很多东西,我也被卡住了,所以我来提出第一个问题. 我有一个网站,用户可以在其中发布自己的故事.每个故事都可以具有流派,警告,多个作者,分配多个角色等. 我们正在运行MySQL 5.x,表是InnoDB,用PHP编写的网站.使用GROUP_CONCAT对结果中的每 ..
发布时间:2020-08-14 08:56:40 数据库

由于有40个布尔列,导致速度显着下降吗?

我正在尝试将音乐风格的列添加到事件表中,根据我的收集,可以通过为每种音乐风格添加一个列或通过执行多对多表关系来完成不需要,因为我希望每个事件在表中仅返回一次.您是否认为连续拥有如此多的布尔列,我将面临相当大的数据库速度下降? (数据将仅由用户读取). 谢谢:) 解决方案 这些列本身不会降低数据库的速度,但是请记住,为每种音乐风格添加一个布尔列是很糟糕的设计.随着时间的流逝,您的应用程序中可 ..
发布时间:2020-08-14 06:17:56 数据库

Mysql嵌套选择

接着这个问题 last_question 与此表 `id`, `bbs_id`, `user_id`, `like_dislike` (15, 4, 2, 0), (14, 4, 1, 0), (13, 3, 1, 0), (12, 2, 1, 1), (1 ..
发布时间:2020-08-14 03:52:47 PHP

MySQL跟踪用户的好恶

我正在创建一个布告栏应用程序.每个公告都可以被站点用户喜欢或不喜欢.为了跟踪喜欢和不喜欢的地方,我创建了以下数据库表 id user_id bulletin_id like_dislike 1 1 1 1 2 1 2 0 3 3 1 1 4 2 ..
发布时间:2020-08-13 22:05:43 PHP

二维矩阵中各个列的最小-最大归一化

我有一个包含4列/属性和150行的数据集.我想使用最小-最大规范化来规范化此数据.到目前为止,我的代码是: minData=min(min(data1)) maxData=max(max(data1)) minmaxeddata=((data1-minData)./(maxData)) 此处,minData和maxData返回全局最小值和最大值.因此,此代码实际上对2D矩阵中的所有值应用 ..
发布时间:2020-08-13 19:02:14 其他开发

我应该使用平面表还是规范化的数据库?

我目前正在使用一个Web应用程序,该应用程序将MySQL数据库用作后端,在继续进行下去之前,我需要知道哪种方法对我的情况更有利. 简单地说,在此应用程序中,用户将能够使用任何数字字段(由他们决定)构造自己的表单,现在我将其全部存储在由外键链接的几个表中.我的一个朋友建议为了使事情“轻松/快速",我应该将每个用户的表单转换为一个平面表,以便从他们那里查询数据保持快速(以防万一). 我应该 ..
发布时间:2020-08-11 04:26:52 数据库

运行PCA后可以逐行标准化吗?

我有一个包含5万行和26个要素的数据集.我正在使用sklearn的StandardScaler(每列具有0个均值和1个标准偏差)对列进行标准化,然后运行PCA将特征集减小至原始方差的〜90%.然后,在运行sklearn的KMeans算法之前,我要对行进行规范化. 运行PCA之后,是否有任何我不应该对行进行规范化的原因?如果存在,是否在PCA之前对行进行规范化会引起任何问题-应该在对列进行规范 ..
发布时间:2020-07-31 04:12:13 其他开发

如何找到候选密钥

我有一个具有功能依赖性的关系A,B,C,D,E 1)A-> BC 2)CD-> E 3)B-> D 4)E-> A 使用1给出A,D,E,然后使用4给出D,E 使用2给出A,B,C,D,然后使用3给出A,B,C,使用1给出A 使用2给出A,B,C,D,使用1给出A,D 使用4给出B,C,D,E,使用2给出B,C,D,使用3给出B,C 使用3给出 ..

根据业务实体(法律名称,业务类别,DNS域,公司类型)规范化数据

我正在尝试根据合法业务实体名称规范化数据并链接记录. 我在哪里可以确定法定公司名称以及有关该公司的一般信息?我将至少具有以下之一:股票代码,DBA(简称),DNS名称或完整的法定名称. 到目前为止,我已经通过 发现了这一点 依靠whois可以为我提供私人信息或过期信息 Wolfram Alpha API为我提供了私有公司,例如乐高 解析网页中的(c)符号可能有助于解决问题,但名 ..
发布时间:2020-07-14 06:02:55 其他开发

如何仅删除字符串中大写字母的变音符号

我需要删除字符串中大写字母的变音符号. 示例:ÉlectroniqueCaméras=> ElectroniqueCaméras(仅修改了É,Caméras中的é保持不变) 我正在使用以下方法,该方法仅从大写字母中删除变音符号,但是重建的字符串看起来像这样-Electronique Came?ras(é丢失了).如何正确重建字符串? public static String remov ..

Unicode NFC规范化可以增加字符串的长度吗?

如果我将Unicode规范化形式C应用于字符串,字符串中的代码点数量会增加吗? 解决方案 是的,有些代码点在应用NFC归一化后会扩展为多个代码点.例如,在基本多语言平面中,有70个代码点扩展为2个代码点在应用NFC归一化之后,在字母表示形式块),可扩展到3个代码点. 对于此所谓的“扩展因子",一个保证是,任何字符串的扩展长度都不会超过3倍(以 还有一个Unicode Consort ..
发布时间:2020-07-12 18:48:50 其他开发

是否有Unicode编码,其中每个“字符"都包含在其中?只是一个代码点?

尝试改写:您可以将每个组合字符组合映射到一个代码点吗? 我是Unicode的新手,但在我看来,没有编码,规范化或表示形式,在每种情况下,Unicode中每个字符都是一个代码点.这样对吗? Basic Multilingual Planes也是如此吗? 解决方案 如果您的意思是一个char ==一个数字(即,其中每个char都由相同数量的字节/字/您所拥有的数字表示):在UCS- ..

Windows中的Unicode规范化

我一直在Windows中使用"unicode字符串",直到...了解Unicode(例如 毕业后).但是,总是让我感到困惑的是Win32API非常松散地提到了"unicode".特别是,MSN提到的"unicode"变体是UTF-16(尽管“宽字符"术语来自于它以前是UCS-2(不是Unicode)这一事实).但是,它几乎没有提到Unicode规范化. MSN上有几页关于 Unicode 和 ..
发布时间:2020-07-12 18:48:37 其他开发

何时使用Unicode标准化表格NFC和NFD?

Unicode规范化常见问题解答包括以下段落: 程序应始终将相等的规范化Unicode字符串进行比较... Unicode标准提供了可用于此目的的明确定义的规范化形式:NFC和NFD. 并继续... 使用哪种选择取决于特定的程序或系统. NFC是常规文本的最佳形式,因为它与从传统编码转换的字符串更加兼容. ... NFD和NFKD对内部处理最有用. 我的问题是: 什么 ..
发布时间:2020-07-12 18:48:34 其他开发

JavaScript Unicode规范化

我的印象是JavaScript解释器假定它正在解释的源代码已经规范化.什么,归一化到底是什么?它不能是文本编辑器,否则源的纯文本表示将发生变化.是否有一些进行标准化的“预处理器"? 解决方案 否,没有根据ECMAScript 5在JavaScript上自动使用甚至没有使用Unicode规范化功能.所有字符均保持原始代码点不变,可能是非普通形式. 例如尝试: ..

长度不同的tf-idf文件

我在网上搜索过有关在文档长度差异很大的情况下标准化tf等级的信息 (例如,文档长度从500字到2500字不等) 我发现的唯一规范化方法是将术语“频率"除以文档的长度,从而导致文档的长度没有任何意义. 这种方法对于标准化tf确实是一个非常糟糕的方法.如果有的话,这会导致每个文档的tf等级有很大的偏差(除非所有文档都是由几乎相同的字典构成的,而使用tf-idf则不是这种情况) 例如,让 ..
发布时间:2020-07-11 00:05:03 Python

归一化矩阵中的块/子矩阵

我想基于行/列名称对方阵中的块/子矩阵进行归一化(即0-1).重要的是归一化矩阵与原始矩阵相对应.以下代码提取了块,例如所有列/行名称=="A"并通过其最大值对其进行归一化.如何将归一化块的矩阵放在一起,使其对应于原始矩阵,以使归一化块的每个单个值都与原始矩阵位于同一位置. IE.您不能将这些块放在一起,然后按原始矩阵的行/列名称对归一化矩阵进行排序. #dummy code mat ..
发布时间:2020-07-10 03:05:15 其他开发