normalization相关内容

在关系数据库中存储 XML 会如何违反规范化原则?

在本书中:Regina Obe &Leo Hsu, PostgreSQL Up &跑步,第.101.它是作为对 PostgreSQL XML 数据类型的介绍而编写的: XML 数据类型,类似于 JSON,在关系型中是“有争议的"数据库,因为它违反了规范化原则. 不做进一步解释.有人可以详细说明什么是规范化原则以及为什么 XML 确实违反了其中一些原则. 解决方案 在书籍和网络上 ..
发布时间:2021-06-08 18:59:46 其他开发

我如何正确地将非常大的数字算法盟友归一化为相对较小的数字范围?

我正在尝试根据从 Excel 导入的自定义用户数据找到一种方法来调整音调. self.changePitch(30 + (parseInt(self.infoCollection.collection[j].array[i])-200/(3600))); 以上代码适用于最多约 5,000 的“正常值".但是,我想将它们归一化以始终介于最小和最大频率之间.(200 和 3800) 我尝试使 ..
发布时间:2021-06-08 18:59:43 前端开发

SSE归一化比简单近似慢?

我正在尝试标准化一个 4d 向量. 我的第一个方法是使用 SSE 内在函数——它为我的向量算法提供了 2 倍的速度提升.这是基本代码:(v.v4 是输入)(使用 GCC)(所有这些都是内联的) //求正方形v4sf s = __builtin_ia32_mulps(v.v4, v.v4);//设置t为平方v4sft = s;//将4个方块相加s = __builtin_ia32_shufp ..
发布时间:2021-06-08 18:59:40 C/C++开发

Weka 归一化列

我有一个包含 14 个数字列的 ARFF 文件.我想分别对每一列执行标准化,即将每一列的值修改为 (actual_value - min(this_column))/(max(this_column) - min(this_column)).因此,一列中的所有值都在 [0, 1] 范围内.一列的最小值和最大值可能与另一列的不同. 我怎样才能用 Weka 过滤器做到这一点? 谢谢 ..
发布时间:2021-06-08 18:59:37 其他开发

如果测试时在训练模式下使用批量归一化怎么办?

批量归一化在训练阶段和测试阶段有不同的行为. 例如,当使用 tf.contrib.layers.batch_norm 在 tensorflow 中,我们应该在不同的阶段为 is_training 设置不同的值. 我的问题是:如果我在测试时仍然设置is_training=True怎么办?也就是说如果我在测试阶段仍然使用训练模式怎么办? 我提出这个问题的原因是,Pix2Pix 和 D ..
发布时间:2021-06-08 18:59:34 其他开发

SQL VIEW 应该总是在 1NF 中吗?

SQL VIEW 是一个全局逻辑表,可能会或可能不会被持久化.但它仍然是一张桌子.因此,VIEW 是否应该始终遵循第一范式 (1NF)?即没有重复的行,只有标量类型,没有从上到下或从左到右的排序等.更高范式呢? 对我来说,我的应用程序“消耗"存储过程的结果,我的视图被 SQL 查询“消耗",这两种用法是相互排斥的(即我不使用 SQL 查询存储过程的结果集,我的应用程序不包含 SQL 代码). ..
发布时间:2021-06-08 18:59:31 其他开发

如何将拉丁 unicode 字符替换为 [a-z] 字符

我正在尝试将所有拉丁语 unicode 字符转换为它们的 [a-z] 表示 ó -->○í -->一世 我可以很容易的一一做例如: myString = myString.replaceAll("ó","o"); 但是由于有很多变化,这种方法是不切实际的 在 Java 中还有其他方法吗?例如正则表达式,或工具库 用例: 1- 将其他语言的城市名称转换为英语,例如 圣 ..
发布时间:2021-06-08 18:59:29 Java开发

使用紧耦合数据规范化表

我目前有一个表格,用于存储用于创建项目的材料 物品(材料1、材料2、材料3) 最近添加了另一种材料.但是,我想对该表进行规范化,以便将来添加新材料时不需要将新列添加到数据库中.我把材料提取到下面的连接表中 ItemJuncMaterial (id, itemId, materialid) 然而,问题在于材料的顺序很重要.所以这个连接表不允许我根据材料运行这个查询来获取项目 select ..
发布时间:2021-06-08 18:59:26 其他开发

使用 Python 规范化 JSON

我对 JSON 和 Python 比较陌生,并且自最近两天以来我一直在努力扁平化 JSON.我在 http://pandas.pydata.org/pandas-docs/version/0.19/generated/pandas.io.json.json_normalize.html,但我不明白如何取消列出一些嵌套元素.我还阅读了一些线程 Flatten JSON based on an att ..
发布时间:2021-06-08 18:59:18 Python

尝试标准化 Python 图像获取错误 - RGB 值必须在 0..1 范围内

我得到了一个图像 (32, 32, 3) 和两个表示均值和标准差的向量 (3,).我正在尝试通过使图像进入可以减去均值并除以 std 的状态来标准化图像,但是当我尝试绘制它时出现以下错误. ValueError: 浮点图像 RGB 值必须在 0..1 范围内. 我理解错误,所以我想我在尝试标准化时没有执行正确的操作.下面是我尝试使用标准化图像的代码. mean.shape #(3,)std. ..
发布时间:2021-06-08 18:59:15 Python

按最大值或总值归一化?

我正在做一些涉及文档比较的工作.为此,我正在分析每个文档,并基本上计算每个文档中某些关键词出现的次数.例如: 文档 1: 文档 2:书 ->3 书 ->9工作 ->0 工作 ->2美元 ->5 美元 ->1城市 ->18 城市 ->6 所以在计数过程之后,我将所有这些数字序列存储在一个向量中.这个数字序列将代表每个文档的特征向量. 文档 1: [ 3, 0, 5, 18]文件 2: [ 9, ..
发布时间:2021-06-08 18:59:06 其他开发

从 Obj-C 中的字符串中提取数字

我是 Objective-C 的新手,但在其他高级语言方面有经验.我想通过删除所有非数字字符来规范化字符串.换句话说,给定输入字符串“206-555-1212",标准化结果应该是“2065551212".下面的代码片段有效,但考虑到我在其他语言方面的经验,这似乎有点过分.有没有更好的方法? 编辑:输入字符串“(206) 555-1212"、“206.555.1212"、“206 555 12 ..
发布时间:2021-06-08 18:59:00 移动开发

如何存储缩放参数以备后用

我想应用 scikit-learn 提供的缩放 sklearn.preprocessing.scale 模块来居中我将用来训练 svm 分类器的数据集. 然后我如何存储标准化参数,以便我也可以将它们应用于我想要分类的数据? 我知道我可以使用 standarScaler 但是我可以以某种方式将它序列化到一个文件中,这样我就不必每次运行分类器时都将它与我的数据匹配吗? 解决方案 我 ..
发布时间:2021-06-08 18:58:51 Python

用于文本规范化的 Java 库

我正在寻找允许文本“规范化"的 Java 库.类似于标准 Normalizer,但更广泛(类似于 utf8proc LUMP). 它应该将所有类型的特殊字符替换为 ASCII 等价物(当然,如果可能的话).空格的所有变体编码为 32,减号的所有变体(长、短、细等)编码为 45,依此类推. 解决方案 你应该看看 Latin-ASCII 在 CLDR 中转换.它将在 ICU 4.6 ..
发布时间:2021-06-08 18:58:48 Java开发