dimensionality-reduction - IT屋-程序员软件开发技术分享社区

在给定点集中选择最远点的子集

想象一下，给你3维空间中n个点组成的集合S。任意两点之间的距离是简单的欧几里德距离。您希望从该集合中选择k个点的子集Q，以使它们彼此最远。换言之，不存在k个点的其他子集Q‘，使得Q中所有成对距离的最小值小于Q’中的最小值。如果n约为1600万，k约为300，我们如何有效地执行此操作？我的猜测是，这可能是NP难的，所以我们只想关注近似。我能想到的一个想法是使用多维缩放来对一条线上的这 ..

发布时间：2022-08-23 14:14:35 python algorithm computational-geometry dimensionality-reduction multi-dimensional-scaling Python

在 sklearn 中的双图中绘制 PCA 加载和加载(如 R 的自动绘图)

我在带有 autoplot 的 R 中看到了这个教程.他们绘制了载荷和载荷标签: autoplot(prcomp(df), data = iris, color = 'Species',loadings = TRUE, loadings.colour = 'blue',loadings.label = TRUE, loadings.label.size = 3) https://cran.r- ..

发布时间：2021-12-25 14:28:31 python scikit-learn pca dimensionality-reduction biplot Python

如何在高维数据中高效地找到k-最近邻?

所以我有大约 16,000 个 75 维数据点，对于每个点，我想找到它的 k 个最近邻居(使用欧几里德距离，如果这样更容易的话，目前 k=2) 我的第一个想法是为此使用 kd 树，但事实证明，随着维度数量的增加，它们变得相当低效.在我的示例实现中，它只比穷举搜索略快. 我的下一个想法是使用 PCA(主成分分析)来减少维数，但我想知道:是否有一些聪明的算法或数据结构可以在合理的时间内准确 ..

发布时间：2021-12-22 08:19:39 algorithm data-structures computational-geometry nearest-neighbor dimensionality-reduction 其他开发

执行多维缩放后如何获得特征值?

我有兴趣在执行多维缩放后查看特征值.什么功能可以做到这一点?我查看了文档，但它根本没有提到特征值. 这是一个代码示例: mds = manifest.MDS(n_components=100, max_iter=3000, eps=1e-9,random_state=seed, dissimilarity="precomputed", n_jobs=1)结果 = mds.fit(word ..

发布时间：2021-07-16 20:15:05 python scikit-learn eigenvalue dimensionality-reduction multi-dimensional-scaling Python

LDA 忽略 n_components?

当我尝试使用 Scikit-Learn 的 LDA 时，它一直只给我一个组件，即使我要求更多: >>>从 sklearn.lda 导入 LDA>>>x = np.random.randn(5,5)>>>y = [真、假、真、假、真]>>>对于范围内的 i (1,6):... lda = LDA(n_components=i)... 模型 = lda.fit(x,y)... 模型.transfor ..

发布时间：2021-07-16 19:54:30 python scikit-learn dimensionality-reduction Python

t-SNE在不同的机器上产生不同的结果

我在100D中有大约3000个数据点，我用t-SNE投影到2D.每个数据点属于三个类之一.但是，当我在两台单独的计算机上运行脚本时，我总是得到不一致的结果.当我使用随机种子时，可能会出现一些不一致的情况，但是其中一台计算机不断取得更好的效果(我在Mac上使用Macbook Pro，而在Ubuntu上使用固定机器). 我使用Scikit-learn的t-SNE实现.脚本和数据是相同的，我已经手 ..

发布时间：2021-05-31 19:15:07 python macos ubuntu scikit-learn dimensionality-reduction Python

通过有效的P值对变量进行分组

我正在尝试按有效的P值对变量进行子集化，并尝试了以下代码，但它仅选择所有变量，而不是按条件选择.有人可以帮我解决问题吗? myvars ..

发布时间：2021-05-06 19:55:14 r subset extraction p-value dimensionality-reduction 其他开发

通过删除连续的重复项来减少字符串长度

我有2个字段的R数据帧： ID字 1 AAAAABBBBB 2 ABCAAABBBDDD 3 ... 我想通过保持字母的重复来简化单词例如： AAAAABBBBB 应该只给我 AB 和 ABCAAABBBDDD 应该给我 ABCABD 有人对如何执行此操作有想法吗？解决方案这是使用正则表达式的解决方案： x ..

发布时间：2020-10-17 00:21:30 string r dataframe dimensionality-reduction 其他开发

稀疏矩阵的sklearn tsne

我正在尝试在具有预先计算的距离值的非常稀疏的矩阵上显示tsne，但遇到了麻烦. 归结为: row = np.array([0, 2, 2, 0, 1, 2]) col = np.array([0, 0, 1, 2, 2, 2]) distances = np.array([.1, .2, .3, .4, .5, .6]) X = csc_matrix((distances, (row, ..

发布时间：2020-08-06 02:47:57 python scikit-learn sparse-matrix dimensionality-reduction Python

带sklearn的PCA.无法弄清楚PCA的功能选择

我一直在尝试使用PCA降低尺寸.我目前有一个尺寸为(100，100)的图像，并且我使用的是由140个Gabor滤波器组成的滤波器组，其中每个滤波器给我的响应都是(100，100)图像.现在，我想进行功能选择，而我只想选择非冗余功能，而我读到PCA可能是一个好方法. 因此，我继续创建具有10000行和140列的数据矩阵.因此，每一行都包含该滤波器组的Gabor滤波器的各种响应.现在，据我所知， ..

发布时间：2020-07-31 04:12:09 python image-processing scikit-learn pca dimensionality-reduction Python

绘制PCA加载和sklearn中双图的加载(如R的自动绘图)

我在R w/autoplot中看到了本教程.他们绘制了载荷和载荷标签: autoplot(prcomp(df), data = iris, colour = 'Species', loadings = TRUE, loadings.colour = 'blue', loadings.label = TRUE, loadings.label.size = 3 ..

发布时间：2020-07-31 04:03:14 python scikit-learn pca dimensionality-reduction biplot Python

使用TSNE进行降维.为什么3D图形不起作用?

我使用了Sklearn的Digits数据集，并尝试使用TSNE(t分布随机邻居嵌入)将尺寸从64减少到3: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns #%matplotib inline from sklearn.manifold import TS ..

发布时间：2020-05-04 10:13:41 python python-3.x matplotlib machine-learning dimensionality-reduction AI人工智能

PCA降维用于分类

我正在对从CNN不同层提取的特征使用主成分分析.我已经从此处下载了尺寸缩减工具箱. 我总共有11232个训练图像，每个图像的特征是6532.所以特征矩阵就像11232x6532 如果我想要90％的顶级功能，那么我可以轻松做到这一点，并且使用缩减数据的SVM进行训练的准确性为81.73％，这是公平的. 但是，当我尝试具有2408张图像的测试数据并且每个图像的特征为6532时，因此用于测试数据的 ..

发布时间：2020-05-04 10:03:19 matlab machine-learning computer-vision pca dimensionality-reduction AI人工智能

减少数据集的维数后，我得到了负特征值

我使用了降维方法(此处讨论:随机投影算法伪代码 )上的大型数据集. 将维度从1000减少到50后，我得到了新的数据集，每个样本如下所示: [1751.-360. -2069. ...，2694.-3295. -1764.] 现在我有点困惑，因为我不知道负特征值应该代表什么.可以具有这样的负面特征吗?因为在减少之前，每个样本都是这样的: 3，18，18，18，126 ... ..

发布时间：2020-05-04 09:14:09 machine-learning probability multidimensional-array dimensionality-reduction AI人工智能

如何使用通过PCA获得的特征向量来重新投影我的数据？

我在100张图片上使用PCA。我的训练数据是 442368x100 double 矩阵。 442368是特征，100是图像的数量。这是我找到特征向量的代码。 [rows，cols] = size（training）; maxVec = rows; maxVec = min（maxVec，rows）; train_mean = mean（training，2）; A = tr ..

发布时间：2018-07-24 16:22:18 image matlab pca eigenvector dimensionality-reduction 其他开发

dimensionality-reduction相关内容