如何在Python语言中将加权边表转换为邻接矩阵？ [英] How to convert weighted edge list to adjacency matrix in Python?

查看：32 发布时间：2022/4/15 20:02:11 python dataframe graph-theory

本文介绍了如何在Python语言中将加权边表转换为邻接矩阵？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

数据位于Excel文件中，第一列表示第一个节点，第二列表示第二个节点，第三列包含权重。

节点为字符串。

例如：

苹果香蕉65
橙色苹果32

推荐答案

首先要做的是导入EXCEL文件。最直接的方法是使用pandas：

import pandas
data = pandas.read_excel("path/to/edgelist", header=None)

这将返回以下形式的数据帧

In [2]: data  
Out[2]:  
        0       1   2  
0   Apple  Banana  65  
1  Orange   Apple  32

快捷方式：使用networkx

我们首先加载networkx包

import networkx

然后，从data我们将边缘列表视为列表的列表：

edgeList = data.values.tolist()

通过这种方式，我们得到

In [19]: edgeList
Out[19]: [['Apple', 'Banana', 65], ['Orange', 'Apple', 32]]

让我们创建一个空(有向)图G：

G = networkx.DiGraph()

然后我们用一个简单的for-loop添加边：

for i in range(len(edgeList)):
    G.add_edge(edgeList[i][0], edgeList[i][1], weight=edgeList[i][2])

我们可以很容易地将邻接矩阵检索为

A = networkx.adjacency_matrix(G).A

这是一个简单的numpy数组

In [30]: A
Out[30]:
array([[ 0, 65,  0],
       [ 0,  0,  0],
       [32,  0,  0]], dtype=int64)

注：上面的邻接矩阵是指一个加权有向图(即从Apple到Banana有一条边，但从Banana到Apple没有边)。如果需要一个加权的无向图(即，如果存在从Apple到Banana的边，则存在从Banana到Apple的边)，只需使用

G = networkx.Graph()

而不是

G = networkx.DiGraph()

漫长的道路：手动

让我们使用第一列和第二列来收集节点ID

nodes = data.iloc[:, 0].tolist() + data.iloc[:, 1].tolist()

因此

In [4]: nodes
Out[4]: [u'Apple', u'Orange', u'Banana', u'Apple']

让我们排序并删除重复项(无论如何排序不是强制的)

nodes = sorted(list(set(nodes)))

和nodes现在的形式为

In [8]: nodes
Out[8]: [u'Apple', u'Banana', u'Orange']

让我们用一个连续的数字ID来映射每个节点(字符串)，以提供给邻接矩阵

nodes = [(i,nodes[i]) for i in range(len(nodes))]

和nodes现在的形式为

In [10]: nodes
Out[10]: [(0, u'Apple'), (1, u'Banana'), (2, u'Orange')]

现在已经完成了字符串到整数的映射，让我们将原始数据帧(data)中的每个字符串替换为其对应的ID

In [15]: for i in range(len(nodes)):
    ...:     data = data.replace(nodes[i][1], nodes[i][0])

，现在data具有表单

In [16]: data
Out[16]:
   0  1   2
0  0  1  65
1  2  0  32

因此您可以看到，Apple的每个出现都替换为0，Banana的每个出现都替换为1，而Orange的每个出现都替换为2(根据变量nodes)。

为了构建邻接矩阵，让我们导入另一个众所周知的包(scipy)

from scipy.sparse import coo_matrix

并创建coordinate-based sparse matrix

M = coo_matrix((data.iloc[:,2], (data.iloc[:,0],data.iloc[:,1])), shape=(len(nodes), len(nodes)))

这将创建一个稀疏邻接矩阵(对于具有多个节点和较少边的图来说，占用的内存更少)。如果您需要密集邻接矩阵，则

M = M.todense()

其中M最终具有表单

matrix([[ 0, 65,  0],
        [ 0,  0,  0],
        [32,  0,  0]])

注：上面的邻接矩阵是指一个加权有向图(即从Apple到Banana有一条边，但从Banana到Apple没有边)。如果需要一个加权的无向图(即，如果存在从Apple到Banana的边，则存在从Banana到Apple的边)，只需转置上面的邻接矩阵

M_symmetric = M + M.T

在哪里

In [38]: M_symmetric
Out[38]:
matrix([[ 0, 65, 32],
        [65,  0,  0],
        [32,  0,  0]])

这篇关于如何在Python语言中将加权边表转换为邻接矩阵？的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

如何在Python语言中将加权边表转换为邻接矩阵？ [英] How to convert weighted edge list to adjacency matrix in Python?

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录关闭

如何在Python语言中将加权边表转换为邻接矩阵？ [英] How to convert weighted edge list to adjacency matrix in Python?

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录 关闭

登录关闭