python3.x - 如何最高效的实现这样的python算法

查看:122
本文介绍了python3.x - 如何最高效的实现这样的python算法的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

我有一个list1,数据如下:
["a","b","c","e"]

一个list2,数据如下
["b","c","f"]

我的目标是最快效率的找出list2中有,但是list1中没有的数据,简单来说,就是数据过滤吧...

但是怎么做效率最高??
我用for,感觉效率很低:

for i in list2:
    if i not in list1:
        print (i)

当然也可以用列表解析~~,但是感觉效率都是非常低!有没有一种高效的方式呢?

解决方案

假如希望代码看起来简单,那么就很方便实现:

[k for k in list2 if k not in list1]

如果希望提高效率,那么假设这时候list1 是个非常长的list;由于需要遍历list2,这部分时间是不可避免的,那么问题就转变为怎么在list1中寻找元素让时间消耗最短。我做了下面的例子:

# -*- coding: utf-8 -*-
import time

list1 = range(0, 10000)
list2 = [1, 20, 40, 60, -10, -20]
LIMIT = 10000  # 循环次数来验证时间

def method1():
    then = time.time()
    for i in range(0, LIMIT):  # 循环
        [k for k in list2 if k not in list1]
    print 'cost time:', time.time() - then

def method2():
    then = time.time()
    data = dict([(k, 1) for k in list1])
    for i in range(0, LIMIT):
        [k for k in list2 if not data.get(k)]
    print 'cost time:', time.time() - then

method1()
method2()

结果输出时间,不出意外,第二个好快些。因为采用了dict的方式,也就是hash的路由匹配方式,内部实现机制估计是二叉树,比遍历list1来寻找快多了。
cost time: 4.26041412354 # method1
cost time: 0.0187389850616 # method2

这篇关于python3.x - 如何最高效的实现这样的python算法的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆