在Twitter上看到日本友人@IanMLewis的一條推,測試了下python中Set和List的性能差距,真是不測不知道一測嚇一跳,差距能有數百倍 –!
他的原文地址在這裡:Pythonのセットがすごい。翻譯成中文如下:
本來是知道在Python中使用Set是比較高效,但是沒想到竟然有這麼大的差距:
~$ python -m timeit -n 1000 "[x for x in range(1000) if x in range(500, 1500)]"
1000 loops, best of 3: 28.2 msec per loop
~$ python -m timeit -n 1000 "set(range(1000)).intersection(range(500, 1500))"
1000 loops, best of 3: 120 usec per loop
List 大概用了Set的225倍的時間。List轉Set基本用不了什麼時間,所以如果有需要求(集合,列表等)的並集和交集的時候,最好使用Set。
【更新】
考慮到range(500, 1500) 調用了1000次(會比較耗時),改成只調用一次的話,時間從28.2msec降到了18.2msec。仍然要(比Set)慢大概150倍。
~$ python -m timeit -n 1000 "range1500=range(500, 1500);[x for x in range(1000) if x in range1500]"
---------------------------------------------------------------------------------------
set轉成list方法如下: list轉成set方法如下:
s = set('12342212') l = ['12342212']
print s # set(['1', '3', '2', '4']) s = set(l[0])
l = list(s) print s # set(['1', '3', '2', '4'])
l.sort() # 排序 m = ['11','22','33','44','11','22']
print l # ['1', '2', '3', '4'] print set(m) # set(['11', '33', '44', '22'])
可見set和lsit可以自由轉換,在刪除list中多個/海量重復元素時,可以先轉換成set,然後再轉回list並排序(set沒有排序)。此種方法不僅方便且效率較高。