1、基础知识

1.1 常用安装命令

pip list           #在commond中。查看已经安装的包。
pip install ****.whl    #pip是自带程序，需要设置环境变量。以后就可以从网站下载*.whl格式的扩展包了。使用这个命令安装。
pip uninstall ***       #卸载某包

pip install **     #一般安装用这个就行。

#有时候上面命令会下载超时,使用下面这个命令，指定从douban下载
pip install ** -i https://pypi.douban.com/simple 

#在mac中自带python2.7，有时候需要更新包，由于maxos采用了更高级的内核保护机制，会发生错误。就用这个命令。
sudo pip install numpy --upgrade --ignore-installed 

#有时候有些包用pip会出错，用conda。
conda install **  

2. Python数据结构

2.1 元组tuple

Python中的元组一旦创建了，不能以任何方式改变。元组和字符串序列都是不可变序列。

定义元组tuple用圆括号()
```
a=(1,2,3,'44','555')
```
元组索引，从0开始，元组内元素有确定的顺序

a[0]
a[-1]    #负的索引，从尾部开始计数
a[1:6]   #对元组切片操作，切片得到新的元组

元组遍历

for b in a:
    print b

for i in range(0,len(a)):
    print a[i]

2.2 列表list

列表是Python中最常用的数据结构，它是可变的序列。

定义列表用方括号[]

a=[1,2,3,'44','555']

列表的内置函数

a.append(3)
a.insert(3,900)  #下标3处，插入900
a.extend([7,9])  #合并两个list
a.index(100)  #搜索，找不到会爆异常
a.remove(3)  #删除一个值，首次出现
a.pop()   #删除最后一个元素

2.3 集合set

定义集合用花括号{},或者内置函数
```
s={3,5,7,8}
s=set(alist)
```
2.4 字典dict

根据两个list构造字典

keys = ['a', 'b', 'c']
values = [1, 2, 3]
dictionary = dict(zip(keys, values))
print dictionary

3. Python奇淫技巧

3.1 求两个list的交集，并集，差集

print list(set(a).intersection(set(b)))   #获取两个 list 的交集
print list(set(a).union(set(b)))        #获取两个 list 的并集
print list(set(b).difference(set(a)))    #获取两个 list 的差集

3.2 优先权队列的用法

from queue import Queue
from queue import PriorityQueue
prioqueue=PriorityQueue()
prioqueue.put((1,'hahaha'))  
prioqueue.put((5,'ustc'))
prioqueue.put((2,'nwsuaf'))
prioqueue.put((3,'tsinghua'))
prioqueue.put((6,'peking'))
prioqueue.put((4,'zhejiang'))
while prioqueue:    
    print (prioqueue.get_nowait())

3.3 import 包

modules所在的目录在Python中叫做package，比如有一个名字叫做MyPackage的package，实际上是一个目录。它的下面有3个文件，分别是： first.py 、second.py 、__init__.py 。有两种方法调用某目录下的modules。 __init__.py为空时：

from MyPackage import firstfirst.hello()

___init__.py用all=[…]指定该package下可以被imported进去的module

% cat MyPackage/__init__.py__all__=["first","second"]

3.4 排序

在Python中，当需要对一个list排序时，一般可以用 list.sort() 或者 sorted(iterable[, cmp[, key[, reverse]]]).其中：cmp(e1,e2) 是带两个参数的比较函数，返回值：负数（e1 < e2）、0（e1=e2）、正数（e1>e2）。默认为None，即用内建的比较函数。key 是带一个参数的函数，用来为每个元素提取比较值，默认为None，即直接比较每个元素。reverse 是一个布尔值，表示是否反转比较结果。* cmp 使用自定义排序规则来进行排序。比如list中每个元素都是2-tuple，(keyword, weight)，我们使用weight来进行排序（从高到低）。可以这样：

def my_cmp(e1, e2):    
    return -cmp(e1[1],e2[1])
a_list=[('aa',1),('bb',2),('cc',3)]
a_list.sort(my_cmp)

如果使用lambda函数：

a_list=[('aa',1),('bb',2),('cc',3)]
a_list.sort(lambda e1,e2: cmp(e1[1],e2[1]))

key

def my_key(e):    
   return e[1]  #return key 11,10,12
L = [('aa', 11), ('bb', 10), ('cc', 12)]
L.sort(key=my_key,reverse=1) #key 大到小 reverse=0 时候从小到大

如果使用lambda函数：

a_list=[('aa',1),('bb',2),('cc',3)]
a_list.sort(key=lambda e:e[1])

字典排序

dic = {'a':31, 'bc':5, 'c':3, 'asd':4, '33':56, 'd':0}
print sorted(dic.iteritems(), key=lambda d:d[1], reverse = False ) 
#排序后是一个list:  [('d', 0), ('c', 3), ('asd', 4), ('bc', 5), ('a', 31), ('33', 56)]

3.5 列表推导

列表推导（List comprehension）的作用是为了更方便地生成列表（list）。比如，一个list变量的元素均为数字，如果需要将每个元素的值乘以2并生成另外一个list。如果使用列表推导，可以这样：

list1 = [1,2,4,5,12]
list2 = [item*2 for item in list1 ]
print list2

可以通过if过滤掉不想要的元素，例如提取出list1中小于10的元素：

list1 = [1,2,4,5,12]
list2 = [item for item in list1 if item < 10 ]
print list2

如果要将两个list中的元素进行组合，可以：

list1 = [1,2,3]
list2 = [4,5,6]
list3 = [(item1,item2) for item1 in list1 for item2 in list2 ]
print list3

3.6 is和==的区别

Python中的对象包含三要素： id ,、 type、 value其中， id 用来唯一标识一个对象， type 标识对象的类型， value 是对象的值。is判断的是 a对象是否就是b对象，是通过 id 来判断的==判断的是a对象的值是否和b对象的值相等，是通过 value 来判断的

>>> a=100
>>> b=100.0
>>> a is b
False
>>> a==b
True

3.7 进度条

step=0      
for i in range(0,666):
    step+=1
    if step%10==0:  #显示进度条
        running_fraction=step*100.0/666
        sys.stdout.write(str(running_fraction)+'% \r')
        sys.stdout.flush()  

4、高级话题

4.1 Python特殊语法： lambda 、 filter 、 map 、 reduce

Python内置了一些非常有趣但非常有用的函数，冲分体现了Python语言的魅力！！* lambdalambda函数也叫匿名函数，比如：

def f(x):    
    return x**2    
print f(4)

使用lambda函数，写成这样：

g = lambda x : x**2print g(4)

lambda会创建一个函数对象，但不会把这个函数对象赋值给一个标识符，而def则会把函数对象赋值给一个变量。此外，lambda只是一个表达式，而def则是一个语句。lambda语句被用来创建新的函数对象，并且在运行时返回他们。

print   reduce(lambda  x,y: x*y  , range(1,1001))

reduce（functionA，iterableB），functionA为需要两个变量的函数，并返回一个值。iterableB为可迭代变量，如List等。reduce函数将B中的元素从左到右依次传入函数A中，再用函数A返回的结果替代传入的参数，反复执行，则可将B reduce成一个单值。在此，是将1到1000的连续整数列表传入lambda函数并用两个数的积替换列表中的数，实际的计算过程为：(…((1×2)×3)×4)×…×1000)，最后的结果即1000的阶乘。* 关于lambda函数，一些用过的技巧：

list_a_b_c_sorted=sorted(list_a_b_c,key=lambda a_tuple:a_tuple[1]) 
#list_a_b_c是一个列表，列表的元素是一个三元组(a,b,c)，按照关键字为b来排序
cluster_list=defaultdict(lambda:[])   #定义了一个字典。value是一个list

为什么使用lambda

使用Python写一些执行脚本时，使用lambda可以省去定义函数的过程，让代码更加精简。
对于一些抽象的，不会别的地方再复用的函数，有时候给函数起个名字也是个难题，使用lambda不需要考虑命名的问题。
使用lambda在某些时候让代码更容易理解。

filter

filter(function,sequence) ：对 sequence 中的 item 依次执行 function(item) a将执行结果为 True 的 item 组成一个 List/String/Tuple （取决于 sequence 的类型）返回。比如：

def f(x):     
    return x % 2 != 0 and x % 3 != 0 
filter(f, range(2, 25))

打印出： [5, 7, 11, 13, 17, 19, 23]

map map(function, sequence) ：对 sequence 中的item依次执行 function(item) ，将执行结果组成一个List返回。比如：
```
def cube(x):     
   return x*x*x map(cube, range(1, 11))
```
打印出：[1, 8, 27, 64, 125, 216, 343, 512, 729, 1000]
reduce reduce(function, sequence, starting_value) ：对 sequence 中的 item 顺序迭代调用 function ，如果有 starting_value ，还可以作为初始值调用，例如可以用来对 List 求和：
```
def add(x,y):    
  return x + yreduce(add, range(1, 11))
```
打印出：55 （注：1+2+3+4+5+6+7+8+9+10）
```
reduce(add, range(1, 11), 20)
```
打印出： 75 （注：1+2+3+4+5+6+7+8+9+10+20）

4.2 闭包

什么是闭包？

闭包（ closure ）是函数式编程的重要的语法结构。函数式编程是一种编程范式（面向过程和面向对象也都是编程范式）。在面向过程中，有函数（ function ）；在面向对象中，有对象（ object ）。函数和对象的根本目的是以某种逻辑方式组织代码，并且提高代码的可重复使用性（ reusability ）。闭包也是一种组织代码的结构，它同样提高了代码阿德可重复使用性。

为什么要闭包？

闭包可以有效地减少了函数所需要定义的参数数目。这对于并行运算来说有重要的意义。在并行运算的环境下，让每台电脑负责一个函数，然后将一台电脑的输出和下一台电脑的输入串联起来。最终，像流水线一样工作。从串联的电脑集群一端输入数据，从另一端输出数据。这样的情境最适合只有一个参数输入的函数。闭包就可以实现这一目的。

怎么用闭包？

例题1

def make_add(a):    
    def add(b):        
        return a+b    
    return addp=make_add(23)
q=make_add(44)
print p(100)
print q(100)

打印出：123 144make_add是一个函数，带有一个参数a，这个函数里面又定义了一个新函数，在新函数中，外部传递过来的参数a和自己的参数b绑定在一起了。我们将b看做新函数的一个配置信息，配置信息不同，函数的功能就不一样了，也就是能够得到定制之后的函数。在看一下运行结果，虽然p和q都是make_add生成的，但是因为配置参数不同，后面执行相同的参数后得到了不同的结果，这就是闭包。

例题2

def hellocounter(name):    
    count=0    
    def counter():       
        nonlocal count        
        count+=1        
    print ('Hello,',name,',',str(count)+' access!')    
    return counter
hello = hellocounter('yan')
hello()
hello()
hello()

执行结果(python3.4)

Hello, yan , 1 access!Hello, yan , 2 access!Hello, yan , 3 access!

可以将这个程序看做统计一个函数调用次数的函数。

例题3装饰器

def makebold(fn):    
    def wrapped():        
        return '<b>'+fn()+'</b>'    
    return wrapped
def makeitalic(fn):    
    def wrapped():        
        return '<i>'+fn()+'</i>'    
    return wrapped@makebold@makeitalic
def hello():    
    return 'Hello World'print (hello())

执行结果

<b><i>Hello World</i></b>

这个程序就是传说中的装饰器。装饰器就是一种闭包。装饰器的概念：对函数（参数、返回值等）进行加工处理，生成一个功能增强版的一个函数。

4.3 赋值、浅拷贝、深拷贝

赋值的3种形式：=、对象作为参数、返回值。在Python中，对象的赋值就是简单的对象引用，比如：

list_a=[1,2,3,4,5,6,7]
list_b=list_a

那么 list_b 和 list_a 是一样的，他们指向同一片内存， list_b 是 list_a 的别名，是引用。赋值操作（包括对象作为参数、返回值），不会开辟新的内存空间，它只是复制了新对象的引用。也就是说除了 list_b 这个名字外，没有其他的内存开销。

浅拷贝有3种形式：切片操作，工厂函数，copy模块中的copy函数。比如：

list_b = list_a[:]list_b = [each for each in list_a]  #切片操作
list_b = list(list_a)       # 工厂函数
list_b=copy.copy(list_a)    # copy函数

浅拷贝产生的 list_b 不再是 list_a 了，使用 is 可以发现他们不是同一个对象，用 id 查看他们也不指向同一片内存。但是如果列表元素中有高级结构比如list，那么修改了list_b中的list元素，也会修改list_a中的，因为浅拷贝仅仅拷贝了一层。

深拷贝只有一种形式。 copy 模块中的 deepcopy 函数

Jarlonyan

python学习