Python 笔记

数据类型和变量

整数、浮点数、字符串、布尔值（True False）、空值、变量

字符串和编码

ord()函数获取字符的整数表示，chr()函数把编码转换成对应的字符。

由于Python的字符串的类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存在磁盘上，就要把str变为以字节为单位的bytes。

Python对bytes类型的数据用b前缀的单引号或双引号表示。

以Unicode表示的str通过encode()方法可以编码指定为bytes。把bytes变为str需要用decode()方法。

len()函数计算的是str的字符数，如果换成bytes，len()函数就计算字节数。

通常在文件开头写上两句

#!/usr/bin/env python3
#-*- coding: utf-8 -*-

Python中，采用的格式化方式和C语言是一样的。
如果你不太确定应该用什么，%s永远起作用，它会把任何数据类型转换为字符串。

使用list和tuple

list

list是Python内置的一种数据类型，list是一种有序的集合，可以随时添加和删除其中的元素。用[]表示。索引是从0开始的。可以用-1做索引得到最后一个值。
append()在列表末尾增加元素。
insert()把指定元素插入到指定位置。
pop()删除list末尾的元素，删除指定位置。

tuple

有序列表tuple，用()表示。tuple与list非常相似，但是tuple一旦初始化就不能修改。
当你定义一个tuple时，在定义的时候，tuple的元素就必须被确定下来。

条件判段

if <条件判断1>:
    <执行1>
elif <条件判断2>:
    <执行2>
elif <条件判断3>:
    <执行3>
else:
    <执行4>

input()函数返回的数据类型是str,需要int()来转换为整数；

循环

一种for...in循环，一种把list或tuple中的每个元素迭代出来。

第二种while()

使用dict和set

dict

Python内置了字典，dict的支持，使用键－值(key-value)存储。
使用{}表示，d['key'] = value;d={'A':1,'B':2}
dict内部存放的顺序和key放入的顺序是没有关系的。

set

set和dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key
set和dict的唯一区别仅在于没有存储对应的value，但是，set的原理和dict一样，所以，同样不可以放入可变对象，因为无法判断两个可变对象是否相等，也就无法保证set内部“不会有重复元素”。

函数

定义函数要使用def语句，函数返回采用return
函数可以返回多个值，其实函数返回的多值就是一个tuple，可以省却括号。
定义函数时，需要确定函数名和参数个数；
如果有必要，可以先对参数的数据类型做检查；
函数体内部可以用return随时返回函数结果；
函数执行完毕也没有return语句时，自动return None。
函数可以同时返回多个值，但其实就是一个tuple。

函数的位置参数、默认参数

Python的函数定义非常简单，但灵活度却非常大。除了正常定义的必选参数外，还可以使用默认参数、可变参数和关键字参数，使得函数定义出来的接口，不但能处理复杂的参数，还可以简化调用者的代码。
def power(x,n=2)　n=2为默认参数

默认参数需要注意：

必选参数在前，默认参数在后，否则Python的解释器会报错（思考一下为什么默认参数不能放在必选参数前面）；
是如何设置默认参数。
当函数有多个参数时，把变化大的参数放前面，变化小的参数放后面。变化小的参数就可以作为默认参数。
使用默认参数有什么好处？最大的好处是能降低调用函数的难度，
默认参数降低了函数调用的难度，而一旦需要更复杂的调用时，又可以传递更多的参数来实现。无论是简单调用还是复杂调用，函数只需要定义一个。
有多个默认参数时，调用的时候，既可以按顺序提供默认参数，以不按顺序提供部分默认参数。当不按顺序提供部分默认参数时，需要把参数名写上。比如调用enroll('Adam', 'M', city='Tianjin')，意思是，city参数用传进去的值，其他默认参数继续使用默认值。
牢记一点：默认参数必须指向不变对象！

可变参数

可变参数就是传入的参数个数是可变的，可以是1个、2个到任意个，还可以是0个。

定义可变参数和定义一个list或tuple参数相比，仅仅在参数前面加了一个*号。在函数内部，参数numbers接收到的是一个tuple，因此，函数代码完全不变。但是，调用该函数时，可以传入任意个参数，包括0个参数：

def calc(*numbers):
	sum = 0;
	for n in numbers
		sum = sum + n*n
	retrun sum

Python允许你在list或tuple前面加一个*号，把list或tuple的元素变成可变参数传进去：

nums = [1,2,3]
calc(*nums)
14

*nums表示把nums这个list的所有元素作为可变参数传进去。这种写法相当常见。

关键字参数

可变参数允许传入0个或任意个参数，这些可变参数在函数调用时自动组装为一个tuple。而关键字参数允许传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个dict。例子：

def person(name,age,**kw)
	print('name:',name,'age:',age,'other:',kw)

>>> person('Bob', 35, city='Beijing')
name: Bob age: 35 other: {'city': 'Beijing'}
>>> person('Adam', 45, gender='M', job='Engineer')
name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}

>>> extra = {'city': 'Beijing', 'job': 'Engineer'}
>>> person('Jack', 24, **extra)
name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}

**extra表示把extra这个dict的所有key-value用关键字参数传入到函数的**kw参数，kw将获得一个dict，注意kw获得的dict是extra的一份拷贝，对kw的改动不会影响到函数外的extra。

命名关键字参数

对于关键字参数，函数的调用者可以传入任意不受限制的关键字参数。至于到底传入了哪些，就需要在函数内部通过kw检查。

如果要限制关键字参数的名字，可以用命名关键字参数，例如只接收city和job作为关键字参数

def person(name,age,*,city,job):
	print(name,age,city,job)

和关键字参数**kw不同，命名关键字参数需要一个特殊分隔符*,*后面的参数被视为命名关键字参数。
调用方式如下：

>>> person('Jack', 24, city='Beijing', job='Engineer')
Jack 24 Beijing Engineer

命名关键字参数必须传入参数名。
命名关键字参数可以有缺省值，从而简化调用：

参数组合

在Python中定义函数，可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数，这5种参数都可以组合使用，除了可变参数无法和命名关键字参数混合。但是请注意，参数定义的顺序必须是：必选参数、默认参数、可变参数/命名关键字参数和关键字参数。

对于任意函数，都可以通过类似func(*args, **kw)的形式调用它，无论它的参数是如何定义的。

小结

Python函数具有非常灵活的参数形态，即可以实现简单的调用，又可以传入非常复杂的参数；
默认参数一定要用不可变对象，如果是可变对象，程序运行会有逻辑错误；
要注意可变参数和关键字参数的语法：*args是可变参数，args接收的是一个tuple；**kw是关键字参数，kw接收的是一个dict
可变参数既可以直接传入：func(1, 2, 3)，又可以先组装list或tuple，再通过*args传入：func(*(1, 2, 3))；
关键字参数既可以直接传入：func(a=1, b=2)，又可以先组装dict，再通过**kw传入：func(**{'a': 1, 'b': 2})。
使用*args和**kw是Python的习惯写法，当然也可以用其他参数名，但最好使用习惯用法。
命名的关键字参数是为了限制调用者可以传入的参数名，同时可以提供默认值。
定义命名的关键字参数不要忘了写分隔符*，否则定义的将是位置参数。

递归参数

在函数内部可以调用其他函数。如果一个函数在内部调用自身本身，这个函数就是递归函数。

def fact(n):
    if n==1:
        return 1
    return n * fact(n - 1)

递归调用的次数过多，会导致栈溢出。解决递归调用栈溢出的方法是通过尾递归优化，事实上尾递归和循环的效果是一样的，所以，把循环看成是一种特殊的尾递归函数也是可以的。

尾递归是指，在函数返回的时候，调用自身本身，并且return语句不能包含表达式。编译器或者解释器就可以把尾递归做优化，使递归本身无论调用多少次，都只占用一个栈帧，不会出现栈溢出的情况。上面的fact(n)函数由于return n * fact(n - 1)引入了乘法表达式，所以就不是尾递归了。要改成尾递归方式，需要多一点代码，主要是要把每一步的乘积传入到递归函数中：

def fact(n):
    return fact_iter(n, 1)

def fact_iter(num, product):
    if num == 1:
        return product
    return fact_iter(num - 1, num * product)

可以看到，return fact_iter(num - 1, num * product)仅返回递归函数本身，num - 1和num * product在函数调用前就会被计算，不影响函数调用。

大多数编程语言没有针对尾递归做优化，Python解释器也没有做优化，所以，即使把上面的fact(n)函数改成尾递归方式，也会导致栈溢出。

##　切片

Python提供了切片（Slice）操作符。

L[0:3]
['Michael', 'Sarah', 'Tracy']

L[0:3]表示，从索引0开始取，直到索引3为止，但不包括索引3。即索引0，1，2，正好是3个元素。同样支持倒数切片，L[-2:]

L[:10:2]前10个数，每两个取一个，L[::5]所有数，每５个取一个
只写L[:]原样复制一个list。

tuple也是一种list，唯一区别是tuple不可变。因此，tuple也可以用切片操作，只是操作的结果仍是tuple

字符串'xxx'也可以看成是一种list，每个元素就是一个字符。因此，字符串也可以用切片操作，只是操作结果仍是字符串。

迭代

如果给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历我们称为迭代（Iteration）。Python的for循环不仅可以用在list或tuple上，还可以作用在其他可迭代对象上。

dict就可以迭代。

d = {'a': 1, 'b': 2, 'c': 3}
 for key in d:
 	print(key)

默认情况下，dict迭代的是key。如果要迭代value，可以用for value in d.values()，如果要同时迭代key和value，可以用for k, v in d.items()

列表生成式

列表生成式即List Comprehensions，是Python内置的非常简单却强大的可以用来创建list的生成式。

[x*x for x in range(1,11)]

for循环后面还可以加上if判断
[x * x for x in range(1, 11) if x % 2 == 0]

还可以使用两层循环，可以生成全排列：
[m + n for m in 'ABC' for n in 'XYZ']

列表生成式也可以使用两个变量来生成list：

d = {'x': 'A', 'y': 'B', 'z': 'C' }
[k + '=' + v for k, v in d.items()]