数据类型和变量

整数、浮点数、字符串、布尔值(True False)、空值、变量

字符串和编码

ord()函数获取字符的整数表示,chr()函数把编码转换成对应的字符。

由于Python的字符串的类型是str,在内存中以Unicode表示,一个字符对应若干个字节。如果要在网络上传输,或者保存在磁盘上,就要把str变为以字节为单位的bytes

Python对bytes类型的数据用b前缀的单引号或双引号表示。

以Unicode表示的str通过encode()方法可以编码指定为bytes。把bytes变为str需要用decode()方法。

len()函数计算的是str的字符数,如果换成byteslen()函数就计算字节数。

通常在文件开头写上两句

#!/usr/bin/env python3
#-*- coding: utf-8 -*-

Python中,采用的格式化方式和C语言是一样的。
如果你不太确定应该用什么,%s永远起作用,它会把任何数据类型转换为字符串。

使用list和tuple

list

  • list是Python内置的一种数据类型,list是一种有序的集合,可以随时添加和删除其中的元素。用[]表示。索引是从0开始的。可以用-1做索引得到最后一个值。
  • append()在列表末尾增加元素。
  • insert()把指定元素插入到指定位置。
  • pop()删除list末尾的元素,删除指定位置。

tuple

  • 有序列表tuple,用()表示。tuple与list非常相似,但是tuple一旦初始化就不能修改。
  • 当你定义一个tuple时,在定义的时候,tuple的元素就必须被确定下来。

条件判段

if <条件判断1>:
<执行1>
elif <条件判断2>:
<执行2>
elif <条件判断3>:
<执行3>
else:
<执行4>
  • input()函数返回的数据类型是str,需要int()来转换为整数;

循环

一种for...in循环,一种把list或tuple中的每个元素迭代出来。

第二种while()

使用dict和set

dict

  • Python内置了字典,dict的支持,使用键-值(key-value)存储。
  • 使用{}表示,d['key'] = value;d={'A':1,'B':2}
  • dict内部存放的顺序和key放入的顺序是没有关系的。

set

  • set和dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key
  • set和dict的唯一区别仅在于没有存储对应的value,但是,set的原理和dict一样,所以,同样不可以放入可变对象,因为无法判断两个可变对象是否相等,也就无法保证set内部“不会有重复元素”。

函数

  • 定义函数要使用def语句,函数返回采用return
  • 函数可以返回多个值,其实函数返回的多值就是一个tuple,可以省却括号。
  • 定义函数时,需要确定函数名和参数个数;
  • 如果有必要,可以先对参数的数据类型做检查;
  • 函数体内部可以用return随时返回函数结果;
  • 函数执行完毕也没有return语句时,自动return None。
  • 函数可以同时返回多个值,但其实就是一个tuple。

函数的位置参数、默认参数

  • Python的函数定义非常简单,但灵活度却非常大。除了正常定义的必选参数外,还可以使用默认参数、可变参数和关键字参数,使得函数定义出来的接口,不但能处理复杂的参数,还可以简化调用者的代码。
  • def power(x,n=2) n=2为默认参数

默认参数需要注意:

  • 必选参数在前,默认参数在后,否则Python的解释器会报错(思考一下为什么默认参数不能放在必选参数前面);
  • 是如何设置默认参数。
  • 当函数有多个参数时,把变化大的参数放前面,变化小的参数放后面。变化小的参数就可以作为默认参数。
  • 使用默认参数有什么好处?最大的好处是能降低调用函数的难度,
  • 默认参数降低了函数调用的难度,而一旦需要更复杂的调用时,又可以传递更多的参数来实现。无论是简单调用还是复杂调用,函数只需要定义一个。
  • 有多个默认参数时,调用的时候,既可以按顺序提供默认参数,以不按顺序提供部分默认参数。当不按顺序提供部分默认参数时,需要把参数名写上。比如调用enroll('Adam', 'M', city='Tianjin'),意思是,city参数用传进去的值,其他默认参数继续使用默认值。
  • 牢记一点:默认参数必须指向不变对象!

可变参数

可变参数就是传入的参数个数是可变的,可以是1个、2个到任意个,还可以是0个。

定义可变参数和定义一个list或tuple参数相比,仅仅在参数前面加了一个*号。在函数内部,参数numbers接收到的是一个tuple,因此,函数代码完全不变。但是,调用该函数时,可以传入任意个参数,包括0个参数:

def calc(*numbers):
sum = 0;
for n in numbers
sum = sum + n*n
retrun sum

Python允许你在listtuple前面加一个*号,把listtuple的元素变成可变参数传进去:

nums = [1,2,3]
calc(*nums)
14

*nums表示把nums这个list的所有元素作为可变参数传进去。这种写法相当常见。

关键字参数

可变参数允许传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple。而关键字参数允许传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict。例子:

def person(name,age,**kw)
print('name:',name,'age:',age,'other:',kw)
>>> person('Bob', 35, city='Beijing')
name: Bob age: 35 other: {'city': 'Beijing'}
>>> person('Adam', 45, gender='M', job='Engineer')
name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}
>>> extra = {'city': 'Beijing', 'job': 'Engineer'}
>>> person('Jack', 24, **extra)
name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}

**extra表示把extra这个dict的所有key-value用关键字参数传入到函数的**kw参数,kw将获得一个dict,注意kw获得的dictextra的一份拷贝,对kw的改动不会影响到函数外的extra

命名关键字参数

对于关键字参数,函数的调用者可以传入任意不受限制的关键字参数。至于到底传入了哪些,就需要在函数内部通过kw检查。

如果要限制关键字参数的名字,可以用命名关键字参数,例如只接收cityjob作为关键字参数

def person(name,age,*,city,job):
print(name,age,city,job)

和关键字参数**kw不同,命名关键字参数需要一个特殊分隔符*,*后面的参数被视为命名关键字参数。
调用方式如下:

>>> person('Jack', 24, city='Beijing', job='Engineer')
Jack 24 Beijing Engineer

命名关键字参数必须传入参数名。
命名关键字参数可以有缺省值,从而简化调用:

参数组合

在Python中定义函数,可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数,这5种参数都可以组合使用,除了可变参数无法和命名关键字参数混合。但是请注意,参数定义的顺序必须是:必选参数、默认参数、可变参数/命名关键字参数和关键字参数。

对于任意函数,都可以通过类似func(*args, **kw)的形式调用它,无论它的参数是如何定义的。

小结

  • Python函数具有非常灵活的参数形态,即可以实现简单的调用,又可以传入非常复杂的参数;
  • 默认参数一定要用不可变对象,如果是可变对象,程序运行会有逻辑错误;
  • 要注意可变参数和关键字参数的语法:*args是可变参数,args接收的是一个tuple**kw是关键字参数,kw接收的是一个dict
  • 可变参数既可以直接传入:func(1, 2, 3),又可以先组装listtuple,再通过*args传入:func(*(1, 2, 3))
  • 关键字参数既可以直接传入:func(a=1, b=2),又可以先组装dict,再通过**kw传入:func(**{'a': 1, 'b': 2})
  • 使用*args**kw是Python的习惯写法,当然也可以用其他参数名,但最好使用习惯用法。
  • 命名的关键字参数是为了限制调用者可以传入的参数名,同时可以提供默认值。
  • 定义命名的关键字参数不要忘了写分隔符*,否则定义的将是位置参数。

递归参数

在函数内部可以调用其他函数。如果一个函数在内部调用自身本身,这个函数就是递归函数。

def fact(n):
if n==1:
return 1
return n * fact(n - 1)

递归调用的次数过多,会导致栈溢出。解决递归调用栈溢出的方法是通过尾递归优化,事实上尾递归和循环的效果是一样的,所以,把循环看成是一种特殊的尾递归函数也是可以的。

尾递归是指,在函数返回的时候,调用自身本身,并且return语句不能包含表达式。编译器或者解释器就可以把尾递归做优化,使递归本身无论调用多少次,都只占用一个栈帧,不会出现栈溢出的情况。上面的fact(n)函数由于return n * fact(n - 1)引入了乘法表达式,所以就不是尾递归了。要改成尾递归方式,需要多一点代码,主要是要把每一步的乘积传入到递归函数中:

def fact(n):
return fact_iter(n, 1)

def fact_iter(num, product):
if num == 1:
return product
return fact_iter(num - 1, num * product)

可以看到,return fact_iter(num - 1, num * product)仅返回递归函数本身,num - 1num * product在函数调用前就会被计算,不影响函数调用。

大多数编程语言没有针对尾递归做优化,Python解释器也没有做优化,所以,即使把上面的fact(n)函数改成尾递归方式,也会导致栈溢出。

## 切片

Python提供了切片(Slice)操作符。

L[0:3]
['Michael', 'Sarah', 'Tracy']

L[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3。即索引0,1,2,正好是3个元素。同样支持倒数切片,L[-2:]

L[:10:2]前10个数,每两个取一个,L[::5]所有数,每5个取一个
只写L[:]原样复制一个list。

tuple也是一种list,唯一区别是tuple不可变。因此,tuple也可以用切片操作,只是操作的结果仍是tuple

字符串'xxx'也可以看成是一种list,每个元素就是一个字符。因此,字符串也可以用切片操作,只是操作结果仍是字符串。

迭代

如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们称为迭代(Iteration)。Python的for循环不仅可以用在list或tuple上,还可以作用在其他可迭代对象上。

dict就可以迭代。

d = {'a': 1, 'b': 2, 'c': 3}
for key in d:
print(key)

默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()

列表生成式

列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。

[x*x for x in range(1,11)]

for循环后面还可以加上if判断
[x * x for x in range(1, 11) if x % 2 == 0]

还可以使用两层循环,可以生成全排列:
[m + n for m in 'ABC' for n in 'XYZ']

列表生成式也可以使用两个变量来生成list:

d = {'x': 'A', 'y': 'B', 'z': 'C' }
[k + '=' + v for k, v in d.items()]

生成器