Python的Tuple是不是冗余设计?
2017.06.14 13:05:48

问题在这里:https://www.zhihu.com/question/60574107

觉得这个问题挺好,值得好好思考。

Immutable

首先说说Immutable的优势:

  1. 为什么FP在多核时代重获重视?一个很重要的原因就是FP的Immutable特性。Immutable类型不存在Mutable类型的同步问题;
  2. 因为不可变,Immutable类型的内存结构设计就少了很多假设性条件,带来的直接好处就是性能优化;
  3. Python里只有Immutable类型是Hashable的,因为同样是Immutable使得Hash Table的设计来得简单;
  4. 业务上不该改变的就不允许其发生中途变化!

Tuple的使用场景

List跟Tuple使用场景上的一点主要区别

看到好多Python程序员都喜欢第一时间就用List,不管合不合适(当然有时候是需要可修改的):

[['张三', 35], ['陈八', 28]]

List存放的数据应该是同质数据;而Tuple呢?其存储的应该是像数据库记录这样的结构化数据——这个区别是List和Tuple使用上最直白的区别。

所以上述代码应该改为:

[('张三', 35), ('陈八', 28)]

Tuple是Hashable的

这可以应用在一些有趣的场景,比如把一些“记录”作为Key:

Out[11]:
[(('张三', 1995), '√ 少林长拳'),
 (('张三', 1999), '√ 武当太极'),
 (('张三', 2015), '√ 破空神掌'),
 (('李七', 2007), '√ 大摔碑手'),
 (('李七', 2017), '√ 长空剑法')]

一个武者习武履历记录的时间轴就出来了。

此外,其实Python中大量运用Tuple。好比上图代码里,在sorted中指定排序顺序的字段。然后再看看person.items(),其结构类似上面的输出,里面同样藏着Tuple结构。

比如还有print

In [15]: print("%s is %s." % ('Foo', 'Bar'))
Foo is Bar.

Tuple解构

在上面的print里,其实就是Tuple解构。

比如:

In [28]: name, year = ('张三', 1995)

In [29]: name
Out[29]: '张三'

In [30]: year
Out[30]: 1995

In [31]: for (name, year), gongfu in sorted(person.items(), key=lambda item: (item[0], item[1])):
    ...:     print('{n} -- {y} -- {gf}'.format(n=name, y=year, gf=gongfu))
    ...:
张三 -- 1995 -- √ 少林长拳
张三 -- 1999 -- √ 武当太极
张三 -- 2015 -- √ 破空神掌
李七 -- 2007 -- √ 大摔碑手
李七 -- 2017 -- √ 长空剑法

Tuple解构特性对于函数返回多值是非常有意义的。

collections.namedtuple具名元组

附带提提collections.namedtuple,一个工厂函数,其在官方文档中的定义是:

factory function for creating tuple subclasses with named fields.

Returns a new tuple subclass named typename. The new subclass is used to create tuple-like objects that have fields accessible by attribute lookup as well as being indexable and iterable...

In [57]: from collections import namedtuple
    ...:
    ...: GF = namedtuple('GongFu', 'name, gf, pai, props')
    ...: data = [
    ...:     GF('张三丰', '太极拳', '武当派', ('男', 60)),
    ...:     GF('刘小七', '八卦掌', '八卦门', ('男', 41)),
    ...:     GF('石破天', '无影手', '无影门', ('男', 39))
    ...: ]
    ...: for item in data:
    ...:     print(f'{item.name} -- {item.gf} -- {item.pai} -- {item.props[0]} -- {item.props[1]}.')
    ...:
张三丰 -- 太极拳 -- 武当派 -- 男 -- 60.
刘小七 -- 八卦掌 -- 八卦门 -- 男 -- 41.
石破天 -- 无影手 -- 无影门 -- 男 -- 39.

collections.namedtuple可以带上名称属性,在逻辑及调试上更加清晰。在作为“记录”使用时,无疑collections.namedtuple更为合适。而且collections.namedtuple的构建在内存上跟Tuple是一样的,从而也足够优化。

而且collections.namedtuple也能够解构:

In [65]: name, gf, pai, (props0, props1) = data[2]

In [66]: name, gf, pai, props0, props1
Out[66]: ('石破天', '无影手', '无影门', '男', 39)

番外篇

Tuple的一个定义:

Tuple其实是在大量编程语言中得以大量使用的。在一些FP语言中Tuple的基础其实是Pair,比如Idris中,("Baz", "Foo", "Bar", 39)被当成("Baz", ("Foo", ("Bar", 39)))


(0)

发表评论请先登录或注册