oeasy python (oeasy鏁欎綘鐜╄浆python)

打包和解包

回忆上次内容

  • ASCII 由这样几类字符构成
    • 英文大写字符
    • 英文小写字符
    • 数字
    • 符号
  • 电报时代对于英文、数字的编码
    • 使用的是摩斯电码

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 这摩斯电码是3进制的编码方式
    • 长短空
  • 怎么演化成ascii这种0101的二进制编码的呢?

回到 ASCII 码

  • 电报传过来的信号需要记录下来
    • 于是有了电传打字机(tele-typewriter)
    • 电传打字机需要统一的编码字母和数字
  • ASCII的第一个商业用途
    • 是作为一个七位电传打字机(tele-typewriter)代码

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 要把滴、答、停的电报信号
    • 变成0和1的二进制信号

ASCII的演化(evolve)

  • 1960年10月6日
    • 美国标准协会(ASA)X3的首次会议
    • ASCII标准的工作开始了
    • 美国标准协会
      • 现为美国国家标准协会
      • American National Standards Institute
      • 简称ANSI
    • 开始敲定ASCII具体编码

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 贝尔公司主要经营电报电话

编码来源

  • 第一次(ASA X3.4-1963)就明确
    • 大小写字母之间只差一个位
    • 这很重要

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 否则错误编码一旦成为标准
    • 所有应用这种错误编码的文件
      • 就都废掉了
  • 我想把所有 ASCII 字符 0-127 全都打出来
    • 可以么?

回忆show.py

  • 回忆编写show.py
for n in range(0xff):
    print(chr(n),end="")
    if n % 16 == 0:
        print()
  • 确实可以出来

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 这输出靠的是
    • 把序号转化成字符的函数
      • chr
  • 但是没有看到0
    • 理论上在1之前
    • 仿佛被黑暗森林所吞没
  • 我能否将字节解码(decode)来干这个事?

struct

  • 首先是要获得从0到127的字节状态
  • struct 是一个包(module)
    • 导入struct包

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • struct是结构的意思
    • 来自于c里面常用类型的存储结构
    • 这个struct怎么用呢?

pack

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 把数字变成字节的形态
    • 把0x61这个数字变成字节的形态

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • "a" 不是字符吗?
    • 怎么成了字节了?

字节表示法

  • 注意细节

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 注意"a"前面还有一个b
    • "a"是字符
    • b"a" 是字节

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 这两类型完全不同
  • 字节b"a"是什么呢?

字节形态

  • 字节状态可以用两个16进制数来表示
    • b"a"
      • 相当于b"\x61"

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • b"a" 和 b"\x61" 是同样的一个字节
    • 就是字符"a"在字节里的样子

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 为了清楚起见
    • 把b"\x61"表示为b"a"
    • 这样也就直接看到了字符
    • 刚好ord("a") 就是 0x61
  • 如何理解struct.pack呢?

封包pack

  • 按要求把东西封进规定的封装里面

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 把数字封在1个Byte里面
    • 观察他的字节状态

遍历

import struct
for n in range(0,128):
    b = struct.pack("b",n)
    print(b,end=",")
  • 把从0-127的数字都封到字节里面

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 可以把数字转化成字节状态
    • 然后可以再把字节解码了

遍历结果

  • 好多的字节呀~

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 从字节状态可以看到已经有
    • 0、1、2、3
      • 这里很明显能看到0
      • 还有0前面的一堆符号
    • A、B、C
    • a、b、c
  • 还有
    • \r、\n、\t
    • 这是啥意思?
    • 怎么还能有两个字符呢?
    • 不管他
  • 先加上换行

换行

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 从0数到7
    • 换1行
    • 再从0数到7

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 隐约看到了ascii码的结构
    • 我不想看字节状态呢
      • 我想看字符状态
  • 需要对字节状态解码(decode)
    • 也就是解包
      • struct.unpack

解包

  • 这又是一圈
    • pack
    • unpack

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 解包出来是序号
  • 先把0-127的数字都变成字节

封包再解包

import struct
for n in range(0,127):
    b = struct.pack("b",n)
    c = struct.unpack("b",b)[0]
    print(chr(c),end="")
    if n % 16 == 0:
        print()
  • 依然要面对黑暗森林

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

封包再解码

import struct
for n in range(0,127):
    b = struct.pack("b",n)
    s = b.decode("ascii")
    print(s,end="")
    if n % 16 == 0:
        print()
  • 运行一下
  • 上面那片依然是全黑的?

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 和原来chr方法得到的结果差不多
  • 但是没有看到字符0
    • 仿佛被上面那片黑暗森林所吞没
    • 这可真可怕!
  • 我们先去总结一下吧

总结

  • struct包可以让我们使用封包格式
    • 把数字封包到字节里
      • pack函数就是封包
      • unpack函数就是解封
    • 我们通过封到不同字节的数字
      • 遍历了一次ascii码

oeasy瀵煎叆绱犳潗,oeasy缂栫▼鏁欏瑙嗛

  • 还是有那片黑色的区域
    • 好像是一片黑暗森林!
    • 那里面到底有些什么秘密?
  • 我们下次向黑暗森林区域进发!!
  • 去准备行装吧
  • 蓝桥->https://www.lanqiao.cn/teacher/3584
  • github->https://github.com/overmind1980/oeasy-python-tutorial
  • gitee->https://gitee.com/overmind1980/oeasypython
  • 视频->https://www.bilibili.com/video/BV1CU4y1Z7gQ 作者:oeasy