SREC、Hex、Bin等烧录文件格式完全解读

注:本文首发于“嵌入式软件实战派”公众号,关注该公众号可获得更多精品干货。

1. 关于烧录文件

在典型的应用程序中,编译器或汇编器将程序的源代码(例如C或汇编语言)转换为机器代码,并将其输出到一个文件中。然后,这个文件由程序员导入,以将机器代码“烧录”到ROM(或Flash Memory)中,或传输到目标系统以进行加载和执行。

这个存放机器码的文件就是烧录文件,它是用来烧录到微控制器(如MCU、EEPROM、NOR/NAND Flash等)里面的flash memory里面的一个程序文件。烧录文件可以有很多种格式,如bin、Hex,S19等。以下对这几种文件格式做完全解析。

2. Bin文件

这种文件格式最简单最直接,直接存储flash memory的raw data。Bin文件有其优点和缺点——简单直接,是优点也是缺点。

因为其里面存储的是raw data,所以,我们可以直接通过文件地址就找到对应memory地址的内容。其缺点呢?正因为其文件地址跟memory地址对应,文件地址是连续的,所以,如果memory地址如果是一个很大的数值(例如0xFFB0000),memory在IC上的地址空间不连续的话,那就非常麻烦。

也许你会说,将空白的地方填0x00或者0xFF啊,那你得想想这个bin文件得多大了。

  • 优点:简单,直接,文件内容地址跟memory内容地址一一对应,非常直观;

  • 缺点:地址连续,无法跨空间,而且是二进制,需要特殊工具查看内容。

面对这个问题,那么SREC、HEX等文件格式就登场了。

3. HEX文件

本文讨论的HEX,指的是Intel-HEX,它是由Intel制定的格式。

Intel Hex的描述

Intel HEX由ASCII文本行组成,这些行由换行符或回车符或两者分隔。每个文本行均包含编码多个二进制数字的十六进制字符。二进制数可以表示数据,内存地址或其他值,这取决于它们在行中的位置以及行的类型和长度。每个文本行都称为一条记录(record)。

Intel Hex的格式这个record包含6部分内容,其格式是这样的:

record示例: :020000021200EA

格式 Start code Byte count Address Record type Data Checksum
示例 : 02 0000 02 1200 EA
  1. Start code, 1个字符,是ASCII的冒号 ':'.

  2. Byte count, 2个hex数字, 表示这个record的data区有几个字节 (hex数字对)。最大值是255 (0xFF). 16 (0x10)32 (0x20)是最常用的。

  3. Address, 4个hex数字, 表示Memory数据开始16-bit地址偏移。物理地址通常是有这个偏移加上基地址。基地址默认是0,可以通过各种类型的record来更改。基地址和地址偏移通常是一个大端的数值。

  4. Record type , 2个hex数字, 00 ~ 05, 表示不同数据段的含义。

  5. Data, 一系列data, 表示为 2n 个hex数字,具体内容取决于实际应用数据。

  6. Checksum, 2个hex数字, 以校验这段record内容。

Intel Hex的Checksum直接用例子解释吧:

record示例: :0300300002337A1E数据和为:03 + 00 + 30 + 00 + 02 + 33 + 7A = E2,这个E2的补码是1E,即这个数据record的补码。

文本行的结束符

Hex文件中,一行记录一个record,所以一个record后面跟这个结束符,即行结束符(可简单理解为换行符),这取决于系统环境,例如Linux用一个LF(即0A),而Windows的是CR LF(0D 0A)。

Record类型

有6种(00~05)标准类型:

Hex编码 类型 描述 示例
00 Data 数据段, 为数据和16 bit起始地址 :0B0010006164647265737320676170A7
01 End Of File 结束行,一般为文件的最后一行,数据区一般为空 :00000001FF
02 Extended Segment Address 数据字段包含与80x86实模式寻址兼容的16位段基址(因此字节数为02)。地址字段(通常为0000)将被忽略。 :020000021200EA
03 Start Segment Address 对于80x86处理器,请指定CS:IP寄存器的初始内容。地址字段是0000,字节数是04,前两个字节是CS值,后两个字节是IP值。 :0400000300003800C1
04 Extended Linear Address 允许32位寻址(最大4GiB)。地址字段将被忽略(通常为0000),字节数始终为02。 :02000004FFFFFC
05 Start Linear Address 地址字段是0000(未使用),字节数是04。这四个数据字节代表加载到80386及更高版本CPU的EIP寄存器中的32位值。 :04000005000000CD2A

看看一个hex文件长什么样:

这个hex的实际内容是:

从中可以看到,地址并非一定要从0x0000开始的。

名称格式

有时会使用特殊名称来表示使用记录类型的特定子集的HEX文件的格式。例如:

  1. I8HEX 文件只用了 record types 00 and 01 (16 bit addresses)

  2. I16HEX 文件只用了 record types 00 through 03 (20 bit addresses)

  3. I32HEX 文件只用了 record types 00, 01, 04, and 05 (32 bit addresses)

4. SREC文件

SREC的描述这个SREC跟Hex格式类似,它是由Motorola制定的,一般也叫Motorola S-Record。这种格式通常就是我们平时见的SRECORD, SREC, S19, S28, S37。SREC的文件后缀有好多种,例如:.s19, .s28, .s37, .s, .s1, .s2, .s3, .sx, .srec, .mot

SREC的格式

示例: S1137AF00A0A0D0000000000000000000000000061

S Type Byte Count Address Data Checksum
S 1 13 7AF0 0A0A0D00000000000000000000000000 61

一个SREC格式文件由一系列ASCII文本记录组成。记录从左到右具有以下结构:

  1. Record type,两个字符,一个大写的“ S”(0x53),然后是一个数字0到9,定义了记录的类型。

  2. Byte count,两个十六进制数字,表示记录的其余部分(地址+数据+校验和)后面的字节数(十六进制数字对)。对于16位地址字段,此字段的最小值为3,另加1个校验和字节,最大值为255(0xFF)。

  3. Address,由记录类型决定的四/六/八十六进制数字。地址字节按大端格式排列。

  4. Data(2n个十六进制数字的序列),用于数据的n个字节。对于S1 / S2 / S3记录,每条记录通常最多32个字节,因为它适合80字符宽的终端屏幕,尽管16字节将更容易从视觉上解码特定地址的每个字节。

  5. Checksum,两个十六进制数字,是字节计数,地址和数据字段的两个十六进制数字对表示的值之和的最低有效字节的补码。有关详细的校验和示例,请参见示例部分。

文本行的结束符

跟Hex文件的类似。此处不累述。

Record类型

下表描述了10种可能的S记录。S4是保留的,当前未定义。S6最初是保留的,但后来在某个时候重新定义。

Record Field Record Purpose Address Field Data Field Record Description
S0 Header 16-bit "0000" 该记录包含特定于供应商的ASCII文本,表示为一系列十六进制数字对。通常以空终止字符串的格式查看此记录的数据。
S1 Data 16-bit Address 该记录包含以16位地址字段开头的数据。该记录通常是 用于8位微控制器,例如AVR,PIC,8051、68xx,6502、80xx,Z80。
S2 Data 24-bit Address 该记录包含以24位地址开头的数据。
S3 Data 32-bit Address 该记录包含以32位地址开头的数据。此记录通常用于 适用于32位微控制器,例如ARM和680x0。
S4 Reserved N/A N/A 保留字段
S5 Count 16-bit Count × 此可选记录包含 S1 / S2 / S3记录的16位计数。
S6 Count 24-bit Count × 此可选记录包含S1 / S2 / S3记录的24位计数。
S7 Start Address (Termination) 32-bit Address × 该记录包含一个32位地址的起始执行位置。
S8 Start Address (Termination) 24-bit Address × 该记录包含24位地址处的起始执行位置。
S9 Start Address (Termination) 16-bit Address × 该记录在16位地址处包含开始执行位置。

Record顺序尽管某些Unix文档指出“文件中S记录的顺序无关紧要,并且可以假定没有特定顺序”,实际上,大多数软件都对SREC记录进行了排序。典型的记录顺序以(有时是可选的)S0头记录开始,以一个或多个S1 / S2 / S3数据记录的序列继续,可能具有一个可选的S5 / S6计数记录,并以一个合适的S7 / S8 / S9终止记录。

  • S19-style 16-bit address records

  1. S0

  2. S1 (one or more records)

  3. S5 (optional record)

  4. S9

  • S28-style 24-bit address records

  1. S0

  2. S2 (one or more records)

  3. S5 (optional record)

  4. S8

  • S37-style 32-bit address records

  1. S0

  2. S3 (one or more records)

  3. S5 (optional record)

  4. S7

SREC的Checksum

示例: S1137AF00A0A0D0000000000000000000000000061

相加13 + 7A+F0 + 0A+0A+0D+00+00+00+00+00+00+00+00+00+00+00+00+00 = 19E(hex) 掩码:保留总数的最低有效字节= 9E(hex)。

补码:计算最低有效字节的补码= 61(hex)。

我们来看看一个完整的SREC文件是怎样的:

这个SREC的实际内存内容是:

值得一提的是,SREC文件里面有个S0段,这个段的内容不是存放Memory有效数据的,而是一个文件头信息,可以存一些如这个文件的长度、校验码等。在做软件发布和升级文件的时候,这个内容非常有用。

5. 烧录文件的实际应用

通过IDE编译生成文件直接烧录就可以了,学习这些文件格式有什么用?

  1. 合并和拆分文件在做MCU的升级功能的时候,往往有两个工程,会生成两个烧录文件。在仿真调试的时候,要烧录两个文件很不方便,在发布软件的时候,发两个烧录文件也不好管理。那么你可以根据这些文件格式要求,将文件合并在一切。如果有一个比较大的文件,存放不同的内容,你也可以将这个大文件拆分成两个或多个。

  2. 在原来文件上添加附加信息升级文件往往是从一个特殊固定的地址开始,也就是说升级文件是量身定做的。不管bin还是s19文件,我们都可以在文件上附加一些头信息。例如对于bin文件,可以在前面128个字节中存放一些诸如CRC32,Length等信息,以方便升级程序的解析。

  3. 空白处填充特定内容Hex文件和Srec文件中,是允许有空隙的,即某些地址是没有内容的。对于实际的Memory来说,这个空隙有可能默认是0xFF(如ARM系列的STM32),但也有是随机的(如小日本Renesas的RH850)。所以,在需要的情况下,我们可以给这些空隙填充0xFF或者0x00,方便日后做处理,例如做Checksum校验。

  4. 文件校验在软件发布之前,我们可以通过计算这个烧录文件,已获得其校验值(如CRC/XOR/SUM等),以校验烧录到实际物理地址的内容是否正确。这就需要知道其具体文件格式再能进行。

6. 烧录文件处理软件

通过上面章节,文件格式我们是了解了,怎么才能做一个文件处理程序呢,或者有没有现成的工具可以使用?

1. 自己动手写一个

根据实际需要的功能要求,自行实现一个软件或者脚本程序。实际上,写一个这样的程序并不难,因为其格式也不复杂。对于MCU里面的升级程序,往往需要解析这样的hex文件或者srec文件格式,也是需要实现这个文件解析的。网上也有很多这样的例子。对于网上的例子,建议多验证多测试。

2. 使用SRecord

这个软件功能非常强大,它是用C/C++写的,很多其他软件都引用它,例如keil也有使用这个工具BIN2MOT。

The SRecord package is a collection of powerful tools for manipulating EPROM load files. I wrote SRecord because when I was looking for programs to manipulate EPROM load files, I could not find very many. The ones that I could find only did a few of the things I needed. SRecord is written in C++ and polymorphism is used to provide the file format flexibility and arbitrary filter chaining. Adding more file formats and filters is relatively simple.

SRecord支持非常多的文件格式,你想的到的你想不到的都支持(多达40种格式):Ascii-HexASMAtmel GenericBASICBinaryB-RecordCIntel-HexMotorola-Record……

实际上,它只有三板斧:srec_catsrec_cmpsrec_info

The primary tools of the package are srec_cat and srec_cmp. All of the tools understand all of the file formats, and all of the filters.

Name Description
srec_cat The srec_cat program may be used to catenate (join) EPROM load files, or portions of EPROM load files, together. Because it understands all of the input and output formats, it can also be used to convert files from one format to another.
srec_cmp The srec_cmp program may be use to compare EPROM load files, or portions of EPROM load files, for equality.
srec_info The srec_info program may be used to print summary information about EPROM load files.

这个不但有Windows的程序点击链接下载(https://sourceforge.net/projects/srecord/files/srecord-win32/1.64/),还开放了源码点击链接下载(https://sourceforge.net/projects/srecord/files/srecord/1.64/),里面的实现是非常值得我们学习的。

更多内容详见:http://srecord.sourceforge.net

2.1 使用IntelHex

IntelHex是用Python写的,如其名字,专门用来处理Intel-Hex文件,当然也可以处理bin文件。其用法非常简单。

安装

1
 pip install intelhex

读数据

1
2
3
4
5
 >>> from intelhex import IntelHex>>> ih = IntelHex()                     # create empty object
 >>> ih.loadbin('foo.bin')               # load from bin
 >>> ih.fromfile('bar.bin',format='bin') # also load from bin
 >>> ih.loadbin('baz.bin',offset=0x1000) # load binary data and place them
 >>>                                     # starting with specified offset

写数据

1
2
3
4
5
6
7
8
 >>> from cStringIO import StringIO
 >>> from intelhex import IntelHex
 >>> ih = IntelHex()
 >>> ih[0] = 0x55
 >>> sio = StringIO()
 >>> ih.write_hex_file(sio)
 >>> hexstr = sio.getvalue()
 >>> sio.close()

合并文件

1
2
 >>> original = IntelHex("foo.hex")
 >>> new = IntelHex("bar.hex")>>> original.merge(new[0x0F:0x3F])

还有几个现成的script给你使用

  • Script hex2bin.py

  • Script bin2hex.py

  • Script hex2dump.py

  • Script hexmerge.py

  • Script hexdiff.py

  • Script hexinfo.py

更多内容详见:https://python-intelhex.readthedocs.io/en/latest

2.2 使用bincopy

也是Python实现的,但功能比Intelhex更强大点

Mangling of various file formats that conveys binary information (Motorola S-Record, Intel HEX, TI-TXT and binary files).Project homepage: https://github.com/eerimoq/bincopyDocumentation: https://bincopy.readthedocs.io

安装

1
 pip install bincopy

使用

直接看个例子比较好理解

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
 >>> import bincopy>>> f = bincopy.BinFile("tests/files/in.hex")
 >>> print(f.as_ihex())
 :20010000214601360121470136007EFE09D219012146017E17C20001FF5F16002148011979:20012000194E79234623965778239EDA3F01B2CA3F0156702B5E712B722B7321460134219F:00000001FF
 
 >>> print(f.as_srec())
 S32500000100214601360121470136007EFE09D219012146017E17C20001FF5F16002148011973
 S32500000120194E79234623965778239EDA3F01B2CA3F0156702B5E712B722B73214601342199
 S5030002FA
 
 >>> print(f.as_ti_txt())
 @0100
 21 46 01 36 01 21 47 01 36 00 7E FE 09 D2 19 01
 21 46 01 7E 17 C2 00 01 FF 5F 16 00 21 48 01 19
 19 4E 79 23 46 23 96 57 78 23 9E DA 3F 01 B2 CA
 3F 01 56 70 2B 5E 71 2B 72 2B 73 21 46 01 34 21
 q
 
 >>> f.as_binary()
 bytearray(b'!F\x016\x01!G\x016\x00~\xfe\t\xd2\x19\x01!F\x01~\x17\xc2\x00\x01\xff_\x16\x00!H\x01\x19\x19Ny#F#\x96Wx#\x9e\xda?\x01\xb2\xca?\x01Vp+^q+r+s!F\x014!')
 
 >>> list(f.segments)
 [Segment(address=256, data=bytearray(b'!F\x016\x01!G\x016\x00~\xfe\t\xd2\x19\x01!F\x01~\x17\xc2\x00\x01\xff_\x16\x00!H\x01\x19\x19Ny#F#\x96Wx#\x9e\xda?\x01\xb2\xca?\x01Vp+^q+r+s!F\x014!'))]
 
 >>> f.minimum_address
 256
 >>> f.maximum_address
 320
 >>> len(f)
 64
 >>> f[f.minimum_address]
 33
 >>> f[f.minimum_address:f.minimum_address + 1]
 bytearray(b'!')

更多内容详见:https://bincopy.readthedocs.io/en/latest/

2.3 其他的

  • BIN2MOT(), BINARY to Motorola S-Record file converter utility.(http://www.keil.com/download/docs/4.asp)

  • SRecordizer is a tool for viewing, editing, and error checking S19 format files.(http://srecordizer.codeplex.com/)

  • binex - a converter between Intel HEX and binary for Windows.(http://www.nlsw.nl/software/)

  • libgis, open source C library that converts Intel HEX, Motorola S-Record, Atmel Generic files.(https://github.com/vsergeev/libGIS)

  • kk_srec is a C library and program for reading the SREC format.(https://github.com/arkku/srec)

本文参考:

  • Wikipedia-SREC (File format)(https://en.wikipedia.org/wiki/SREC_(file_format))

  • Wikipedia-Intel Hex(https://en.wikipedia.org/wiki/Intel_HEX)