c get data from BMP
我发现自己正在编写一个简单的程序来从 bmp 文件中提取数据。我刚刚开始,我正处于 WTF 时刻之一。
当我运行程序并提供此图像时:http://www.hack4fun.org/h4f/sites/default/files/bindump/lena.bmp
我得到了输出:
1 2 3 4 5 | type: 19778 size: 12 res1: 0 res2: 54 offset: 2621440 |
实际图像大小为 786,486 字节。为什么我的代码报告 12 个字节?
中指定的标头格式,
http://en.wikipedia.org/wiki/BMP_file_format 匹配我的 BMP_FILE_HEADER 结构。那么为什么它会充满错误的信息呢?
图像文件似乎没有损坏,并且其他图像给出同样错误的输出。我错过了什么?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 | #include <stdio.h> #include <stdlib.h> typedef struct { unsigned short type; unsigned int size; unsigned short res1; unsigned short res2; unsigned int offset; } BMP_FILE_HEADER; int main (int args, char ** argv) { char *file_name = argv[1]; FILE *fp = fopen(file_name,"rb"); BMP_FILE_HEADER file_header; fread(&file_header, sizeof(BMP_FILE_HEADER), 1, fp); if (file_header.type != 'MB') { printf("ERROR: not a .bmp"); return 1; } printf("type: %i\ size: %i\ res1: %i\ res2: %i\ offset: %i\ ", file_header.type, file_header.size, file_header.res1, file_header.res2, file_header.offset); fclose(fp); return 0; } |
这里是十六进制的标题:
1 2 | 0000000 42 4d 36 00 0c 00 00 00 00 00 36 00 00 00 28 00 0000020 00 00 00 02 00 00 00 02 00 00 01 00 18 00 00 00 |
长度字段是字节36 00 0c 00`,按intel顺序;作为 32 位值处理,它是 0x000c0036 或十进制 786,486(与保存的文件大小匹配)。
可能您的 C 编译器将每个字段对齐到 32 位边界。启用包结构选项、编译指示或指令。
我可以在您的代码中找到两个错误。
第一个错误:您必须将结构打包为 1,因此每个类型的大小都正是其应有的大小,因此编译器不会将其对齐,例如 4 字节对齐。因此,在您的代码中,
1 2 3 4 5 6 7 8 9 | #pragma pack(1) typedef struct { unsigned short type; unsigned int size; unsigned short res1; unsigned short res2; unsigned int offset; } BMP_FILE_HEADER; |
现在它应该正确对齐了。
另一个错误在这里:
1 | if (file_header.type != 'MB') |
您正在尝试检查一个
为了解决这个问题,您可以将这 2 个字节分成 2 个 1 字节字符,它们是已知的(
1 | if (file_header.type != (('M' << 8) | 'B')) |
如果你看到这个表达式,就会发生这种情况:
1 | if (file_header.type != 0x4D42) |
那么你的代码应该可以工作了。