关于 c：我应该读/写多少字节到一个套接字？

How many bytes should I read/write to a socket?

我对在 Unix 上通过 C 中的套接字写入/读取的字节数有些疑问。我习惯发送 1024 字节，但有时当我发送短字符串时，这真的太多了。

我从一个文件中读取一个字符串，我不知道这个字符串是多少字节，它每次都可以变化，可以是10、20或1000。我只知道它是< 1024。所以，当我编写代码时，我不知道在客户端读取的字节大小，(在服务器上我可以使用 strlen())。那么，无论我从文件中读取的字符串的长度如何，是始终读取最大字节数(在这种情况下为 1024)的唯一解决方案吗？

例如，使用以下代码：

1	read(socket,stringBuff,SIZE);

如果我想读取一个 10 字节的字符串，如果 SIZE 是 10 而不是 1024 会更好吗？

相关讨论

在您问题的代码中，如果只有 10 个字节要读取，那么 SIZE 是 10 个字节、1,024 个字节还是 1,000,024 个字节都没有区别 - 它仍然只会读取 10 个字节。唯一的区别是您为其预留了多少内存，如果您可以接收最多 1,024 字节的字符串，那么无论如何您都必须预留那么多内存。

但是，无论您尝试读入多少字节，您始终必须为 read() 实际读取不同数量的字节的可能性做好准备。特别是在网络上，当您在传输中遇到延迟时，即使您的服务器正在发送一个 1,024 字节的字符串，在您的客户端调用 read() 时到达的字节数也可能少于该字节数，在这种情况下，您将阅读小于 1,024。

因此，您必须随时准备好在多个 read() 调用中获取您的输入。这意味着您需要能够判断何时完成读取输入 - 您不能仅依靠 read() 已返回来告诉您您已完成的事实。如果您的服务器在您阅读第一条消息之前可能会发送多条消息，那么您显然不能指望依靠这一点。

您有三个主要选择：

始终发送相同大小的消息，必要时可能用零填充较小的字符串。这对于 TCP 流来说通常不是最理想的。只需阅读，直到您收到确切的字节数。

有某种哨兵机制来告诉你消息何时结束。这可能是换行符、CRLF、空行或一行上的一个点，后跟一个空行，或者任何适用于您的协议的内容。继续阅读，直到您收到此哨兵。为了避免一次对一个字符进行低效的系统调用，您需要实现某种缓冲机制以使其正常工作。如果您可以确定您的服务器正在向您发送以单个 '\
' 字符结尾的行，那么使用 fdopen() 和标准 C I/O 库可能是一种选择。

让您的服务器告诉您消息有多大(在初始固定长度字段中，或使用与第 2 点相同的哨兵机制)，然后继续阅读，直到您获得该字节数。

read() 系统调用阻塞，直到它可以读取一个或多个字节，或者直到发生错误。

它不保证它会读取您请求的字节数！使用 TCP 套接字时，read() 返回的值通常少于您的请求，这是很常见的，因为它无法返回仍在通过网络传播的字节。

所以，如果你没有得到你想要的一切，你将不得不检查 read() 的返回值并再次调用它以获取更多数据，一次又一次，直到你拥有一切。