关于C#：如何将长双打与qsort和NaN进行比较？

How to compare long doubles with qsort and with regard to NaN?

How to compare long doubles with qsort() and with regard to not-a-number?

号

在对可能包含非数字的数组进行排序时，我想将所有这些NAN放到已排序数组的一端。

qsort()对比较函数施加了一些限制。

The function shall return an integer less than, equal to, or
greater than zero if the first argument is considered to be respectively less than, equal to, or greater than the second.
C11dr §7.22.5.2 3

When the same objects ... are passed more than once to the comparison function, the results shall be consistent with one another. That is, for qsort they shall define a total ordering on the array, ... the same object shall always compare the same way with the key.
§7.22.5 4

号

当a <= b或a不是数字或b不是数字时，a > b是假的。因此，a > b与!(a <= b)不同，因为如果其中一个是NaN，则结果相反。

如果compare函数使用return (a > b) - (a < b);，如果一个或两个a或b都是NaN，则代码将返回0。数组不会按需要排序，它会丢失总的排序要求。

当使用诸如int isnan(real-floating x);或int isfinite(real-floating x);这样的分类函数时，这种类型的long double方面很重要。我知道isfinite( finite_long_double_more_than_DBL_MAX)可能返回错误。因此，我担心isnan(some_long_double)可能会做一些意想不到的事情。

我试过下面的。很明显，它是按需要分类的。

子问题：下面的compare()是否足够按需要排序？有什么建议的简化吗？如果不是-如何修复？(对于此任务，可以对0.0升和-0.0升这样的值进行任何排序)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42

#include <math.h>
#include <stdio.h>
#include <stdlib.h>
#include <float.h>

int compare(const void *a, const void *b) {
const long double *fa = (const long double *) a;
const long double *fb = (const long double *) b;
if (*fa > *fb) return 1;
if (*fa < *fb) return -1;

if (*fa == *fb) {
//return -memcmp(fa, fb, sizeof *fa); if -0.0, 0.0 order important.
return 0;
}
// At least one of *fa or *fb is NaN
// is *fa a non-NaN?
if (!isnan(*fa)) return -1;
if (!isnan(*fb)) return 1;

// both NaN
return 0;
// return -memcmp(fa, fb, tbd size); if NaN order important.
}

int main(void) {
long double x[] = { 0.0L / 0.0, 0.0L / 0.0, 0.0, 1.0L / 0.0, -0.0, LDBL_MIN,
LDBL_MAX, 42.0, -1.0L / 0.0, 867-5309, -0.0 };
x[0] = -x[0];
printf("unsorted:");
size_t n = sizeof x / sizeof x[0];
for (size_t i = 0; i < n; i++) {
printf("%.3Le,", x[i]);
}
printf("
sorted:");
qsort(x, n, sizeof x[0], compare);
for (size_t i = 0; i < n; i++) {
printf("%.3Le,", x[i]);
}
puts("");
}

产量

1 2	unsorted: nan,-nan,0.000e+00,inf,-0.000e+00,3.362e-4932,1.190e+4932,4.200e+01,-inf,-4.442e+03,-0.000e+00, sorted: -inf,-4.442e+03,-0.000e+00,0.000e+00,-0.000e+00,3.362e-4932,4.200e+01,1.190e+4932,inf,nan,-nan,

号

如果我知道比较函数是正确的，我会在代码评审上发布改进意见。然而，我对代码与那些讨厌的nan一起正常工作还没有足够的信心。

相关讨论

检查NaN ness的数字；如果一个是NaN，而另一个不是，则报告NaN较小(或较大，取决于排序方向和NaN出现的位置)。假设他们都是Nan，返回0。否则，NAN也不是，您可以通过适当的比较来处理它们。如果您认为nan中有不同的值，那么您必须对nan进行特征化，并根据您选择的规则生成有效的比较。请注意，对Nanness的检查应该是第一个，而不是最后一个。
这个代码直接检查浮点数是否相等。根据传入的内容，这可能会导致对假定相等但无法表示相同精确值的数字产生"有趣"的结果。当心。
@迈克尔德器官：如果你认为两个"假定相等"的数字不能代表相同的数字，我认为你要么是错的，要么是错的。
我看到浮点数上的相等检查，我的眉毛向上。根据使用方式的不同，可能会很好，也可能不会。这是我的担心。
@在本代码中，两个不同的NAN可以比较相等-它们将以某种顺序出现在排序列表中。返回0不会违反&167；7.22.5 4。
如果您需要NAN的总订购量，只需使用memcmp。
@Jonathanleffler"检查Nan ness的数字"；是的，你建议怎么做？江户十一〔一〕号？或isnan(some_long_double)。有什么不知名的哥查也在做吗？
@ R.。使用memcmp的NAN上的总排序似乎是合理的，但使用12或16字节内存的80位long double时，我应该得到稳定的结果，但在排序时不清楚，或者如果由于填充而出现其他问题。也许在这种情况下使用10而不是sizeof *x就足够了？
@楚克斯：我会用isnan()，但我的要求不是很严格，所以我想认识不同类型的nan。我知道信令和非信令NaN；我相信有许多位模式代表NaN。但我从来没有必要对它们进行足够详细的研究，以了解isnan()表面下的情况。关键的一点是，如果数组中有两个元素，比如x[10]和x[30]，那么比较x[10]和x[30]应该产生与比较x[30]和x[10]一致的结果。如果一个是负的，另一个必须是正的，或者两者都是零。
@是的，最后一部分是最重要的，如果一个是负的，(另一个)必须是正的，或者两者都为零。对于这种情况，NaN的顺序并不重要，只是它们位于排序数组的末尾——这简化了代码。订购NaN似乎只对memcmp()合理。
@jonathanlefler：在IEEE754二进制浮点中，指数字段的最大值被指定为无穷大和NaN。如果有效位字段全部为零，则为&177；∞。否则，它是一个NaN。所以nan的个数等于可能的符号和有效位字段值的个数减去2。
我的clang和gcc都没有在-nan中打印减号，如当前输入和输出所示。我应该担心吗？
为什么不在排序之前从数组中删除nan？即使您可以在nan存在的情况下进行排序，任何后续的代码都需要以某种方式处理它们的存在——而且这些选项只不过是忽略、丢弃或抱怨。删除nan允许随后的代码假定它们不存在，也就是说，不需要检查。
@USR2564301：您的C实现没有打印NAN的符号这一事实并不值得关注。
@埃里克：谢谢。关于IEEE754和Nan的维基百科解释的比我需要知道的更多。

这只是对您的测试进行简单的重新排序，但是如果您愿意的话，它会使NaN的状态更加清晰。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

int compare(const void *a, const void *b)
{
const long double fa = *(const long double *) a;
const long double fb = *(const long double *) b;

if (isnan(fa))
{
if (isnan(fb))
{
return 0;
}
return 1;
}
if (isnan(fb))
{
return -1;
}
if (fa > fb) return 1;
if (fa < fb) return -1;

/* no more comparisons needed */
return 0;
}

由于EDOCX1[0]的测试在顶部，不应通过任何NAN，因此可以安全地用您的

1	return (a > b) - (a < b);

号

除了讨论不同类型的NaN(听起来有点像CPU核心上可以跳多少天使舞)，这应该足够稳定，以满足您的目的，我看不到任何可能的问题与此代码。

对于clang，-ffast-math和-fdenormal-fp-math=[ieee|preserve-sign|positive-zero]都不会产生其他结果。GCC也没有与-ffast-math合作，-funsafe-math-optimizations甚至-ffinite-math-only(后者最有可能是因为除了直接比较NaN外，没有其他操作)。

为了完成，我用EDCOX1，9和EDCOX1，10(来自C++ EDCOX1，11)进行测试，同样，排序顺序没有差异。

相关讨论

NAN测试

1	int isnan(real-floating x);

The isnan macro determines whether its argument value is a NaN. First, an argument represented in a format wider than its semantic type is converted to its semantic type. Then determination is based on the type of the argument.235
235 For the isnan macro, the type for determination does not matter unless the implementation supports NaNs in the evaluation type but not in the semantic type.

号

除了在一个罕见的平台上，isnan(some_long_double)将按预期工作。

int isunordered(real-floating x, real-floating y)的行为与isnan()的行为相似，因此预期它能解释这两个论点。

在许多平台上，代码可以使用(a == a)作为候选NaN测试，因为当a为NaN时，该测试评估为0，否则评估为1。不幸的是，除非实现定义了__STDC_IEC_559__，否则这不一定有效。

比较>=, >, <, <=和c11 7.12.14比较宏

如果至少有一个操作数是NaN，则使用>=, >, <, <=可能导致"无效"浮点异常。因此，之前对NaN的测试是谨慎的，正如@usr2564301所回答的那样。

C提供宏isgreaterequal(), isgreaterequal(), isless(), islessthna()，用于比较，而不是提高"无效"浮点值。例外。这对于double是一个很好的选择，但是宏使用的是一个真正的浮动，这可能与long double不同。isgreater(long_double_a, long_double_a)可作为double进行评价，但不能提供所需的比较结果。

宏分类的挑战在于语义类型可能比long double窄。

以下使用了上述思想，正如我所读到的，C规范对于除少数情况外的所有情况都是定义良好且功能正确的：当long double具有nan但不是真正的浮动(通常double)没有。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

#include <math.h>

// compare 2 long double. All NaN are greater than numbers.
int compare(const void *a, const void *b) {
const long double *fa = (const long double *) a;
const long double *fb = (const long double *) b;

if (!isunordered(*fa, *fb)) {
return (*fa > *fb) - (*fa < *fb);
}

if (!isnan(*fa)) {
return -1;
}
return isnan(*fb); // return 0 or 1
}

。

注意：在阅读了许多好的评论并学习了很多之后，我会按照"我能回答我自己的问题吗？"中的规定发布这个自我回答。除了接受另一个答案。