Convert float to string in positional format (without scientific notation and false precision)
我想打印一些浮点数,以便它们始终以十进制形式(例如
理想情况下,我想要的是结果是位置十进制格式的最短字符串,当转换为
众所周知,如果指数大于15或小于-4,则用科学计数法表示
1 2 3 | >>> n = 0.000000054321654321 >>> n 5.4321654321e-08 # scientific notation |
如果使用
1 2 | >>> str(n) '5.4321654321e-08' |
建议我可以将
1 2 | >>> format(0.00000005, '.20f') '0.00000005000000000000' |
它适用于该数字,尽管它有一些额外的尾随零。但是随后
1 2 | >>> format(0.1, '.20f') '0.10000000000000000555' |
如果我的电话号码是
1 2 | >>> format(4.5678e-20, '.20f') '0.00000000000000000005' |
因此,这些方法不符合我的要求。
这就引出了一个问题:用十进制格式打印任意浮点数,与
也就是说,例如将浮点值
在赏金期之后:似乎至少有2种可行的方法,正如Karin证明的那样,与我在Python 2上使用的初始算法相比,使用字符串操作可以显着提高速度。
从而,
-
如果性能很重要并且需要Python 2兼容性;或者如果
decimal 模块由于某种原因而无法使用,那么Karin使用字符串操作的方法就是这样做的方法。 - 在Python 3上,我稍短的代码也将更快。
由于我主要是在Python 3上进行开发,因此我将接受自己的回答,并奖励Karin。
不幸的是,似乎连
1 2 | >>> format(0.0000000005, 'f') '0.000000' |
但是,有一种技巧可以达到预期的效果-不是最快的,而是相对简单的:
-
首先使用
str() 或repr() 将浮点数转换为字符串 -
然后从该字符串创建一个新的
Decimal 实例。 -
Decimal.__format__ 支持提供所需结果的f 标志,并且与float s不同,它打印实际精度而不是默认精度。
因此,我们可以制作一个简单的效用函数
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | import decimal # create a new context for this task ctx = decimal.Context() # 20 digits should be enough for everyone :D ctx.prec = 20 def float_to_str(f): """ Convert the given float to a string, without resorting to scientific notation """ d1 = ctx.create_decimal(repr(f)) return format(d1, 'f') |
必须注意不要使用全局十进制上下文,因此将为此函数构造一个新的上下文。这是最快的方法。另一种方法是使用
现在,此函数返回带有尾数所有可能数字的字符串,四舍五入为最短的等效表示形式:
1 2 3 4 5 6 7 8 | >>> float_to_str(0.1) '0.1' >>> float_to_str(0.00000005) '0.00000005' >>> float_to_str(420000000000000000.0) '420000000000000000' >>> float_to_str(0.000000000123123123123123123123) '0.00000000012312312312312313' |
最后的结果四舍五入到最后一位
正如@Karin所指出的,
如果您对科学计数法的精度感到满意,那么我们可以采用简单的字符串操作方法吗?也许它不是非常聪明,但是它似乎可以工作(通过了您提供的所有用例),并且我认为这是可以理解的:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 | def float_to_str(f): float_string = repr(f) if 'e' in float_string: # detect scientific notation digits, exp = float_string.split('e') digits = digits.replace('.', '').replace('-', '') exp = int(exp) zero_padding = '0' * (abs(int(exp)) - 1) # minus 1 for decimal point in the sci notation sign = '-' if f < 0 else '' if exp > 0: float_string = '{}{}{}.0'.format(sign, digits, zero_padding) else: float_string = '{}0.{}{}'.format(sign, zero_padding, digits) return float_string n = 0.000000054321654321 assert(float_to_str(n) == '0.000000054321654321') n = 0.00000005 assert(float_to_str(n) == '0.00000005') n = 420000000000000000.0 assert(float_to_str(n) == '420000000000000000.0') n = 4.5678e-5 assert(float_to_str(n) == '0.000045678') n = 1.1 assert(float_to_str(n) == '1.1') n = -4.5678e-5 assert(float_to_str(n) == '-0.000045678') |
性能:
我担心这种方法可能太慢,因此我运行了
结果:
-
Python 2:使用
ctx.create_decimal() :2.43655490875 -
Python 2:使用字符串操作:
0.305557966232 -
Python 3:使用
ctx.create_decimal() :0.19519368198234588 -
Python 3:使用字符串操作:
0.2661344590014778
这是时间代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 | from timeit import timeit CODE_TO_TIME = ''' float_to_str(0.000000054321654321) float_to_str(0.00000005) float_to_str(420000000000000000.0) float_to_str(4.5678e-5) float_to_str(1.1) float_to_str(-0.000045678) ''' SETUP_1 = ''' import decimal # create a new context for this task ctx = decimal.Context() # 20 digits should be enough for everyone :D ctx.prec = 20 def float_to_str(f): """ Convert the given float to a string, without resorting to scientific notation """ d1 = ctx.create_decimal(repr(f)) return format(d1, 'f') ''' SETUP_2 = ''' def float_to_str(f): float_string = repr(f) if 'e' in float_string: # detect scientific notation digits, exp = float_string.split('e') digits = digits.replace('.', '').replace('-', '') exp = int(exp) zero_padding = '0' * (abs(int(exp)) - 1) # minus 1 for decimal point in the sci notation sign = '-' if f < 0 else '' if exp > 0: float_string = '{}{}{}.0'.format(sign, digits, zero_padding) else: float_string = '{}0.{}{}'.format(sign, zero_padding, digits) return float_string ''' print(timeit(CODE_TO_TIME, setup=SETUP_1, number=10000)) print(timeit(CODE_TO_TIME, setup=SETUP_2, number=10000)) |
从NumPy 1.14.0开始,您只能使用
1 2 3 4 5 6 7 8 | >>> numpy.format_float_positional(0.000000054321654321) '0.000000054321654321' >>> numpy.format_float_positional(0.00000005) '0.00000005' >>> numpy.format_float_positional(0.1) '0.1' >>> numpy.format_float_positional(4.5678e-20) '0.000000000000000000045678' |
如果您准备通过在浮点数上调用
1 2 3 4 5 6 7 | import decimal def float_to_string(number, precision=20): return '{0:.{prec}f}'.format( decimal.Context(prec=100).create_decimal(str(number)), prec=precision, ).rstrip('0').rstrip('.') or '0' |
它不包括全局变量,允许您自己选择精度。选择小数精度100作为
请注意,它仍然有其后果:
1 2 | >> float_to_string(0.10101010101010101010101010101) '0.10101010101' |
否则,如果精度很重要,则
1 2 3 4 5 6 | import decimal def float_to_string(number, precision=20): return '{0:.{prec}f}'.format( number, prec=precision, ).rstrip('0').rstrip('.') or '0' |
它不会丢失调用
1 2 3 4 5 6 7 8 9 10 11 12 | >> float_to_string(0.1, precision=10) '0.1' >> float_to_string(0.1) '0.10000000000000000555' >>float_to_string(0.1, precision=40) '0.1000000000000000055511151231257827021182' >>float_to_string(4.5678e-5) '0.000045678' >>float_to_string(4.5678e-5, precision=1) '0' |
无论如何,最大的小数位数是有限的,因为
1 2 | >> float_to_string(0.1, precision=10000) '0.1000000000000000055511151231257827021181583404541015625' |
另外,整数按原样格式化。
1 2 | >> float_to_string(100) '100' |
我认为
1 2 3 | a=5.4321654321e-08 '{0:.40f}'.format(a).rstrip("0") # float number and delete the zeros on the right # '0.0000000543216543210000004442039220863003' # there's roundoff error though |
让我知道这是否适合您。
有趣的问题,要增加更多的内容,这是一个比较@Antti Haapala和@Harold解决方案输出的测试:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 | import decimal import math ctx = decimal.Context() def f1(number, prec=20): ctx.prec = prec return format(ctx.create_decimal(str(number)), 'f') def f2(number, prec=20): return '{0:.{prec}f}'.format( number, prec=prec, ).rstrip('0').rstrip('.') k = 2*8 for i in range(-2**8,2**8): if i<0: value = -k*math.sqrt(math.sqrt(-i)) else: value = k*math.sqrt(math.sqrt(i)) value_s = '{0:.{prec}E}'.format(value, prec=10) n = 10 print ' | '.join([str(value), value_s]) for f in [f1, f2]: test = [f(value, prec=p) for p in range(n)] print '\t{0}'.format(test) |
在所有情况下,它们都不给出"一致"的结果。
- 使用Anti's,您会看到类似" -000"或" 000"的字符串
- 使用Harolds,您会看到类似''的字符串
我宁愿一致性,即使我牺牲一点速度。取决于您要针对用例进行哪些权衡。