Python Pandas全局vs传递变量

Python Pandas global vs passed variable

我正在创建一个"实时"过程，它从SierraChart正在更新的专有格式的ohlcvtba文件中获取数据。读取数据并使用生成器创建数据帧的代码发布在Pastebin上。

我已经意识到我的结构(新的数据驱动)是错误的，我将重新组织它。phe的问题和wes的回应使我朝着填充一个工作良好的预填充数据帧的方向发展。我的问题是：

将数据帧和指针保存为全局变量还是将它们传递给使用它们的各种函数或从中传递它们更快？此外，是否还有其他因素可以推动这一选择？

谢谢。

局部变量比Python中的全局变量访问速度更快。

在panda的上下文中，这意味着您应该将变量传递到有意义的函数中(这意味着可以在函数中更快地找到它们)。相反，python中的函数调用很昂贵(如果您大量调用它们的话)，这就是numpy/pandas在可能的情况下使用向量化函数的原因。显然，如果在函数内执行操作，则必须小心确保所有计算都是就地完成的。

在担心速度之前，我通常会先用"Python式的"/"泛滥成灾的"方式让事情运转起来。然后使用%timeit，看看它是否已经足够快了(通常是这样)。添加UnitTest。调整速度，EDOCX1(0%)，修剪和%timeit更多。如果这是一个大项目，vbench。