Different size of array after fit_transform
我的
1 2 3 4 5 6 7 8 9 10 11 12 | In [5]: X.shape, test.shape Out[5]: ((1000, 1932), (1000, 1932)) In [6]: from sklearn.feature_selection import VarianceThreshold sel = VarianceThreshold(threshold=(.8 * (1 - .8))) features = sel.fit_transform(X) features_test = sel.fit_transform(test) In [7]: features.shape, features_test.shape Out[7]:((1000, 1663), (1000, 1665)) |
upd:哪种转换可以帮助我获得相同大小的数组?
这是因为你要安装两次选择开关。
首先,请注意,
因为
请看sklearn和http://scikit-learn.org/stable/modules/feature_extraction.html中的"transform"和"fit_transform"的区别。