关于image:如何在scikit-learn(计算机视觉)中使用我自己的数据集?

How can I work with my own dataset in scikit-learn (for computer vision)?

如何在SciKit学习中使用自己的数据集?SciKit教程始终以加载他的数据集为例(数字数据集、花数据集…)

http://scikit-learn.org/stable/datasets/index.htmlie:从sklearn.datasets导入加载

我有我的图像,我不知道如何创建新的。

特别是,首先,我使用我发现的这个示例(我使用library opencv):

1
2
3
4
5
6
7
8
9
10
11
12
img =cv2.imread('telamone.jpg')

# Convert them to grayscale
imgg =cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# SURF extraction
surf = cv2.SURF()
kp, descritors = surf.detect(imgg,None,useProvidedKeypoints = False)

# Setting up samples and responses for kNN
samples = np.array(descritors)
responses = np.arange(len(kp),dtype = np.float32)

我想提取一组图像的特征,以一种有用的方式实现机器学习算法!


您首先需要清楚地定义您要实现的目标:"以一种有用的方式将特性提取到一组图像中,以实现机器学习算法!"太模糊了,不能给你任何指导。

你想这样做吗?

  • 图片整体的图像分类(例如室内场景与室外场景)?

  • 对象识别(例如识别不同图片中同一对象的几个实例)在一组图片的子部分中,是否可以使用具有不同大小窗口的扫描程序?

  • 对象检测和基于类的分类(例如,在图片中查找所有出现的汽车或行人,并在这些类的每个出现的实例周围找到一个边界框)?

  • 全图语义分析A.K.A.像素分割+每个分段(建筑、道路、人、树)的类别分类…

每个任务都需要不同的管道(特征提取+机器学习模型组合)。

你应该从阅读一本关于这个主题的书开始,例如:http://szeliski.org/book/

另一方面,stackoverflow可能不是提出此类开放式问题的最佳场所。