Я хочу создать классификатор одежды, который снимает предмет одежды и классифицирует его как "джинсы", "платье", "тренеры" и т.д.
Некоторые примеры:
Эти изображения находятся на веб-сайтах розничной торговли, поэтому они обычно берутся под одним углом, как правило, на белом или бледном фоне - они, как правило, очень похожи.
У меня есть набор из нескольких тысяч изображений, категория которых я уже знаю, которые я могу использовать для обучения алгоритму машинного обучения.
Однако я борюсь за идеи о том, какие функции я должен использовать. Возможности, которые у меня есть до сих пор:
def get_aspect_ratio(pil_image):
_, _, width, height = pil_image.getbbox()
return width / height
def get_greyscale_array(pil_image):
"""Convert the image to a 13x13 square grayscale image, and return a
list of colour values 0-255.
I've chosen 13x13 as it very small but still allows you to
distinguish the gap between legs on jeans in my testing.
"""
grayscale_image = pil_image.convert('L')
small_image = grayscale_image.resize((13, 13), Image.ANTIALIAS)
pixels = []
for y in range(13):
for x in range(13):
pixels.append(small_image.getpixel((x, y)))
return pixels
def get_image_features(image_path):
image = Image.open(open(image_path, 'rb'))
features = {}
features['aspect_ratio'] = get_aspect_ratio(image)
for index, pixel in enumerate(get_greyscale_array(image)):
features["pixel%s" % index] = pixel
return features
Я извлекаю простую сетку серого серого 13х13 как грубое приближение формы. Howerver, используя эти функции с nltk NaiveBayesClassifier
, получает только 34% точности.
Какие функции будут работать здесь?