Моя реальная проблема связана с записью того, какое из очень большого количества антивирусных продуктов соглашается с тем, что данный образец является членом данного семейства антивирусов. База данных содержит миллионы выборок, при этом на каждый образец голосуют десятки антивирусных продуктов. Я хочу задать такой запрос, как "Для вредоносного ПО, содержащего имя" XYZ ", на выбор которого было больше всего голосов, и какие производители проголосовали за него?" и получить результаты вроде:
"BadBadVirus"
V1 V2 V3 V4 V5 V6 V7
Sample 1 - 4 votes 1 0 1 0 0 1 1
Sample 2 - 5 votes 1 0 1 0 1 1 1
Sample 3 - 5 votes 1 0 1 0 1 1 1
total 14 3 3 2 3 3
Что может быть использовано, чтобы сказать мне, что Vendor 2 и Vendor 4 либо не знают, как для обнаружения этого вредоносного ПО, или что они называют его чем-то другим.
Я попытаюсь немного обобщить свой вопрос, надеясь, что не нарушу вашу способность помочь мне. Предположим, что у меня есть пять избирателей (Алекс, Боб, Кэрол, Дэйв, Эд), которых попросили посмотреть пять фотографий (P1, P2, P3, P4, P5) и решить, что такое "основной предмет" фотографии. Для нашего примера мы просто предположим, что они были ограничены "Cat", "Dog" или "Horse". Не каждый избиратель голосует за каждую вещь.
Данные находятся в базе данных в этой форме:
Photo, Voter, Decision
(1, 'Alex', 'Cat')
(1, 'Bob', 'Dog')
(1, 'Carol', 'Cat')
(1, 'Dave', 'Cat')
(1, 'Ed', 'Cat')
(2, 'Alex', 'Cat')
(2, 'Bob', 'Dog')
(2, 'Carol', 'Cat')
(2, 'Dave', 'Cat')
(2, 'Ed', 'Dog')
(3, 'Alex', 'Horse')
(3, 'Bob', 'Horse')
(3, 'Carol', 'Dog')
(3, 'Dave', 'Horse')
(3, 'Ed', 'Horse')
(4, 'Alex', 'Horse')
(4, 'Bob', 'Horse')
(4, 'Carol', 'Cat')
(4, 'Dave', 'Horse')
(4, 'Ed', 'Horse')
(5, 'Alex', 'Dog')
(5, 'Bob', 'Cat')
(5, 'Carol', 'Cat')
(5, 'Dave', 'Cat')
(5, 'Ed', 'Cat')
Цель состоит в том, что с учетом темы фото, которую мы ищем, мы хотели бы знать, сколько избирателей считало, что БЫЛО главное в этой фотографии, но также и список, КОТОРЫЕ ИЗБИРАТЕСЬ думали об этом.
Query for: "Cat"
Total Alex Bob Carol Dave Ed
1 - 4 1 0 1 1 1
2 - 3 1 0 1 1 0
3 - 0 0 0 0 0 0
4 - 1 0 0 1 0 0
5 - 4 0 1 1 1 1
------------------------------------
total 12 2 1 4 3 2
Query for: "Dog"
Total Alex Bob Carol Dave Ed
1 - 1 0 1 0 0 0
2 - 2 0 1 0 0 1
3 - 1 0 0 1 0 0
4 - 0 0 0 0 0 0
5 - 1 1 0 0 0 0
------------------------------------
total 5 1 2 1 0 1
Я что-то могу сделать с данными в том формате, который я сохранил?
Мне сложно получить запрос, который делает это - хотя это достаточно просто, чтобы выгрузить данные, а затем написать программу для этого, я бы очень хотел, чтобы это можно было сделать в БАЗЕ ДАННЫХ, если я могу.
Спасибо за любые предложения.