Должен ли я использовать конкатенацию моих строковых полей в качестве хеш-кода?

У меня есть класс Address в С#, который выглядит так:

public class Address
{            
    public string StreetAddress { get; set; }
    public string RuralRoute { get; set; }
    public string City { get; set; }
    public string Province { get; set; }
    public string Country { get; set; }
    public string PostalCode { get; set; }
}

Я выполняю равенство и поэтому мне нужно переопределить хэш-код. Сначала я собирался использовать формулу hashcode от EJ, но потом я подумал: все это строковые поля, не могу ли я просто использовать StringBuilder для их конкатенации и вернуть хеш-код из этой строки?

То есть:

var str = new StringBuilder();
str.Append(StreetAddress)
   .Append(RuralRoute)
   ...

return str.ToString().GetHashCode();

Каковы преимущества/недостатки этого? Почему я не должен это делать?

Ответ 1

Я бы избегал делать это просто на том основании, что он создает пучок строк бессмысленно - хотя пункт Kosi2801 о том, чтобы сделать столкновение простым, также имеет значение. (Я подозреваю, что на самом деле не создаст много столкновений из-за природы полей, но...)

Я хотел бы использовать алгоритм "простой и простой в использовании", который я ранее использовал в этом ответе (спасибо за то, что посмотрел на него:) - и который указан в "Эффективной Java", как вы сказали. В этом случае это будет выглядеть следующим образом:

public int GetHashCode()
{
    int hash = 17;
    // Suitable nullity checks etc, of course :)
    hash = hash * 23 + StreetAddress.GetHashCode();
    hash = hash * 23 + RuralRoute.GetHashCode();
    hash = hash * 23 + City.GetHashCode();
    hash = hash * 23 + Province.GetHashCode();
    hash = hash * 23 + Country.GetHashCode();
    hash = hash * 23 + PostalCode.GetHashCode();
    return hash;
}

Это небезопасно, конечно. Если вы используете С# 3, вы можете рассмотреть метод расширения:

public static int GetNullSafeHashCode<T>(this T value) where T : class
{
    return value == null ? 1 : value.GetHashCode();
}

Затем вы можете использовать:

public int GetHashCode()
{
    int hash = 17;
    // Suitable nullity checks etc, of course :)
    hash = hash * 23 + StreetAddress.GetNullSafeHashCode();
    hash = hash * 23 + RuralRoute.GetNullSafeHashCode();
    hash = hash * 23 + City.GetNullSafeHashCode();
    hash = hash * 23 + Province.GetNullSafeHashCode();
    hash = hash * 23 + Country.GetNullSafeHashCode();
    hash = hash * 23 + PostalCode.GetNullSafeHashCode();
    return hash;
}

Вы можете создать утилиту метода массива параметров, чтобы сделать это еще проще:

public static int GetHashCode(params object[] values)
{
    int hash = 17;
    foreach (object value in values)
    {
        hash = hash * 23 + value.GetNullSafeHashCode();
    }
    return hash;
}

и назовите его с помощью:

public int GetHashCode()
{
    return HashHelpers.GetHashCode(StreetAddress, RuralRoute, City,
                                   Province, Country, PostalCode);
}

В большинстве типов присутствуют примитивы, так что они будут выполнять бокс несколько ненужно, но в этом случае у вас будут только ссылки. Конечно, вы в конечном итоге создадите массив без необходимости, но знаете, что они говорят о преждевременной оптимизации...

Ответ 2

Не делайте этого, потому что объекты могут быть разными, хотя хэш-код является тем же.

Подумайте о

"StreetAddress" + "RuralRoute" + "City"

против

"Street" + "AddressRural" + "RouteCity"

Оба будут иметь одинаковый хэш-код, но различный контент в полях.

Ответ 3

Для такого типа вы можете реализовать IEqualityComparer<Address>:

public class Address : IEqualityComparer<Address>
{        
    //
    // member declarations
    //

    bool IEqualityComparer<Address>.Equals(Address x, Address y)
    {
        // implementation here
    }

    int IEqualityComparer<Address>.GetHashCode(Item obj)
    {
        // implementation here
    }
}

Вы также можете реализовать IComparable<Address>, чтобы получить упорядочение...

Ответ 4

public string getfourDigitEncryptedText(string input) { 
    int hashCode = input.hashCode(); 
    string hstring = (new StringBuilder()).append(hashCode).append("").toString(); 
    string rev_hstring = (new StringBuilder(hstring)).reverse().toString(); 
    string parts[] = rev_hstring.trim().split(""); 
    int prefixint = 0; 
    for(int i = 1; i <= parts.length - 3; i++) 
        prefixint += integer.parseInt(parts[i]);   
    string prefixstr = "0"; 
    if((new integer(prefixint)).toString().length() < 2) 
        prefixstr = (new StringBuilder()).append((new integer(prefixint)).toString()).append("5").toString(); 
    else if((new integer(prefixint)).toString().length() > 2) 
        prefixstr = "79"; 
    else 
        prefixstr = (new integer(prefixint)).toString(); 
    string finalstr = (new StringBuilder()).append(prefixint).append(rev_hstring.substring(3, 5)).toString();
    return finalstr; 
}