Scala: Содержит в изменяемых и неизменяемых наборах

Я обнаружил странное поведение для изменяемых наборов, которые я не могу понять:

У меня есть объект, который я хочу добавить в набор. Метод equals для класса переопределяется. Когда я добавляю в набор два разных объекта, которые производят один и тот же вывод для метода equals, я получаю другое поведение между изменяемыми и неизменяемыми наборами метода contains.

Вот фрагмент кода:

class Test(text:String){
  override def equals(obj:Any) = obj match {
    case t: Test => if (t.text == this.text) true else false
    case _ => false
  }
  override def toString = text
}

val mutableSet:scala.collection.mutable.Set[Test] = scala.collection.mutable.Set.empty
mutableSet += new Test("test")
println(mutableSet)
println(mutableSet.contains(new Test("test")))

val immutableSet:scala.collection.immutable.Set[Test] = scala.collection.immutable.Set.empty
immutableSet += new Test("test")
println(immutableSet)
println(immutableSet.contains(new Test("test")))

Это производит как вывод:

Set(test)
false
Set(test)
true

По моему мнению, оба вызова содержат, должны иметь одинаковый вывод (true).

Может ли кто-нибудь помочь мне понять разницу здесь или это ошибка в реализации scala неизменяемого набора? Кстати, я использую scala 2.8.1.final

Спасибо.

Ответ 1

Правило 1 при реализации equals(): одновременно выполнить hashCode(). См. Переопределение значений equals и hashCode в Java

В первом примере вы создаете изменяемый набор, который вызывает hashCode для настройки хеш-таблицы.

Во втором случае вы используете неизменяемый набор с одной записью, поэтому Scala фактически использует оптимизированную версию Set с именем Set1. Set1.contains() просто сравнивает одну запись с переданным элементом, используя equals() напрямую. Это выглядит так:

/** An optimized representation for immutable sets of size 1 */
@SerialVersionUID(1233385750652442003L)
class Set1[A] private[collection] (elem1: A) extends Set[A] with Serializable {
  override def size: Int = 1
  def contains(elem: A): Boolean = 
    elem == elem1
  def + (elem: A): Set[A] = 
    if (contains(elem)) this
    else new Set2(elem1, elem)
  def - (elem: A): Set[A] = 
    if (elem == elem1) Set.empty
    else this
  def iterator: Iterator[A] = 
    Iterator(elem1)
  override def foreach[U](f: A =>  U): Unit = {
    f(elem1)
  }
}

Не вызывается hashCode. Также есть Set2, Set3 и Set4.

Итак, если мы изменим ваш код:

class Test(val text:String){
  override def equals(obj:Any) = {
  println("equals=" + obj)
  obj match {
    case t: Test => if (t.text == this.text) true else false
    case _ => false
  }}

  override def hashCode(): Int = {
    println("hashCode=" + super.hashCode())
    super.hashCode()
  }
  override def toString = text
}

println("mutable")
val mutableSet:scala.collection.mutable.Set[Test] = scala.collection.mutable.Set.empty
mutableSet += new Test("test")
println("mutableSet=" + mutableSet + " contains=" + mutableSet.contains(new Test("test")))

println("immutable")
var immutableSet:scala.collection.immutable.Set[Test] = scala.collection.immutable.Set.empty
immutableSet += new Test("test")
println("immutableSet=" + immutableSet + " contains=" + immutableSet.contains(new Test("test")))

добавление hashCode и println на равных, а выход:

mutable
hashCode=30936685
hashCode=26956691
mutableSet=Set(test) contains=false
immutable
equals=test
immutableSet=Set(test) contains=true

который объясняет, почему mutable.contains() работает некорректно. Он ищет объект в неправильной записи таблицы хэшей, equals() даже не вызван. И, что неудивительно, он не находит его.

Вы можете реализовать hashCode с помощью text.hashCode:

override def hashCode: Int = text.hashCode

Ответ 2

Вам нужно переопределить hashCode. hashCode необходимо переопределить при переопределении equals.

Заметьте, что было также несколько вещей, которые не компилировались, поэтому я немного изменил:

class Test(val text:String){ // added val
  override def equals(obj:Any) = obj match {
    case t: Test => if (t.text == this.text) true else false
    case _ => false
  }
  override def toString = text
  override def hashCode = text.hashCode
}

val mutableSet:scala.collection.mutable.Set[Test] = scala.collection.mutable.Set.empty
mutableSet += new Test("test")
println(mutableSet)
println(mutableSet.contains(new Test("test")))

val immutableSet:scala.collection.immutable.Set[Test] = scala.collection.immutable.Set.empty
val immutableSet2 = immutableSet + new Test("test") // reassignment to val
println(immutableSet2)
println(immutableSet2.contains(new Test("test")))

Я рекомендую читать http://www.artima.com/pins1ed/object-equality.html для получения более подробной информации о равенстве объектов. Это отверстие для глаз.