Я читаю некоторые данные из веб-службы XML с Ruby, что-то вроде этого:
<phrases>
<phrase language="en_US">¡I'm highly annoyed with character references!</phrase>
</phrases>
Я разбираю XML и хватаю массив фраз. Как вы можете видеть, текст фразы содержит некоторые ссылки на символы XML-символа. Я хотел бы заменить их ссылкой на фактический символ. Это достаточно просто с числовыми ссылками, но противными с XML и HTML. Я бы хотел избежать большого хэша в моем коде, который содержит символ для каждой ссылки на XML или HTML-символ, т.е. http://www.java2s.com/Code/Java/XML/Resolvesanentityreferenceorcharacterreferencetoitsvalue.htm
Конечно, там есть библиотека для этого, не так ли?
Обновление
Да, есть библиотека, и она называется HTMLEntities:
: [email protected]; sudo gem install htmlentities
Successfully installed htmlentities-4.2.4
: [email protected]; irb
irb(main):001:0> require 'htmlentities'
=> []
irb(main):002:0> HTMLEntities.new.decode "¡I'm highly annoyed with character references!"
=> "¡I'm highly annoyed with character references!"