Saturday, May 29, 2010

libxml-ruby1.9.1 и Unicode

Вот почему
parser = XML::HTMLParser.string((IO.read 'page.html'),
:encoding => XML::Encoding::UTF_8)
doc = parser.parse
obj = doc.find('//tr/td/font[@color="#cc0000"]')
content = obj.first.content.force_encoding("UTF-8")
p content.index "не найден"

выводит 80, а если то же самое, только вместо первой строки — 

parser = XML::HTMLParser.file('page.html',
:encoding => XML::Encoding::UTF_8)
, выводит nil?

No comments:

Post a Comment