You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Подскажите как можно установить кодировку документа самостоятельно
если в html не указана кодировка, то nokogiri неверно отображает слова
к примеру при парсинге страницы https://games.mail.ru/pc/news/ срабатывает метод loadHtml хотя должен сработать loadHtmlNoCharset так как там в коде нет установленной кодировки
из-за этого весь текст отображается в неверной кодировке
да, nokogiri::fromHtmlNoCharset это верный вариант в случае если просто нет указания кодировки. loadHtmlNoCharset делает то же самое с уже созданным объектом $nokogiri->loadHtmlNoCharset
Подскажите как можно установить кодировку документа самостоятельно
если в html не указана кодировка, то nokogiri неверно отображает слова
к примеру при парсинге страницы https://games.mail.ru/pc/news/ срабатывает метод loadHtml хотя должен сработать loadHtmlNoCharset так как там в коде нет установленной кодировки
из-за этого весь текст отображается в неверной кодировке
если извернуться и сделать что-то типа такого
то страница парсится в верной кодировке
PS. в принципе разобрался, можно сделать вот так
но не знаю насколько это правильн
The text was updated successfully, but these errors were encountered: