Wpis z mikrobloga

Cz są tu jacyś wyznawcy #python ?

Mam skrypt czytający linie tekstu z pliku (poczta thynderbird) i nie wiem jak ogarnąć problem z błędami w kodowaniu:

UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position...
jak otworze z kodowaniem utf-8 to mi wyskakuje błąd w innej linii:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xea in position...
Jak to ugryźć sensownie żeby nie przerywać skryptu i nie tracić danych?
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@paki81: Problem jest taki że maile są zakodowane w różny sposób i nie mogę z góry określić jakie kodowanie ustawić. Plik jest duży a błędy wyskakują w losowych miejscach w zależności jakie kodowanie ustawie.
  • Odpowiedz