Wpis z mikrobloga

#programowanie #python

Napisałem prosty skrypt w pythonie do Notepad++ zamieniający określone grupy wyrazów, na inne grupy wyrazów uwzględnione w oddzielnym pliku. Skrypt działa na małych plikach (xml) <4MB, na tzw. testowym; na pliku właściwym zaś, na którym chce użyć skryptu, wychodzi totalna sieczka i pojawiają się dziwne znaki, podziały wiersza. Orientuje się ktoś, co może być przyczyną tej rozbieżności?
  • 4
@M4ks:
mialem skrypt:

with open('C:\Users\mmarkieta\Desktop\domains.txt') as f:

for l in f:
s = l.split(" ")
editor.rereplace(s[0], s[1])

ktory mial pliku domains.txt wzorce zamiany tekstu w pliku xml. Gdy odpaliłem go na małym pliku wszystko śmigało. Po odpaleniu go na pliku właściwym tj. ok 50mb (taka sama struktura, tylko więcej danych), pojawiały się dziwne dodatkowe znaki, znaczniki zostały poszatkowane, totalny bałagan.

....już wiem, program rozróżnia unixowy i windowsowy znacznik końca wiersza, (CR
EDIT:
jednak nie. Ten sam skrypt potrafi dobrze zadziałać, ale przy takich samych warunkach początkowych, odpalony na kopii tego samego pliku potrafi go poszatkować:
Tak to wygląda

Tak wyglądało przed skryptem:

Link

Skrypt zamienia liczby w znacznikach na tekst wymieniony w oddzielnym pliku tekstowym. Na niektórych plikach działa, a w innych wstawia te dziwne znaki. Co więcej, ten sam plik potrafi raz zrobić dobrze a raz posiekać.

Co mogę dodać, zmienić?