@harnasiek: Twój problem wynika prawdopodobnie z tego, jak próbujesz ekstrahować dane z tabel w PDFie. Zauważ, że w funkcji extract_schedule_table wybierasz tylko pierwsze cztery kolumny z każdej tabeli, co jest widoczne w tej linii:
python table_data = table.df.iloc[:, :4].values.tolist() To ogranicza dane do pierwszych czterech kolumn. Jeśli chcesz uzyskać wszystkie kolumny, możesz zmienić ten wycinek tak, aby zamiast :4 użyć :. Oto zmodyfikowana wersja
Hej, mam problem z moim kodem, jedynie w pliku txt printuje mi zaledwie 4 kolumny, gdzie plik pdf zajmuje o wiele wiecej,
Link do kodu
Czy jest ktos w stanie znalezc blad albo wie jak ulepszyc kod zeby printowal wszystko do konca?
Ps:
table_data = table.df.iloc[:, :4].values.tolist() # Załóżmy, że cztery kolumny zawierają godziny, daty i saleta linijka wydaje się być podejrzana :D
extract_schedule_tablewybierasz tylko pierwsze cztery kolumny z każdej tabeli, co jest widoczne w tej linii:pythontable_data = table.df.iloc[:, :4].values.tolist()
To ogranicza dane do pierwszych czterech kolumn. Jeśli chcesz uzyskać wszystkie kolumny, możesz zmienić ten wycinek tak, aby zamiast
:4użyć:. Oto zmodyfikowana wersja