Wpis z mikrobloga

Skopiuj link

04.06.2015, 10:05:36

mam taką tabelkę error_log, na silniku InnoDB, z 5 indeksami (unikalne: ErrorLogID int primary i ErrorCode varchar(100) + 3 inne, każdy na pojedynczej kolumnie) Mam w niej 12 milionów rekordów, i w efekcie ta tabelka to jakieś 50% dziennego backupu. Chciałbym wyrzucić z niej wszystko poza wpisami z ostatnich 30 dni.
No i tu jest problem, bo to strasznie długo trwa. Kasowanie ok 1000 najstarszych rekordów trwa prawie minutę.
Macie jakiś pomysł na przyspieszenie tego procesu? Czy uzyskam coś usuwając indeksy, a później tworząc po ograniczeniu ilości rekordów?
#mysql #bazydanych #sql

Cronox

G.....n

konto usunięte 04.06.2015, 10:09:47 via Android

@singollo: Po pierwsze, rzuć wynik explain.
Po drugie - spróbuj dorzucić indeks na datę.
Po trzecie - daj więcej RAMu w ustawieniach bazy.

singollo

04.06.2015, 10:24:27

@Ginden: explain robię oczywiście na select

mysql> explain select * from error_log where ErrorTime < '2014-01-01' limit 1000\G
*************************** 1. row ***************************
 id: 1
 select_type: SIMPLE
 table: error_log
 type: range
possible_keys: index2
 key: index2
 key_len: 8
 ref: NULL
 rows: 3049470
 Extra: Using where
1 row in set (0.00 sec)

Po drugie, mam taki indeks.
Po trzecie... dla vhosta z bazą mam przydzielone 2GB, i nie mam skąd wziąć więcej.

ksiak

04.06.2015, 10:31:09

@singollo: jak nie masz tam żadnych kluczy obcych porobionych to proponuje:

create table error_log_new like error_log;

insert into error_log_new (ErrorLogID, ErrorCode, ErrorTime, ....) select ErrorLogID, ErrorCode, ErrorTime, ... from error_log WHERE ErrorTime >= '2014-01-01';

drop table error_log;
alter table error_log_new rename to error_log;
powinno byc szybciej ;)
Przy okazji, która wersja MySQL?

G.....n

konto usunięte 04.06.2015, 10:34:08 via Android

@singollo: SELECT robi się szybko, DELETE nie - są jakieś triggery, klucze obce?

@ksiak: Esencja #mysql - DELETE jest zbyt wolny? Zróbmy kopię tabeli i podmieńmy.

ksiak

04.06.2015, 10:38:01

@Ginden: a myślisz, że w innych systemach jest inaczej? Zwykle danych z bazy się nie usuwa od razu a tylko oznacza do usunięcia. Następnie są odpowiednie mechanizmy które robią to w innym terminie - gdy system nie jest obciążony. Tak są skonstruowane bazy danych i zbyt wiele na to nie poradzisz.

ksiak

04.06.2015, 10:39:26

@singollo: możesz jeszcze usuwać w partiach po hmm 10k rekordów (zależnie jak baza zareaguje) jeżeli nie chcesz robić opcji recreate && drop.

plushy

04.06.2015, 10:40:32

@singollo: Wybierz rekordy z ostatnich 30 dni do innej tabeli, wyrzuć starą, zmień nazwę nowej. Ewentualnie zamiast dropować to użyj truncate.

singollo

04.06.2015, 10:41:43

@Ginden: nic z tych rzeczy, ale pojedyncze rekordy mogą być dość duże (4 pola TEXT)
@ksiak: chyba zrobię to "your way". Ma tylko taką wadę, że choć rozwiązuje problem, to nie zbliża mnie do rozwiązania.

G.....n

konto usunięte 04.06.2015, 10:42:05 via Android

@plushy: A co jak dojdą nowe wiersze pomiędzy zmianami?

ksiak

04.06.2015, 10:44:51

@singollo: dlatego proponuje opcję drugą, czyli kasowanie po +/-10k rekordów (musisz sprawdzić ile będzie ok). Jak już to zrobisz, to proponuje dodać zadanie do Event Schedulera, żeby Ci co noc usuwał starsze niż 30 dni, wtedy będziesz miał w miarę ok ;)

ksiak

04.06.2015, 10:45:52

@Ginden: to jest tabela error logów, znając życie nie wymaga się od niej by dane siedzące w środku były ciągłe w 100% ale oczywiście ten przypadek może być inny.

singollo

04.06.2015, 11:02:09

@ksiak: @Ginden: na taką okazję to zrobię sobie 60 sekundowy downtime gdzieś w środku nocy. Klient to jakoś przeżyje ;)

plushy

04.06.2015, 11:03:34

@Ginden: To będą miały pecha, stosując MySQL zamiast innych rozwiązań trzeba się z czymś takim liczyć.

ksiak

04.06.2015, 11:04:22

@plushy: które inne rozwiązania nie mają problemu z usunięciem 3mln rekordów z tabeli? Aaa i weź pod uwagę, że to jest vhost.

000loki

04.06.2015, 13:13:43 via Android

@singollo: a to ma być regularny proces który ma być odpalany raz na miesiąc czy tylko jednorazowo?

singollo

04.06.2015, 13:27:50

@000loki: Tu i teraz interesuje mnie jednorazowe przycięcie tabeli. To są dane z ostatnich 4 lat, mam je w backupach, serwisowi "live" są zupełnie zbędne. Za rok mogę powtórzyć operację ;)

000loki

04.06.2015, 14:04:44 via Android

@singollo: no to przerzut do innej tabeli danych tych co potrzebujesz. Drop tamtej i zmiana nazwy. Jak chcesz za rok mieć mniejszy problem to możesz zrobić partycje co miesiąc (pod warunkiem, że nic innego w tym nie przeszkadza). Jesli boisz się ze coś tam wpadnie w trakcie tej operacji to tabele zwyczajnie zalockuj na czas operacji. Procesy które ewentualnie będą chciały coś tam robić będą musiały poczekać.

singollo

04.06.2015, 14:08:04

@000loki: partycje mi tu nic nie zmienią, bo ja chcę się tych danych fizycznie pozbyć. Przez tą tabelę backupy rozrosły się do zupełnie bezsensownych rozmiarów (> 1.5GB po kompresji) co generuje kolejne problemy (typu "gdzie to kurde trzymać" ;))

000loki

04.06.2015, 14:10:08 via Android

@singollo: no to jak nic nie dadzą. Robisz w takim przypadku drop partycji które sięgają dalej niż miesiąc wstecz. Jest to proces na parę sekund. Nie martwisz się ze coś się wydarzy w trakcie. Drop partycji i nara. Możesz nawet zrobić proces który regularnie raz na miesiąc będzie dropowal ileś tam partycji z wcześniejszą data.

singollo

04.06.2015, 14:11:42

@000loki: no w zasadzie masz rację. Ale myślę, że jak już przytnę tabelę za pierwszym razem, to dalsza kontrola objętości będzie znacznie prostsza

Aktywne Wpisy

AlienFromWenus

AlienFromWenus +6

5 godz. i 27 min temu

Mój niebieski ma jakąś dziwną cechę charakteru, której nie umiem nazwać, a objawia się chęcią decydowania za mnie, wymyślania, komentowania, wymądrzania się.

Chcieliśmy pojechać na zakupy odzieżowe, żeby wymienić garderobę na nową, jednak z racji dużych wydatków ostatnio przełożyliśmy zakupy na kiedy indziej - gdy będziemy mieli odłożoną sumę pieniędzy na zakupy.

Jakoś na wiosnę również pojechaliśmy na zakupy ale tylko kilka rzeczy niebieski kupił a że to był spontaniczny wypad, a

mickpl

mickpl +116

6 godz. i 10 min temu

Dużo osób w necie, a nawet niektórzy znajomi, mówi że rezygnuje z zakupu mieszkania, bo ceny odleciały na poziomy dla nich nieakceptowalne.

Nie czekają na spadki, nie oczekują krachu, nie zastanawiają się na stopami. Po prostu nie kupują, bo jest za drogo.

Zasługi trzeba oddać Waldemarowi Budzie, który kredytem 2% i wywołaniem FOMO wykluczył jakieś 80% potencjalnych kupujących oraz pozwoli deweloperce na wycofanie promocji.

Drugie miejsce na podium dla Glapy, który utrzymuje

Aktywne Wpisy

Aktywne Znaleziska

Polska kolej bazuje na technologii z lat 80

Andrzej Lepper mówi prawdę o Kaczyńskim

Rozpoczęły się próby morskie największego patrolowca polskiej Straży Granicznej

14. emerytura miała być niższa. Kaczyński pomylił kwoty netto i brutto

Robert Górski uderza w TVN i Piotra Kraśkę

Popularne tagi