Wpis z mikrobloga

Skopiuj link

03.02.2017, 13:35:08

Pytanie do mirków z #sql i #programowanie
Zauważyłem niedawno, że szybko puchnie mi baza danych. Postanowiłem to sprawdzić. Zapytałem bazę ile poszczególne tabele ważą i tutaj nastąpiło moje zdziwienie bo taka tabela z 20 000 wierszy waży 3,3 MB. Trochę dużo. Wyeksportowałem tabelę do pliku CSV i taki plik zajmuje mi już 1,1 MB. Możecie mi powiedzieć czemu w bazie zajmuje mi to tak dużo miejsca? Da się to jakoś zoptymalizować?

Zastanawiam się teraz nad celowością używania SQL w moich aplikacjach. Niby fajny dostęp i wydajność, ale dość dużym kosztem zajmowanego miejsca.

szuki

03.02.2017, 13:37:46

@debesciak1: 20000 wierszy nie mówi co w tych wierszach trzymasz. Baza danych to także indeksy. Dzięki którym szybyciej wyszukuje. Pytanie na jakich polach masz pozakładane indeksy itp itd. To jest pytanie pratycznie bez kontekstu...

poszlo_wyszlo

03.02.2017, 13:38:21

@debesciak1: waga bazy a jej zawartość to dwie różne rzeczy.
Wartość którą widzisz to dane, indeksy, metadane, zarezerwowane miejsce

Kicer86

03.02.2017, 13:38:49

@debesciak1: Nie znam się, ale powiedziałbym, że 3-krotna przebitka, biorąc pod uwagę, że wiersze były dodawane, usuwane, zmieniane, etc, to nie jest dużo przy tej ilosci danych.

lubie-sernik

debesciak1

03.02.2017, 13:50:02

@szuki: Indeks (auto) jest tylko na pierwszej kolumnie
@Kicer86: Dane nie były ani razu zmieniane. Są tylko dodawane i wyświetlane. Taka aplikacja.
@poszlo_wyszlo: Ogólnie struktura tabeli wygląda jak na obrazie

debesciak1 - @szuki: Indeks (auto) jest tylko na pierwszej kolumnie
@Kicer86: Dane n... — **źródło:** comment_T59VGjdrhu8UgHm9dw9R9OHylQ7CgQuB.jpg
Pobierz

MacDada

03.02.2017, 13:52:25

@debesciak1: 3 MB i się przejmujesz? Wołaj jak dojdziesz do kilku GB.

debesciak1

03.02.2017, 13:53:19

@Kicer86: Każdy z wierszy dodawany jest mniej wiecej co sekunde. Nie są modyfikowane. Dopiero jak wpiszę określoną ilość wierszy, w ostatniej kolumnie zmieniam w niektórych wierszach wartość z 0 na 1. I potem już nie są modufikowane a tylko wyświetlane.

debesciak1

03.02.2017, 13:53:42

3 MB i się przejmujesz? Wołaj jak dojdziesz do kilku GB.

@MacDada: Takich tabel mam setki a będą tysiące

debesciak1

03.02.2017, 13:54:10

@debesciak1: Już mam 1,8 GB a SQLEXPRESS ma tylko 10GB :/

zakopiak

03.02.2017, 14:05:14

@debesciak1: 3-krotnie większa objętość bazy w stosunku do plantextu nie jest Twoim problemem. Nawet gdyby baza zajmowała tyle, co csv, to miałbyś już jakieś 700MB. Baza SQLExpress po prostu i tak nie jest dla ciebie wystarczająca, bo niedługo byś ją zapełnił. Także odpowiadanie na Twoje pierwotne pytanie o optymalizację nie ma znaczenia.

Rozwiązanie problemu natomiast będzie zależne o tego, jakie dane tam masz i co z nimi robisz. Najprościej byłoby zmienić

debesciak1

03.02.2017, 14:11:55

@zakopiak: @szuki: @poszlo_wyszlo: @Kicer86:
Ogólnie to mam takie typy danych jak na obrazie.
Jedyne co teraz dostrzegam to:
-Pierwszą kolumnę (bigint) mógłbym zmienić na int
-Komunę text mógłbym zmienić na jakaś bardziej optymalną (np. o stałej długości)
-smallInt mógłbym zmienić na tinyint

poszlo_wyszlo

03.02.2017, 14:27:35

@debesciak1: to nie da tak dużo oszczędności przy takiej ilości danych.
tak jak chłopaki mówili, przy takich rozmiarach nie masz czym się martwić.

poszlo_wyszlo - @debesciak1: to nie da tak dużo oszczędności przy takiej ilości danyc... — **źródło:** comment_XX6lKS6Rfy9T0hbFLSvhS7vrLG9sWC63.jpg
Pobierz

zjadak

03.02.2017, 15:36:22 via Android

@debesciak1: sprawdź rozmiar logu na bazie, może tu masz "nadwyżkę".

MacDada

03.02.2017, 21:40:25

3 MB i się przejmujesz? Wołaj jak dojdziesz do kilku GB.

Takich tabel mam setki a będą tysiące

@debesciak1:

1. Jak masz setki czy tysiące tabel, to coś robisz źle.
2. 3,3 MB x 2000 = 6,6 GB – na pendrajwie zmieścisz

Serio, nie wiem na czym polega problem. Dyski są tanie, procesory szybkie, a sieci przepustowne.

debesciak1

03.02.2017, 22:14:59

@MacDada: SQL ma tą zaletę, że jednocześnie do danych może dobierać się wiele osób czy to po sieci czy programy lokalnie. Normalnie bym trzymał to w plikach. 2000 to mało. Tyle danych w niecały rok zbiorę. A zależy mi żeby dane były w bazie przynajmniej 3 lata. SQL Server w wersji Express ma ograniczenie do 10GB.

@zjadak: Teraz nie mam dostępu do programu, ale log był w porządku.

Chyba pozostaje

MacDada

03.02.2017, 23:16:43

2000 to mało.

@debesciak1: 2000 tabel to mało? Po co tyle tabel produkujesz? Mam wrażenie, że gdzieś masz błąd w dizajnie.

SQL Server w wersji Express ma ograniczenie do 10GB.

@debesciak1: To może jednak darmowy i wypasiony Postgres?

Maximum Table Size 32 TB
Maximum Row Size 1.6 TB
Maximum Field Size 1 GB
Maximum Rows per Table Unlimited
Maximum Columns per Table 250 - 1600 depending on column types

debesciak1

03.02.2017, 23:35:19

@MacDada: danych jest ogrom, dlatego też tyle tabel. Albo setki tysiecy rekordów w jednej tabeli albo te 2000 tabel i max 30 000 rekorodów w nich. Z dobieraniem się do danych nie mam najmniejszego problemu, więc dizajn jest ok. Co najwyżej mógłbym porobić odniesienia i trochę miejsca zaoszczędzić.
@MacDada: składnia zapewne jest inna w Postgres?

MacDada

04.02.2017, 00:07:20

danych jest ogrom, dlatego też tyle tabel. Albo setki tysiecy rekordów w jednej tabeli albo te 2000 tabel i max 30 000 rekorodów w nich.

@debesciak1: 30k rekordów to jest nic. Na MySql trzymamy po kilka(naście) milionów rekordów. Twoje ograniczenie wynika z ograniczeń bazy danych ;)

składnia zapewne jest inna w Postgres?

Zależy co używasz. To jest baza SQL. Trzyma się standardów. I oczywiście buduje ponad standardy swoje bajery.

MS z

MacDada

04.02.2017, 00:11:37

@debesciak1: Generalnie nigdy nie korzystałem z bazki MS, ale też nie widzę powodu.

Na produkcji używamy wszędzie MySQL (+odmianę w postaci serwera Percona) i w jednym projekcie Mongo. Na studiach korzytałem z PostgreSQL i generalnie czytam na temat tej bazki przeważająco pozytywne opinie.

Tak więc w pracy nowe projekty stawiamy na MySQL (bo mamy opanowaną infrastrukturę), a jakbym robił jakiś projekt dla siebie, to bym wziął PostgreSQL. Czemu miałbym płacić za

ludzik

05.02.2017, 20:02:13

@debesciak1:
Albo wielkość logu.
Albo wielkość indeksu.
Albo nieoptymalnie wielkie pola.

Niby mówisz, że będziesz generował tabele żeby uzyskać podział danych. Tylko takie rzeczy załatwiają indeksy. Dzięki temu baza jest human-readable a nie wygląda jak kupa śmieci.

adrpan

21.02.2017, 19:52:47

@debesciak1: 220 tabel, zbierane dane od 2ch lat.

Aktywne Wpisy

zimno_mi

zimno_mi +156

4 godz. i 32 min temu

#csiwykop #zbiorkapieniedzy #afera #policja

Czy zbiórka "Naprawiam życie po wyroku dla stalkerki" to wyłudzenie, a sytuacja nie wydarzyła się?

Użytkownik @burakzaglady8
Twierdzi, że wygrał sprawę sądową w październiku 2023

W grudniu 2023 pisał, że była popełniła samobójstwo LINK

W zbiórce twierdzi, że między innymi będzie się odwoływać od śmiesznie niskiego wyroku.

Jak zapytałam jak chce się sądzić z nieżywą twierdził, że prawnik twierdzi, że jest opcja zadośćuczynienia od rodziny LINK do komentarza