Wpis z mikrobloga

Skopiuj link

31.08.2016, 11:54:39

Siema Mirki,

czy znajdę pośród was jakąś osobę która zna się trochę na neo4j?
Mam zrobić porównanie wydajności zapytań miedzy tą bazą grafową a relacyjną (MySQL) i zastanawiam się jak najlepiej to zrobić...

#programowanie #neo4j #bazydanych #nosql

czolnowski

31.08.2016, 12:01:13

@rudi_90: A co konkretnie chcesz porównać?

rudi_90

31.08.2016, 12:03:12

@czolnowski: Czas wykonania zapytania dla bazy danych - adv. works w postaci relacyjnej vs zmigrowana do postaci grafowej

sorhu

31.08.2016, 12:05:22

@rudi_90: No to:
1. Zmigruj SQL-ową bazę do Neo4ja.
2. Wykonaj zapytanie do SQL-a i zmierz czas.
3. Wykonaj analogiczne zapytanie do Neo4ja i zmierz czas.
4. Porównaj czasy.

Z którym punktem masz problem?

czolnowski

31.08.2016, 12:06:28

@sorhu: Do takiego testu potrzeba sporego zbioru badawczego. Nie prościej rozpisać to na złożoności?

sorhu

31.08.2016, 12:07:27

@czolnowski: Ty to chyba z UJ-u. ( ͡° ͜ʖ ͡°)
Praktyka > teoria. ( ͡° ͜ʖ ͡°)

rudi_90

31.08.2016, 12:08:51

@sorhu: ok, tak własnie zamierzam to zrobić, jednak pojawiają się problemy w postaci takiej że wyniki zapytań w neo4j są cachowego za każdym razem, i raczej nie da rady tego cache'a wyczyścić. Druga sprawa to typy zapytań które najlepiej porównać w obu systemach

sorhu

31.08.2016, 12:10:01

@rudi_90: Cache można wyłączyć.
A zapytania zrób takie, które pokażą kiedy graf szybciej poleci, a kiedy wolniej.

czolnowski

31.08.2016, 12:11:42

@rudi_90: wyniki z rdbmsów też są cachowane. ;)
@sorhu: nie kończyłem żadnych studiów. Praktyka, szczególnie w kontekście zbiorów danych jest ciężka do wiarygodnej weryfikacji bez dużej ilości danych. Wyniki często będą zbliżone. Wynika to nie tylko z szybkości obecnych maszyn, ale również z tego, że sporo baz danych ma algorytm do rozwiązywania prostych przypadków. Przykład: porównaj agregowanie przez elasticsearcha z agregowaniem przez postgresa.

sorhu

31.08.2016, 12:12:54

@czolnowski: No to się zrobi duży zbiór. Ale problem. ( ͡° ͜ʖ ͡°)

czolnowski

31.08.2016, 12:16:43

@sorhu: A jaki Twoim zdaniem jest wystarczający, żeby potwierdzić wynik? Jak uzyskasz odpowiednią granularność?

zajety_login

31.08.2016, 12:25:16

@rudi_90: A co chcesz tak właściwie uzyskać? Pokazać dla jakich problemów neo4j będzie wydajniejsze niż RDBMS (i odwrotnie)? No i ważna kwestia: czy masz narzucony jakiś zbiór danych i/lub konkretne zapytania które masz na nim wykonać?

rudi_90

31.08.2016, 12:28:03

@zajety_login: Nie, tutaj mam dowolność, z jakiego zbioru korzystać i jakie zapytania wykonać. Chcę sprawdzić dla jakich rozwiązań lepsza będzie baza danych neo4j a w jakich mysql np

zajety_login

31.08.2016, 12:38:41

@rudi_90: Baza grafowa będzie dawała radę wszędzie tam gdzie dane są ze sobą mocno powiązane (i gdzie oczywiście zapytania będą wykorzystywały te powiązania). Przykładem może być graf znajomości między ludźmi, w którym szukasz wszystkich znajomych 4/5/6-stopnia jakiegoś Janka Kowalskiego. W neo4j sprowadzi się to do przechodzenia po grafie, a w RDBMS do wielopoziomowych JOINów na tabeli zawierającej krawędzie (każda krawędź będzie oznaczała znajomość dwóch osób).

rudi_90

31.08.2016, 12:46:22

@zajety_login: tak, w przypadku zapytań rekursywnych neo4j powinna dawać radę lepiej niż rdbms, ponoć również w przypadku zapytań o rekomendacje (wyznaczanie jakiś trendów) lepiej radzi sobie neo4j. Zastanawiam się też czy można tutaj brać pod uwagę tuning zapytań (dodawaniu indeksów) w neo4j itp

zajety_login

31.08.2016, 12:52:38

@rudi_90: To już zależy od tego czy masz czas na to żeby różne warianty przetestować :P

bziuuumor

31.08.2016, 17:55:37

@rudi_90: darmowa książka, która opisuje dokładnie ten problem kilk

rudi_90

31.08.2016, 20:45:45

@bziuuumor: przegladalem ją, w mniemaniu jej autorów (co jest z wiadomych celów oczywiste) neo4j nadaje się do wszystkiego ;)

Aktywne Wpisy

Anacron

Anacron +401

5 godz. i 2 min temu

Słowo na niedzielę.

Odra wraca, bo foliarze, wróć, paranoicy (bo to poprawna nazwa tego schorzenia) nie zaszczepili swoich dzieci i niestety jest ich więcej niż 5% w naszym społeczeństwie. Ci sami ludzie jednak jednocześnie jeżdżą samochodem, mimo że prawdopodobieństwo śmierci wtedy w wypadku samochodowym jest kilkadziesiąt tysięcy razy większe niż ryzyko powikłań po zaszczepieniu (dowolną szczepionką) i wynosi z tego co pamiętam 1 do 120. Ba wychodzą z domu i chodzą po