#skalowalnosc

Wszystko

Wszystkie

Archiwum

29.07.2019, 06:16:02

Niepotwierdzone transakcje bitcoin to problem, który tak naprawdę wypłynął na szerokie wody w grudniu 2017 r., podczas szaleńczego rajdu kursu bitcoina. Z powodu przeciążonych giełd i ataków DDoS, ogromna liczba 200 000 transakcji Bitcoin pozostawała niepotwierdzona przez ponad dzień!

https://bithub.pl/wiadomosci/niepotwierdzone-transakcje-bitcoin-czy-da-sie-cos-z-tym-zrobic/

#bitcoin #tps #skalowalnosc

fervi

29.07.2019, 08:22:39

@Bithub:

Istnieje strona internetowa o nazwie bitcoinfees.earn.com

To najbardziej ******* strona jaka istnieje i niewiele mówi ludziom
https://mempool.space/
Ta prognozuje nawet ile trzeba dać fee by wejść do konkretnego bloku i od razu widać

Bithub

29.07.2019, 19:15:59

@decentralizacja: rozważymy tą propozycje. Chyba w redakcji zbyt popuściliśmy piszącym bo za dużo kwiatków wychodzi.

bi-tek

30.05.2019, 17:50:36

Mam sobie baze danych zawierającą odczyty z czujników co 1 min i czujników jest 1200 i działają 24/7

Teraz trzeba to zoptymalizować do wyświetlania i jak najlepiej to ogarnąć

Dzienny przyrost danych to 1728000 ( prawie 2 mln rekordów) jak w najbardziej optymalny sposób do tego podejść i jak to przechowywać na bazie, dodam że czujniki są w grupach po max 26 i tych grup jest prawie 100 (każda grupa może mieć od 1-26 czujników)

Ps.

m504

30.05.2019, 19:01:00

Trzymać w skompresowanych pliakch logów a nie bazie danych.

Mam podobny problem (rozwiązany), tyle że więpszą prędkością przyrostu danych.

Używałem do tego postgresql z partycjami dziennymi ale problem z wydajnością był gdy partycji było 200 (trzeba się namęczyć z optymalizacją i SQL wtedy nie jest czytelny, nie można używać prepared statemat i robić SELECT na konkretnej partycji w miarę możliwości). Dodatko baza zaczęła zajmować sporo miejsca. Najgorsze były migracja bazy na nowsze wersje...

Ostatnio

marrbacca

30.05.2019, 19:03:37

@bi-tek: A może influxdb? Specjalnie przygotowana baza pod tego typu dane

Wyrewolwerowanyrewolwer

29.08.2017, 17:05:21

Jak Uber obsługuje milion zapisów na sekundę przy użyciu Mesos i Cassandry

http://highscalability.com/blog/2016/9/28/how-uber-manages-a-million-writes-per-second-using-mesos-and.html

#skalowalnosc #generycznosc
Dobra, koniec bluzgów

5z7k9

25.02.2015, 19:42:21

Czy jakiś mirek pracował na ogromnych(miliardy rekordów, miliony aktywnych użytkowników), dobrej wydajności, wysokiej dostępności, skalowalnych bazach danych, oraz ogółem systemach informatycznych?
Może opowiedzielibyście swoje doświadczenia, a tym samym zaproponowali jakąś bazę, narzędzia, software?
W jakim środowisku działaliście(np. AWS/Azure/..., C++/Java/Python/PHP/..., Ubuntu/CentOS/Debian/..., Nginx/Apache/IIS/...)?
Jestem szczególnie ciekawy jak PHP współpracuje z takimi rozwiązaniami. (✌ ﾟ ∀ ﾟ)☞

Może znajdzie się tu jakiś inżynier Google'a, Facebooka, czy innego Microsoftu za $15k/tydzień. (

Regis86

25.02.2015, 21:32:01

@5z7k9: Dla Hadoopa to raczej niewiele, wszak to raczej "offline storage", a nie baza danych "online". http://www.techrepublic.com/article/why-the-worlds-largest-hadoop-installation-may-soon-become-the-norm/ - "Yahoo! has more than 100,000 CPUs in over 40,000 servers running Hadoop, with its biggest Hadoop cluster running 4,500 nodes. All told, Yahoo! stores *455 petabytes* of data in Hadoop."

Z góry przepraszam za wrzucanie tu i ówdzie angielskiego słownictwa - niestety taki nawyk, bo to język, w którym "pracuję" i niektórych słów nawet nie znam w Polskiej wersji, albo dziwnie mi po Polsku brzmią :P

Co do pytań - po

Regis86

25.02.2015, 22:28:12

@dagon_666: Nie do końca od nowa. Nie chcę się rozpisywać, ale spróbuję w skrócie opowiedzieć:

Hadoop / Spark (tego teraz używam) generuje dane "przyrostowo" - tzn. cały czas dodaje nowe dane do starych (tworząc nowe "zbiory" danych - słowo klucz to "immutable"), ale nigdy nie nadpisuje starych i na każdym etapie przetwarzania tworzy "snapshoty", od których potem potrafi "wznowić" przetwarzanie kolejnego dnia, a następnie ładuje dane do bazy nadpisując "stary" stan świata nowym (słowo klucz - "idempotent").

Tzn. wyobraź sobie system, który codziennie zbiera dane z czujników w - dajmy na to - fabryce, które raportują swój stan co sekundę i prezentuje je w postaci statystyk. Statystyki mają być godzinowe, dzienne, tygodniowe, miesięczne, kwartalne i roczne (statystyki "real time" też da się z tego zrobić i idealnie nada się tu Kafka, ale to by był jeszcze dłuższy wykład). To, jak taki system może działać to: wszystko bez przerwy trafia na HDFS / Amazon S3 do katalogu, który zawiera datę z dokładnością do godziny, następnie co godzinę odpala się "job" (Spark / Hadoop), który w jakiś sposób agreguje te dane. Najpierw te godzinowe (po zakończeniu godziny), potem (na koniec dnia) te dziennie, potem dzienne do miesięcznych itd. Następnego dnia nie musisz przeliczać od "dnia 0" wszystkich danych co godzinę, bo dla danych miesięcznych masz gdzieś przeliczone wszystkie dni - jeśli masz przeliczone 30 dni i dzisiaj jest 31, ostatni dzień miesiąca, to używasz gotowych danych z 30 dni (być może nawet wstępnie zagregowanych to "niepełnego" miesiąca) i przeliczasz od zera tylko ostatni dzień, a potem wszystko to agregujesz do miesiąca. Dzięki temu każdego dnia dostajesz tylko "deltę" (różnicę), którą ładujesz w ciemno - ma ona np. 10, 20, może 50 GB, a nie 30 TB (cała

doswiadczenia w skalowaniu Reddit

Garsc bardzo ciekawych doświadczen developerów serwisu Reddit. Solidna porcja doświadczeń ludzi skalujących bardzo duży serwis.

z dodany: 07.03.2010, 11:07:17

Gdybym miał 5 procent, czyli Parę słów o problemie skali

Kiedyś umieściłem na stronie JavaScript o wielkości 48 KB. Ponieważ umieściłem go w nagłówku strony, był on ładowany za każdym razem gdy ktoś wchodził na stronę. Nawet na stronach gdzie go nie potrzebowałem. Przy pierwotnej liczbie odwiedzin było idealnie - mały i przydatny skrypt dawał mi funkcję jakiej potrzebowałem.

z dodany: 27.12.2008, 08:26:17