@rzet: dla niektórych big data się zaczyna od 1PB

A przetwarzanie w czasie rzeczywistym jak sama nazwa wskazuje jest, kiedy wynik tego co chcesz otrzymać otrzymujesz natychmiast*

*zawsze będzie opóźnienie więc przez czas rzeczywisty rozumie się tak naprawdę "near-realtime", gdzie opóźnienie rzędu nawet kilkunastu ms jest akceptowalne.
No i niektórym nie jest już do śmiechu w sprawie potocznie znanej jako Skynet....

A study by AI researcher Steve Omohundro just published in the Journal of Experimental & Theoretical Artificial Intelligence (open access) suggests that humans should be very careful to prevent future autonomous technology-based systems from developing anti-social and potentially harmful behavior.

Informacja:

http://www.kurzweilai.net/preventing-an-autonomous-systems-arms-race

Wspomniana praca:

http://www.tandfonline.com/doi/abs/10.1080/0952813X.2014.895111#.U1l87_ldVFs

#skynet #ai #bigdata #machinelearning #programowanie
@Klopsztanga: To interferjs sql(opodobny) dostępu do hadoopa. Alternatywa dla hive.

Generalnie dane mozesz wrzucac w formacie plikow tekstowych i mieć do nich dostęp za pomocą sqla.

Na stronach hortonworks znajdziesz bardzo fajne wprowadzenie i omówienie podtsawowych elemntów stacka hadoop
@KotoFan: Faktem jest ze amazon co jakis czas obniza ceny czesci produktow. I nie da sie udowodnic ze to co zrobil jest podytkowane krokiem Googla. Po prostu osobiscie jestem przekonany ze wplyw na obnizke cen S3 od 39% do 65% mial w pewnej czesci gogiel.
Produkt można by zrobić spokojnie bez opierania się o Orakla.


@aaadaaam: Wiele rzeczy mozna, co nei znaczy ze trzeba i ze to jest optymalna droga. Jesli ktos kupuje licencje na oracle RAC zeby prowadzic bloga na wordpresie o kotkach to jest to zly pomysl, ale jest wiele zastosowan gdzie takie rozwiazanie ma sens. Poza tym klienci maja rozne wymogi - czy to w przetargu, czy to jesli chodzi o rozne certyfikacje.
Jak ktos ma ochote zapoznac sie z #hadoop i #bigdata w domowym zaciszu to tutaj sa bezplatne zasoby na start:

Wirtualne obrazy ze wszystkim co trzeba skonfigurowanym, do odpalenia w #virtualbox #vmware albo #hyperv

http://hortonworks.com/products/hortonworks-sandbox/#install

Troche tez #webdev i #serwerownia , bo mozna te bezplatne narzedzia wykorzystac na przyklad do tego

Analyzing Server Logs http://www.youtube.com/watch?v=BPC_mClNSXk

Analyzing Clickstream Data http://www.youtube.com/watch?v=weJI6Lp9Vw0

Prosty tutoriall, krok po kroku zapoznajacy z narzedziami i sposobem korzystania z nich