Muszę zrobić wyszukiwarkę opartą na silniku wyszukiwania, w moim przypadku jest to Apache Solr. Wyszukiwarka będzie miała możliwość wpisania jakiegoś tekstu(to działa) ale ma mieć dodatkowo możliwość filtrowania po dodatkowych atrybutach, które są dynamiczne tzn. dany produkt ma kilka atrybutów z puli wszystkich dostępnych i mogą się zmieniać. W jaki sposób zaprojektować taką elastyczną strukturę danych w Solr, aby udostępnić wyszukiwanie po takich obiektach? Macie może jakieś materiały na ten temat do
#programowanie #webdev #solr #lucene
mirki najdroższe czy przy aplikacji podzielonej na backend i frondend w angularze z baza sql i solrem do wyszukiwania jakiegos typu danych. To czy lepiej solra ukryc za backendem i wtedy gdy user wpisuje cos w wyszukiwarke, backend odpytuje solra i dostaje idki ktore szczegolowo pobiera z bazy sql, czy lepiej bezposrednio z wyszukiwarki uderzac do solra i ladnie wyswietli tego jsona ktorego daje nam w odpowiedzi?
Łatwiej
1 file changed, 3 insertions(+), 1 deletion(-)
#chwalesie

Właśnie zgłosiłem Pull Requesta do repozytorium Apache'a :) Fix drobny (dodatkowy link do repozytorium pakietów), ale dlatego, że inne repo padło, to bez tego nie da się w ogóle skompilować źródeł.

Trzymajcie teraz kciuki. Fajnie byłoby mieć na swoim koncie na githubie, że jest się contributorem Apache'a :)

#programujzwykopem #programowanie #apache #solr
4 files changed, 290 insertions(+), 1 deletion(-)
https://github.com/noisy/LiczbaSlownie

Gdyby ktoś kiedyś potrzebował, to przepisałem z pythona na #java'ę małą klaskę do zamiany liczb na ich reprezentację słowną w języku polskim.

np. 845 -> osiemset czterdzieści pięć

Co ciekawe nie robiłem tego 4fun, lecz było mi potrzebne, by móc napisać własny

TokenFilterFactory
do #solr (coś wspominałem tutaj)

BTW... już jako zdeklarowany #python.owiec pierwszy raz od prawie roku musiałem napisać coś javie...
@noisy: No proszę, miło widzieć, że mój pomysł się spodobał :)

Btw, trzeba było od razu pisać, że chodzi o Javę - miałem gdzieś gotową klasę: obtestowaną, i z implementacją mieszczącą się na jednym ekranie ;)
Czy ktoś z was nie korzystał/generował sobie jakiegoś słownika polskich liczebników?

1 jeden
2 dwa
3 trzy
...
100000 sto tysięcy
...
542 875 pięćset czterdzieści dwa tysiące osiemset siedemdziesiąt pięć
...
1000000000 miliard
powiedzmy właście z zakresu 0-10^9 :)

Modyfikuję słownik #morfologik.a dla #solr.a. Udało mi się już zmodyfikować go na tyle, że możliwe jest wyszukiwanie za pomocą odmienionych słów. To właśnie daje stemming z morfologika, np. "Gry
jeszcze chcę zrobić małe testy jakich liczebników tak naprawdę potrzebuję... 10^9 dodatkowych lini w słowniku cholernie by go spowolniło. Dotychczasowy słownik miał "tylko" 4 mln lini.
Kto właśnie z sukcesem zakończył święta przekompilowując słownik polskiego stemmera morfologik do SOLRa, by możliwe było nie tylko wyszukiwanie za pomocą odmienionych form wyrazów np. "Grą o trony", ale także (i jednocześnie!) możliwe wyszukiwanie bez polskich liter?

1. Ja :)

Podsumowując, święta można zaliczyć do programistycznie udanych :) BTW... w ramach treningowych zabaw z Django i SOLRem zastanawiam się, czy nie spróbować postawić alternatywnej przeszukiwarki wykopowych zasobów. Ktoś już próbował? Jakieś przemyślenia?
49 files changed, 2441 insertions(+), 18 deletions(-)
Po co bawić się w żmudną edycję plików konfiguracyjnych SOLRa, skoro można sobie zrobić maszynkę, która będzie wszelkie pliki sprytnie generować :) osobną konfiguracje na produkcję, osobną w środowisku developerskim, osobną do unittestów :)

#programujzwykopem #spistresci #solr
Czekałem miesiąc z fixem, bo nie wiedziałem, jak coś naprawić. W końcu wymyśliłem i zrobiłem... zaimplementowałem nową funkcjonalność do biblioteki, której używam, wysłałem pull requesta....

Zacząłem kończyć swojego fixa... po czym zorientowałem się, że nadal występuje pewien corner case.... i tak się zacząłem dalej zastanawiać.. i nagle mi wyszło, że da się to nawet fajnie rozwiązać... bez tego nad czym miesiąc myślałem :/

No i teraz mi powiedzcie, bo ja już nie