Wpis z mikrobloga

Cześć,

w nazwiązaniu do poprzednich wpisów (1, 2) zaktualizowałem stronę i powstała wersja 3.0. Komentarze i uwagi mile widziane.

Przeglad Portali

Co nowego:
- wprowadzenie stemmingu, czyli lematyzacji (wyciąganie podstawowej wersji słów, np. uchodźców -> uchodźca),
- zmiana paczki do tworzenia chmury, teraz chmura to zbiór elementów w formacie SVG, przyjemniejsza paczka, szybciej się ładuje, można korzystać z ctrl+f itp.,
- kosmetyczne zmiany we froncie,
- 2 nowe kanały RSS (w sumie jest ich 10).

#python #webdev #programowanie
galatian - Cześć,

w nazwiązaniu do poprzednich wpisów (1, 2) zaktualizowałem stron...

źródło: comment_FXsPgOUQ19DgzWApMY7l1g79HoB8SMG9.jpg

Pobierz
  • 24
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@gastlich: dzięki i za tamten komentarz też dzięki :)
nie znalazłem gotowej biblioteki do tego w Pythonie (dla ang jest), więc prawie się poddałem, ale w końcu zaimpelementowałem swój stemming
  • Odpowiedz
@Kurczak_w_sosie_slodko-kwasnym: nie ma tutaj jakiegoś konkretnego celu, zrobiłem to bardziej hobbystycznie,

sens korzystania jest taki (i sam tak z tego korzystam), że wchodzisz sobie i rzucasz okiem co nowego w wiadomościach, ew. jak coś interesującego zobaczysz to klikasz w link i czytasz,

no, ale przede wszystkim fajnie widać ważne problemy/ wydarzenia z przeszłości, polecam Archiwum, z którego od razu możemy przechodzić do starszych artykułów
  • Odpowiedz
@galatian: o, ciekawy pomysl, mozna to troche traktowac jak trendy w twitterze. z uwag - dorob liste "stop-words" (lub uzupelnij jak juz ja masz), np teraz trafilo mi sie "ani" (tak jak w zdaniu "ani jeden ani drugi")
  • Odpowiedz
@galatian: to moze idz za ciosem i zrob chmury tematyczne (naglowki z portali technologicznych, motoryzacyjnych itd), ciekawe jakby to wygladalo. ps. Jak zarobisz na tym pomysle pierwszy milion to daj znac na pw :)
  • Odpowiedz
@lecielinfini: nie wiem, słowa 'lematyzacja' użyłem dzisiaj po raz pierwszy chcąc wytłumaczyć co zrobiłem,

wg tego źródła to jest podobne, ale natrafiłem teraz na ten wątek i rzeczywiście, masz rację, to co ja robię to lematyzacja (wg słownika), a nie stemming, czyli sprytne obcinanie końcówek
  • Odpowiedz
@galatian: ja - być może błędnie zapamiętałem - byłem uczony, że lematyzacja to sprowadzenie słów: kochany, kochane, kochanie, kochanka, itp. do słowa kochać (czy może nawet "miłość"), a stemming to sprowadzenie tych wyrazów do wspólnego rdzenia - w tym przypadku kocha*
  • Odpowiedz