Wpis z mikrobloga

#java #programowanie #wykopapi

Jakis pomysl na proste wyłuskiwanie hashtagów z wpisów na mirko? Pobieram wpisy bez kodu HTML.

Mój pomys był taki zeby spitować po spacjach, wyszukiwać słowa zaczynające się na # i traktowac je jako tagi, ale to nie dziala jak ktos nie da spacji miedzy wczesniejszym tagiem a nowym, no i czasami jak ktos dodaje tag ze znakami specjalnymi typu "burza we # wrocla'iu" to bym czytal cale slowo "wroclaw'iu" jako tag. Lepiej by było ściagac wpisy z tekstem HTML i traktowac to parserem XML?
  • 14
@Grizwold: A nie lepiej parserem html ? Wszystkie wykopowe hasztagi masz w ładnym opakowaniu

Nie jestem pewien co do wydajności obu rozwiązań. Prościej na pewno będzie użyć parsera html/xml.
@marooned: Jak się przez API ściąga wpisy to nie jest to tak opakowane jak napisałeś tylko

#gimbynieznajo
ale i tak wyprubuje wpisy ściagniete z kodem HTML i przepuszcze to przez parser. Chcociaż cos czuję, że to bedzie zabijanie komara z armaty ;)
@PanKara: chodzi mi tylko o tagi :) w tej chwili potrzebuje takiej funkcji która z podanego tekstu wypluje mi poprawne hashtagi. I kombinuje najprostrzy sposób. Jedak świąteczne lenistwo i nalewka mojej mamy źle wpływa na kreatywnośc :)
Mój pomys był taki zeby spitować po spacjach, wyszukiwać słowa zaczynające się na # i traktowac je jako tagi, ale to nie dziala jak ktos nie da spacji miedzy wczesniejszym tagiem a nowym, no i czasami jak ktos dodaje tag ze znakami specjalnymi typu "burza we # wrocla'iu" to bym czytal cale slowo "wroclaw'iu" jako tag. Lepiej by było ściagac wpisy z tekstem HTML i traktowac to parserem XML?


@Grizwold: (#)