Wpis z mikrobloga

#regex #javascript #webdev #frontend #programowanie
Potrzebuję takiego regexa:

np. var str = "Bla bla bla m o n o d y s c y p l i n a blablabla, bla bla bla. Lorem ipsum c y b e r n e t y k a , mini pini sini da bum tsy.";

Żeby dopasowało do wszystkich wyrazów które mają space między znakami.
Wstępnie wiem, że musi mieć spację po ostatnim znaku.
Składać się z co najmniej 3 znaków nie białych - żeby pominąć spójniki typu "i", "a", "o".
Ale jak już znajdzie 3 to powinno szukać dalej a nie się zatrzymywać.

var tab = str.match(/* co tutaj?*/);
  • 29
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • Doceń
@wytrzzeszcz: Chyba trzeba jeszcze uwzględnić że może być znak ">" ale będę testował dalej. Bo to jest plik pdf skonwertowany do html i tam różne śmieci do stylu są.
  • Odpowiedz
@wytrzzeszcz: @wytrzzeszcz: Jeszcze jest pełno błędów bo w tym są różne spany obejmujące niektóre polskie znaki i niektóre spacje, niektóre terminy są dwuwyrazowe to też trzeba uwzględnić jakoś. Cuda. Albo najpierw je usunę albo ręcznie popoprawiam te błędy...
  • Odpowiedz
@wytrzzeszcz: Nie rozumiem z tym zgłoś link.

Nie rozumiem też co za sed? O co chodzi?

@MirkoStats: To jest plik pdf skonwertowany do html. Sam plik pdf miał jakieś takie dziwne ostylowania, poszatkowane wyrazy. Nie wiem dlaczego. Ale innej wersji tego pliku nie mam.
Więc raczej nie mam innego sposobu. Można coś wykryć sam początek tagu ale potem będzie problem ze span bo raczej nie mogę wszystkich
  • Odpowiedz