Wpis z mikrobloga

Skopiuj link

13.07.2025, 01:30:50

Testował ktoś gemini 2.5 pro bezpłatne i płatne i ogarniał różnice?
Nie mogę się doszukać tego na benchmarkach, a ostatnimi czasy ten model zrobił na mnie wrażenie w swojej bazowej bezpłatnej formie - rozważam przerzucenie się z o3.

[cele czysto edukacyjne, benchmarki typu 'science']

Ew. jeśli ktoś testował gemini 2.5/o3 i porównywał z grokiem 4 bazowym to też może dać znać.

#sztucznainteligencja #gemini #gpt #ai #programowanie15k #grok

waydack

13.07.2025, 06:37:43 via Wykop

@KryptonZ: Z Gemini 2.5 Pro w płatnej sesji po prostu korzystasz bez oporów w płatnej subskrypcji za 99 PLN miesięcznie. To jest jedyna różnica między wersją płatną i bezpłatną, chyba że chodzi ci o jakąś wersję z rozszerzonym myśleniem która jest w abonamencie za 250 dolarów, ale to chyba było na razie tylko zapowiadanie i tego modelu nie ma jeszcze w powszechnym użyciu.

solid959

13.07.2025, 07:31:40 via Android

@KryptonZ @waydack
Podłącze się trochę do wątku z pytaniem który "chat" warto kupić?
Zastanawiam się nad subskrypcją na próbę na kilka mcy ale nie wiem w co pójść.
Z moje strony potrzebuję czegoś do programowania glownie python i ogólnych rozważań inżynierskich włączając obliczenia.
Macie jakiś faworytów?

turok2016

13.07.2025, 08:15:59 via Wykop

@solid959: jak się zastawiasz i nie wiesz co wybrać to może https://openrouter.ai/ wpłacasz hajs i masz sporo AI do wyboru więc będziesz mógł potestować

Arkass

13.07.2025, 10:26:31 via Wykop

@KryptonZ:
@solid959
Tu możecie sam chat sobie potestować na różnych modelach za FREE: https://lmarena.ai/?mode=direct
Wystarczy tam na górze wybrać model.

waydack

13.07.2025, 12:00:00 via Wykop

@solid959: Najlepszy do kodowania jest Claude. W wersji płatnej za 20 dolarów masz dwie wersje Claude Sonnet i Opus. Opus to prawdopodobnie obecnie najlepsza sztuczna inteligencja na świecie, zwłaszcza w kodowaniu ale w tej wersji subskrypcji Opus jest ograniczony do kilku zapytań ale można spokojnie korzystać z Sonnet który też jest świetnym modelem. W wersji za 100 lub 200 dolarów masz już większe limity i dostęp do Claude Code, ich

KryptonZ

13.07.2025, 17:15:27 via Wykop

@Arkass: modele te ewidentnie są znerfione. Widżę to po ich o3 i gemini 2.5 pro.

Arkass

13.07.2025, 17:37:27 via Wykop

modele te ewidentnie są znerfione. Widżę to po ich o3 i gemini 2.5 pro.

@KryptonZ: IMO:
Nie są to otwarte modele, aby ktoś sobie na ich podstawie stworzył jakieś lżejsze wersje i je udostępniał na LMArena.
- Zatem albo zamiast tych modeli to są wykorzystywane tam jakieś inne modele.
- Albo Twoja ocena nie jest miarodajna

KryptonZ

13.07.2025, 18:12:32 via Wykop

@Arkass: widzę to po prostu po tym, że gemini 2.5 pro na pewne pytania medyczne odpowiada niepoprawnie, a na google ai studio już tak.

Tak samo widzę to, że o3 zwyczajnie krócej myśli niż u chataGPT - ale to akurat mało rzetelna informacja ze względu na to, że nie wiem czy różni się szybkość przy tokenach i przy przeglądarce/aplikacji z subskrypcji

Arkass

13.07.2025, 18:20:05 via Wykop

@KryptonZ: IMO:
No, ciekawa sprawa. Też jestem ciekaw wytłumaczenia, jak istnieje inne niż losowość, że czasami te modele odpowiadają lepiej a czasami gorzej, i akurat na LMArena trafić się mogły serie tych gorszych odpowiedzi.

KryptonZ

14.07.2025, 04:38:40 via Wykop

Podczas używania intensywnego do nauki stwierdzam:

1. Najnowszy model gemini ma zdecydowanie tryliard razy lepszej jakości dane, aktualniejsze niż o3 w większości przypadków.
2. o3 ma lepsze rozumowanie, ale gorszą bazę danych - przez co sumarycznie gorzej wypada w szerokopojętej kategorii "science"

Info z piątnicy.
Bezkonkurencyjnie, serio, gemini wygrywa w mojej, em, domenie/niszy (nie mówię o programowaniu, bo zwyczajnie tego nie uprawiam)

KryptonZ

14.07.2025, 22:57:06 via Wykop

Porównałem na lmarenie groka 4 z gemini 2.5 pro w pojedynczym pytaniu abcd medycznym, które zwyczajnie pokazuje mi wady danego modelu w tldr (bo raczej benchmarków wiarygodnych nie ma póki co najnowszych)

Grok 4 przegrał. XD

Aktywne Wpisy

Lolenson1888

Lolenson1888 +138

3 godz. i 40 min temu

Niesamowite jest to jak ostry, wyraźny, bez strefy przejściowej jest ten podział gdzie się mówi „wychodzę na dwór”, a gdzie się mówi „wychodzę na pole”. Niemal równo z granicami województw małopolskiego i podkarpackiego, co jest przecież nietypowe jak na Polskę. Niby rysuje się granica Galicji, ale nie do końca, bo są wyjątki (Kazimierza Wielka, Miechów, Proszowice). Jedziesz na zakupy z Sandomierza do Tarnobrzega i już jesteś w zupełnie innej strefie językowej xD

Lolenson1888 - Niesamowite jest to jak ostry, wyraźny, bez strefy przejściowej jest t... — **źródło:** 035645EB-B0C2-4590-9E2E-1FA2D7CE8200
Pobierz

maria_kiribati

maria_kiribati 0

4 godz. i 8 min temu

czy zdarza wam się skrobać przednią szybę od środka przy minusowych temperaturach? Obecnie w tych okolicach zera widzę sporo wilgoci/niemalze wody, a im dalej w zimę, tym będzie gorzej. Nie wiem, jak temu przeciwdziałać, skad tyle tej wilgoci. Jakieś woreczki z ryżem czy te takie pochłaniacze allegrowe nic nie dają ( ͡° ʖ̯ ͡°)

#kiciochpyta #samochody

Aktywne Wpisy

Aktywne Znaleziska

Uczniowie z Sosnowca masowo rezygnują z religii.

Wyścig radiowozów w strefie 50 km/h! Policja sama stwarzała zagrożenie.

"Szukamy taty". Rodzina pracownika Straży Granicznej prosi o pomoc.

ZUS: Mała firma po kontroli straci 137 000 zł

Kolejne agresywne psy siejące postrach

Popularne tagi