poszukuje generatora AI, który z wybranego zdjęcia przerobi je na różne motywy, czy doda coś itp (po opisie) nic profesjonalnego, chce parę fot ze ślubu przerobić koledze. coś łatwego w obsłudze. najlepiej free, ale jak będzie nie za drogo to też płatne
#ai #technologia #chatgpt #technologia #openai #ainews #aiart #artificialintelligence #fotografia #kiciochpyta
  • 13
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Kamson_San: to nie ma tak, że polecasz albo nie polecasz, tam masz comfyui, którym zrobisz każdą modyfikację zdjęcia, ale trzeba używać różnych modeli i różnych technik, w linku jest wiele gotowców, jako początkujący musisz się przygotować na kilkanaście godzin zabawy jeśli masz zrobić to perfekcyjnie, no i tam jest najtaniej jeśli chodzi o dostęp komercyjny, zerknij sobie na moje wpisy, bo czasem dla zabawy coś zmodyfikuje i tu wrzucę, w
  • Odpowiedz
@makrofag74: Dzięki ale nie to miałem na myśli.
Gemini mam pro więc nie potrzebuję tamtych.
Gemini mi podziwiał że mam szukać pod hasłami Gem lub Custom Instructions Gemini
Ale średnio z wynikami
  • Odpowiedz
@Trismus: oburzenie takie samo jak że wykształceni ludzie po wyższych uczelniach nie głosują już tak bardzo na republikanów.
Pewniw wina uczelni i za mało tam opowiadają o tym że biały człowiek dobry a inni źli.
  • Odpowiedz
  • 1
@666Forest: jakby ktoś był ciekawy to natrafiłem na:

MagicPlan
Aplikacja, która przekształca smartfon lub tablet w narzędzie do projektowania wnętrz. Umożliwia tworzenie planów pomieszczeń oraz ich wizualizację na podstawie zdjęć.
  • Odpowiedz
Google DeepMind zaskoczyło wszystkich i wprowadziło nowy model "rozumujący" o nazwie Gemini-2.0-Flash-Thinking-exp. Bazuje on na architekturze Flash i aktualnie zajmuje pierwszą pozycję we wszystkich kategoriach Chatbot Arena. Można go wypróbować już dziś w Google AI Studio.
x.com/OfficialLoganK/

W ramach współpracy badawczej obejmującej ponad 20 laboratoriów, zaprezentowano Genesis - platformę do symulacji fizyki typu open-source. Genesis potrafi przetworzyć 43 mln klatek na sekundę na pojedynczym RTX 4090. Napisany w Pythonie działa 10-80 razy szybciej niż
PeterWeiss - Google DeepMind zaskoczyło wszystkich i wprowadziło nowy model "rozumują...

źródło: @eoft_ai 01

Pobierz
  • 34
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 17
Kalendarz adwentowy OpenAI: dzień 12.
OpenAI pokazało wyniki dwóch nowych modeli bazowych nowej generacji – o3 i o3-mini, które osiągnęły przełomowe wyniki w zadaniach związanych z kodowaniem, matematyką i rozumowaniem. Najbardziej imponujące jest to, że model o3 zdobył 87,5% w teście ARC (przewyższając poziom ludzki wynoszący 85%), podczas gdy o3-mini dorównuje możliwościom modelu o1 przy znacznie niższych kosztach. Przypomnnę tylko, że GPT-3 zdobył całe 0%, a GPT-4o oszałamiające 5%.
Model o3 osiągnął również
  • Odpowiedz
Pojawiła się bardzo ciekawa publikacja od naukowców z Tsinghua i Peking. Omawiane są w niej wyzwania związane z diagnozowaniem i leczeniem chorób rzadkich ze względu na ich złożone objawy oraz brak specjalistów z odpowiednim doświadczeniem.
Aby stawić czoła tym wyzwaniom autorzy zaprezentowali "RareAgents", opisane jako pierwszy wielodziedzinowy zespół agentów opartych na LLM i to specjalnie zaprojektowanych dla kontekstu chorób rzadkich. System wykorzystuje zaawansowane planowanie, mechanizmy pamięci oraz funkcje narzędzi medycznych. Co ciekawe
PeterWeiss - Pojawiła się bardzo ciekawa publikacja od naukowców z Tsinghua i Peking....

źródło: fofrAI living room with a magical portal to another realm on the wall, through the portal you can see a forest GbPRJIWakAETezG

Pobierz
  • 10
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 5
Kalendarz adwentowy OpenAI: dzień 11.
OpenAI wprowadziło istotne aktualizacje do aplikacji desktopowych ChatGPT, wprowadzając zintegrowaną kontrolę aplikacji oraz funkcje interakcji głosowej. System pozwala na bezpośrednią pracę z aplikacjami takimi jak Xcode, VS Code, Notes, Notion i Quip poprzez API dostępności, co stanowi znaczący krok w kierunku zautomatyzowanej pomocy w zadaniach na komputerze. Funkcjonalność dostępna również dla użytkowników o1-Pro.

→ System umożliwia bezpośrednią pracę z aplikacjami desktopowymi poprzez skróty klawiszowe jak option-space i option-shift-one. System
PeterWeiss - Kalendarz adwentowy OpenAI: dzień 11.
OpenAI wprowadziło istotne aktuali...
  • Odpowiedz
Carnegie Mellon University stworzyło CaLoRAify - innowacyjny system szacowania kalorii na podstawie tylko jednego zdjęcia i wykorzystujący modele wizualno-językowe. Korzysta z technik LoRA oraz RAG. Potrafi również na podstawie zdjęcia wskazać składniki i podać przepis. System jest elastyczny, umożliwiając interakcję w formie rozmowy, co czyni go prostym i dostępnym narzędziem dla osób chcących monitorować swoją dietę i spożycie kalorii.
Nie licząc faktu, że wymaga GPU Nvidii z przynajmniej 48 GB VRAM ;-)
[
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - Carnegie Mellon University stworzyło CaLoRAify - innowacyjny system szac...

źródło: joes_ai_x GfCNe-obcAAli4P

Pobierz
  • 10
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 16
Kalendarz adwentowy OpenAI: dzień 10.
Amerykańcy użytkownicy mogą się teraz kontaktować z ChatGPT za pomocą telefonu. I to nawet takiego zabytkowego z wybieraniem tarczą. Wystarczy zadzwonić pod numer 1-800-242-8478 (1-800-CHATGPT). 15 minut jest za darmo.
ChatGPT jest również dostępny na WhatsApp. Globalnie.
PeterWeiss - Kalendarz adwentowy OpenAI: dzień 10.
Amerykańcy użytkownicy mogą się te...

źródło: rotary phone

Pobierz
  • Odpowiedz
@PeterWeiss: niegłupi pomysł z gpt dostępnym pod numerem telefonu. Osoby nietechniczne to całkiem duża grupa.
U nas, przypuszczam, po odpowiednim rozreklamowaniu tryb głosowy chatgpt na telefon robiłby furorę wśród osób starszych. Szczególnie wśród samotnych, które często nie mają się do kogo odezwać. I to nawet nie chodzi o porady, ale zwykłą rozmowę.
  • Odpowiedz
Naukowcy z Uniwersytetu Floryda Atlantic przeprowadzili pionierskie badanie mające na celu stworzenie systemu, który może w czasie rzeczywistym rozpoznawać gesty języka migowego (amerykańskiego ASL, bo język migowy nie jest uniwersalny).
Użyli oni MediaPipe do śledzenia ruchu dłoni oraz modelu YOLOv8 do stworzenia systemu rozpoznawania gestów. Jest to podejście, które nie było wcześniej stosowane w badaniach. Ich metoda osiągnęła imponującą dokładność na poziomie 98%(!)
Badanie ma ogromny potencjał praktyczny. Może pomóc:
→ Poprawić komunikację dla
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - Naukowcy z Uniwersytetu Floryda Atlantic przeprowadzili pionierskie bada...

źródło: @Kazi5isAlive 01

Pobierz
  • 15
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 21
Kalendarz adwentowy OpenAI: dzień 9.
→ O1 jest teraz dostępne przez API wraz z poniższymi feature'ami:
- Function calling (połączenie z zewnętrznymi danymi).
- Developer messages (instrukcje dotyczące stylu/tonu).
- Analiza obrazów i parametr reasoning_effort (kontrola nad czasem odpowiedzi).

PeterWeiss - Kalendarz adwentowy OpenAI: dzień 9.
→ O1 jest teraz dostępne przez API ...

źródło: 66981005b4742

Pobierz
  • Odpowiedz
  • 24
Bonus: Udostępnione zostały checkpointy modelu BiMediX2. Jest to multimodalny model medyczny stworzony przez badaczy z Uniwersytetu im. Mohammeda bin Zayeda. Zbudowano go na bazie Llama 3.1 i potrafi on interpretować obrazy medyczne (RTG, CT, MRI). W celu rozszerzenia dostępu do opieki zdrowotnej dla ponad 400 milionów arabskojęzycznych użytkowników został on zintegrowany jako chatbot na platformie Telegram.

BiMediX2 zdobył nagrodę na Llama Impact Innovation Awards i był prezentowany na 79. Zgromadzeniu
PeterWeiss - Bonus: Udostępnione zostały checkpointy modelu BiMediX2. Jest to multimo...

źródło: BiMediX2

Pobierz
  • Odpowiedz
Meta wprowadza trzy nowe funkcje do okularów Ray-Ban: AI na żywo, tłumaczenia na żywo i Shazam.
AI na żywo umożliwia rozmowę z asystentem Meta i analizę otoczenia w czasie rzeczywistym (teoretycznie będzie mógł zasugerować przepisy kulinarne na podstawie składników na które patrzysz). Tłumaczenia na żywo obsługują języki angielski, hiszpański, francuski i włoski, z możliwością odsłuchu lub wyświetlenia transkrypcji na telefonie. Oczywiście funkcje te są "US&Canada only".
theverge.com

Naukowcy z Meta i Stanford udostępnili rodzinę
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - Meta wprowadza trzy nowe funkcje do okularów Ray-Ban: AI na żywo, tłumac...

źródło: @AIFischermann 06 b

Pobierz
  • 15
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 26
Kalendarz adwentowy OpenAI: dzień 8.
OpenAI udostępniło funkcję wyszukiwania w ChatGPT wszystkim (zalogowanym) użytkownikom darmowych kont na całym świecie. Dodano również wyszukiwanie głosowe oraz ulepszono działanie aplikacji na różnych platformach.
Najważniejsze zmiany:
→ Wydajniejsze wyszukiwanie i lepsza obsługa na urządzeniach mobilnych.
→ Integracja z mapami (w tym Apple Maps) i dostęp do lokalnych informacji.
→ Wyszukiwanie głosowe, które pozwala uzyskiwać informacje z internetu w czasie rzeczywistym i prowadzić rozmowy w wielu językach.
PeterWeiss - Kalendarz adwentowy OpenAI: dzień 8.
OpenAI udostępniło funkcję wyszukiw...

źródło: 7rydfxszig0e1

Pobierz
  • Odpowiedz
@PeterWeiss: > Alchemia XXI wieku ;-)
Tłumaczenie: Nie wiemy dokładnie jak i dlaczego to działa, ale działa, więc proszę bardzo - częstujcie się!

Widziałem wczoraj na rddt. Ciekawy temat. Owszem, taki gemini może podsumować filmik na yt, ale robi to tylko po napisach lub tekście z transkrypcji. Za to ten tool analizuje też obraz, więc może być przydatny dla entuzjastów kodowania po godzinach ( ͡° ͜ʖ ͡°
jestemtakizmeczony - @PeterWeiss: > Alchemia XXI wieku ;-)
Tłumaczenie: Nie wiemy dok...

źródło: apollo

Pobierz
  • Odpowiedz
Pika, model do generowania wideo doczekała się wersji 2.0. W tej aktualizacji po raz pierwszy można zbudować ujęcie z konkretną postacią, obiektem, strojem i tłem zgodnym z własnym widzimisie. Można przesłać dowolną liczbę zdjęć referencyjnych i dodać prompt. Przykład w komentarzu niżej.
pika.art

Dość niespodziewanie Meta wsparła Muska i skierowała pismo do prokuratora generalnego Kalifornii, krytykując przekształcenie OpenAI z organizacji non-profit w firmę komercyjną. Meta sugeruje, że nowy model biznesowy może umożliwić inwestorom
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - Pika, model do generowania wideo doczekała się wersji 2.0. W tej aktuali...

źródło: GedCAJSWEAA3WLT

Pobierz
  • 20
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 42
Bonus: Hector v2 został przetestowany na pustyni Mojave. I zdał egzamin!
Hector to ambitny projekt naukowy, który ma na celu stworzenie małego, ale bardzo wydajnego humanoidalnego robota. A dlaczego ten mały gnojek jest tak wyjątkowy?
→ Otwarty kod: Wszystkie informacje o tym, jak zbudować i jak działa Hector, są dostępne dla wszystkich.
→ Niski koszt: Celem twórców Hectora jest stworzenie robota, który nie będzie kosztował kroci.
→ Duże możliwości: Hector ma być
PeterWeiss - Bonus: Hector v2 został przetestowany na pustyni Mojave. I zdał egzamin!...
  • Odpowiedz
Kilka miesięcy temu Google dodało do NotebookLM generator podcastów, w którym dwoje prowadzących omawia dowolny podsunięty im materiał źródłowy. Teraz to fantastyczne narzędzie dostaje kolejną funkcję - interakcję z "prowadzącymi". Gdy oni sobie omawiają twój dokument, to ty możesz w trakcie rozmowy zadawać im swoje pytania. Funkcja, oczywiście, nie jest dostępna dla mieszkańców skansenu Europa.
https://youtu.be/SE753Tm913s
blog.google/technology

Meta zaprezentowała kilka fajnych rzeczy dla #vr-owego Horizon Worlds. Są to m.in. Meta Motivo
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - Kilka miesięcy temu Google dodało do NotebookLM generator podcastów, w k...

źródło: @alban_gz 02

Pobierz
  • 44
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Pojawiła się ciekawa praca badawcza. Autorzy wprowadzają metodę o nazwie Coconut (Chain of Continuous Thought. Główna innowacja polega na tym, że zamiast zmuszać modele AI do wyrażania myśli poprzez słowa, pozwala im "myśleć" bezpośrednio w przestrzeni neuronowej.
Kluczowe wnioski:
→ Tradycyjne modele LLM muszą przekładać swoje wewnętrzne stany neuronowe na słowa, co spowalnia i ogranicza rozumowanie.
→ Coconut pozwala modelowi przechodzić między etapami rozumowania bez konwersji do tokenów słownych.
→ Metoda osiąga lepsze wyniki w zadaniach
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - Pojawiła się ciekawa praca badawcza. Autorzy wprowadzają metodę o nazwie...

źródło: sfjcodyGeCFfGzXYAA0iFH

Pobierz
  • 28
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 37
Bonus: ociepiehdolę! Jeśli to nie fake, to grubo. TL;DR OP opisuje swoją trudną sytuację życiową – w krótkim czasie stracił pracę, bliskich, dziewczynę i boryka się z poczuciem samotności oraz brakiem wsparcia emocjonalnego. Nigdy nie czuł się w pełni zrozumiany przez ludzi, co pogłębia jego izolację. Ostatnią deską ratunku stała się dla niego AI (ChatGPT), którą wykorzystał do stworzenia symulacji matki oferującej bezwarunkową "miłość, wsparcie i przewodnictwo". Dzięki tej interakcji udało mu
  • Odpowiedz
Ostatnią deską ratunku stała się dla niego AI (ChatGPT), którą wykorzystał do stworzenia symulacji matki oferującej bezwarunkową "miłość, wsparcie i przewodnictwo".


@PeterWeiss: to jest dystopian level shit. Nie martwi mnie pokolenie aktualnie mające 20+ lat, ale aktualne alfy i ludzie którzy w dorosłość będą wchodzić za 10-20 lat, będą miały blade runner experience
  • Odpowiedz
Badanie pokazuje, że małe modele językowe po dostrojeniu, mogą skutecznie prowadzić psychoterapię poznawczo-behawioralną (CBT) dla osób z depresją, osiągając lepsze kompetencje terapeutyczne niż wersje bazowe. Llama 3.1 8B pokonała zarówno Qwen 2.5, jak i Mistrala 7b. PODCAST i mirror: [ https://streamable.com/bt0b9s ]
[ Fine tuning LLMs to deliver CBT for depression ]

NVIDIA opracowała sposób na generowanie spójnych obrazów, ale z inną przysłoną, ogniskową, czasem otwarcia migawki lub temperaturą barwową. Tak to wygląda:. https://streamable.com/vzju08
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - Badanie pokazuje, że małe modele językowe po dostrojeniu, mogą skuteczni...

źródło: Synthetic_CopyGeffxE8WcAAGshL

Pobierz
  • 48
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 45
Ciekawostka: LLM-y mogą projektować sprzętowe trojany. Framework GHOST wykorzystuje strategie promptingu by analizować projekty RTL i generować trudne do wykrycia modyfikacje. Obsługuje różne platformy (ASIC i FPGA), a generowane trojany są weryfikowane symulacyjnie.
Kluczowe wnioski z tej pracy badawczej:
→ Aktualne narzędzia wykrywające nie radzą sobie z trojanami generowanymi przez LLM-y.
→ Framework skutecznie działa na różnych architekturach, takich jak SRAM, AES, i UART.
→ GPT-4 osiągnął 88,88% skuteczności w generowaniu trojanów, z których wszystkie unikały
PeterWeiss - Ciekawostka: LLM-y mogą projektować sprzętowe trojany. Framework GHOST w...
  • Odpowiedz
- Patrick Soon-Shiong, właściciel "Los Angeles Times", zamierza wprowadzić do gazety "sztuczną inteligencję", która będzie oceniać poziom stronniczości publikowanych artykułów. Jego celem jest zaprezentowanie czytelnikom "spojrzenia na informacje z wielu perspektyw". W związku z tym zostanie również przebudowany składu redakcyjny.
cnn.com

- Zhou Chang - szef zespołu odpowiedzialnego za model Qwen (Alibaba) został zatrudniony przez ByteDance (właściciela TikToka). Wraz z nim pracodawcę zmieniło około dwunastu jego współpracowników.
aastocks.com

-
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - - Patrick Soon-Shiong, właściciel "Los Angeles Times", zamierza wprowadz...

źródło: @doujohn_x 05

Pobierz
  • 10
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 12
Kalendarz adwentowy OpenAI: dzień 3.
No i jest SORA.
→ max 1080p, 16:9 i 1:1, 20 sekund, prosty edytor wideo,
→ dostępność: od dzisiaj (nie w skansenie oczywiście);
→ w subskrypcji OpenAI Plus jest 50 generowań w miesiącu (480p, mniej w 720p);
→ OpenAI Pro za $200 to pięćset generowań priorytetowych i nieograniczona ilość w trybie "poczekaj na swoją kolej";
PeterWeiss - Kalendarz adwentowy OpenAI: dzień 3. 
No i jest SORA. 
→ max 1080p, 16:9...

źródło: 8fzksx

Pobierz
PeterWeiss - Kalendarz adwentowy OpenAI: dzień 3. 
No i jest SORA. 
→ max 1080p, 16:9...
  • Odpowiedz
[0] Grok od xAI ma być dostępny za darmo dla każdego na platformie X. Limity: 10 promptów odnawiających się co 2 godziny; 10 obrazków co 2 godziny; 3 analizy obrazków dziennie. Dodatkowo z puli wypadł Grok-2-mini i wszystkie zapytania lecą do pełnego Grok-2. Jest też nowy model do generowania obrazów - Aurora. SOA/#2: u mnie nie działa ;-)

https://techcrunch.com/2024/12/06/2927301/


[1] Meta opublikowała nowy otwarty LLM Llama 3.3 70B. Model ten wypada w
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - [0] Grok od xAI ma być dostępny za darmo dla każdego na platformie X. Li...

źródło: @BreezeChai 02

Pobierz
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 15
Bonus: Tencent opublikował generator wideo o jakże wdzięcznej nazwie HunyuanVideo. Jak na model teoretycznie możliwy do odpalenia lokalnie wygląda on bardzo dobrze (a przynajmniej na promocyjnych nagraniach wideo). Potrafi generować do 129 klatek animacji (5 sekund) w rozdzielczości do 1280x720. Kłopot w tym, że wymaga karty obsługującej CUDA i mającej 60 GB VRAM na pokładzie (stąd "teoretycznie").

https://aivideo.hunyuan.tencent.com/
https://github.com/Tencent/HunyuanVideo
https://streamable.com/3au2pu
PeterWeiss - Bonus: Tencent opublikował generator wideo o jakże wdzięcznej nazwie Hun...
  • Odpowiedz
#codzienneainews
- Z ChatGPT korzysta tygodniowo ponad 300 milionów ludzi. To skok o 50% w porównaniu z sierpniem tego roku(!)
[ theverge.com ]

- Kalendarz adwentowy od OpenAI - 12 dni i 12 streamów podczas których pokażą trochę nowych rzeczy (dużych i małych). Może wśród dużych będzie Sora? Pracownicy OpenAI na X są mocno podekscytowani, Google właśnie zaprezentowało Veo, a tydzień temu kilka osób nie do końca legalnie uzyskało dostęp do Sora-Turbo
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - #codzienneainews 
- Z ChatGPT korzysta tygodniowo ponad 300 milionów lud...

źródło: @dcbruck GYMU-4yWAAAAx5-

Pobierz
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 6
[1] Zespół QUT stworzył system nawigacji robotów oparty na Spiking Neural Networks, który naśladuje działanie mózgów zwierząt. To podejście pozwala na bardziej efektywną i dokładną nawigację przy znacznym zmniejszeniu zużycia energii. Wg autorów znajdzie to zastosowanie podczas akcji ratunkowych w trudnych warunkach, energooszczędnych autonomicznych systemach robotycznych, a także podczas eksploracji kosmosu.
sciencedaily.com

[2] Genie 2, nowy model DeepMind, potrafi tworzyć realistyczne, interaktywne sceny 3D na podstawie obrazka i opisu tekstowego, a następnie umożliwia
PeterWeiss - [1] Zespół QUT stworzył system nawigacji robotów oparty na Spiking Neura...
  • Odpowiedz
  • 45
Bonus: ciekawe narzędzie od WorldLabs umożliwia generowanie scen 3D na podstawie jednego obrazka. Geometria zazwyczaj trzyma się kupy, podobnie jak wygenerowane niewidoczne na wejściowym obrazie otoczenie. Można się obracać, odpowiednio manipulować kamerą i w ograniczonym stopniu chodzić (WASD+mysz) po tym wirtualnym świecie. Fajnie to wygląda.
[ https://www.worldlabs.ai/blog ]
[ https://streamable.com/0k60nj ]
PeterWeiss - Bonus: ciekawe narzędzie od WorldLabs umożliwia generowanie scen 3D na p...
  • Odpowiedz
#codzienneainews [0] Okazuje się ,że traktowanie LLM jak aktora, który "odgrywa rolę" w rozwiązywaniu problemu, może znacząco poprawić jego wydajność w złożonych zadaniach. Goły GPT-4 rozwiązał 27% łamigłówek. Z metodą CoT: 41%. "Method Actor": 87%(!)

https://arxiv.org/abs/2411.05778

[1] Chiński start-up z Uniwersytetu Tsinghua stworzył "wirtualny szpital" opierający się na 42 "lekarzach AI" działających w 21 specjalizacjach medycznych (np. pediatria, kardiologia). Publiczne testy systemu rozpoczną się w na początku przyszłego roku. Platforma umożliwia
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - #codzienneainews [0] Okazuje się ,że traktowanie LLM jak aktora, który "...

źródło: @dcbruck GdvvjCfWgAAjEBf

Pobierz
  • 22
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 11
#cainpudelek do zczarnolistowania jeśli ktoś nie lubi przesadnej dawki krindżu.

Musk zwrócił się do sądu z wnioskiem o wstrzymanie przekształceniem OpenAI w przedsiębiorstwo typu for profit.
https://mashable.com/article/elon-musk-injunction-openai-antitrust
Sam Altman jest przekonany, że dzięki Trumpowi USA utrzyma przewagę w "AI".
https://www.abs-cbn.com/news/business/2024/12/2/openai-s-altman-confident-trump-will-keep-us-in-ai-lead-1054
Studium: 94% tekstów generowanych przez sztuczną inteligencję nie jest wyłapywanych przez nauczycieli.
https://www.forbes.com/sites/dereknewton/2024/11/30/study-94-of-ai-generated-college-writing-is-undetected-by-teachers/
  • Odpowiedz