News #19

Siemson.

Konkurs 1839 Awards to wydarzenie przeznaczone dla miłośników fotografii, a od pewnego czasu znaleźć w nim możemy kategorię fotografii wygenerowanej przez sztuczną inteligencję. Tutaj właśnie doszło do dość zaskakującej sytuacji. Zdjęcie flaminga, wykonane przez Milesa Astraya, zostało początkowo uznane za jedno z najlepszych w kategorii AI, zdobywając, poza uznaniem, trzecie miejsce oraz nagrodę publiczności. Jednak po ujawnieniu, że zdjęcie zostało wykonane tradycyjną metodą, zostało ono zdyskwalifikowane.

Astray zgłosił swoje zdjęcie do kategorii AI, chcąc zwrócić uwagę na to, że sztuka tworzona przez człowieka wciąż może konkurować z dziełami generowanymi przez algorytmy. Jego praca zatytułowana Flamingone miała pokazać, że naturalne, surrealistyczne ujęcia wciąż mają swoją wartość. Autor sam poinformował organizatorów o prawdziwej naturze swojego zdjęcia, co doprowadziło do jego dyskwalifikacji. Fotograf zaznacza, że jego celem było wywołanie dyskusji na temat miejsca sztucznej inteligencji w sztuce i fotografii. Jego zdaniem, zgłoszenie prawdziwego zdjęcia do konkursu AI miało być ironicznym komentarzem na temat etycznych wyzwań związanych z wykorzystaniem AI w sztuce.

Rzeczony flaming

Ten rok ma potencjał na status kamienia milowego w dziedzinie sztucznointeligencjonalnych filmów. Runway, firma tworząca narzędzia AI dla twórców filmów i obrazów, zaprezentowała najnowszy model Gen-3 Alpha. Ten zaawansowany model AI potrafi generować klipy wideo na podstawie opisów tekstowych oraz nieruchomych obrazów, oferując znaczące usprawnienia w szybkości generowania oraz jakości w porównaniu do poprzednika. Szczegóły dotyczące danych szkoleniowych są tajne, natomiast z liczb dowiedzieliśmy się, że: Gen-3 Alpha pozwala na szybkie tworzenie klipów – generowanie 5 sekundowego klipu zajmuje tylko 45 sekund, a 10 sekundowego klipu – 90 sekund; długość klipów jest natomiast ograniczona do maksymalnie 10 sekund.

Uważniej zamierzam przyglądać się także chińskiemu generatorowi Kling od firmy Kuaishou. Na ten moment Kling generuje wideo w rozdzielczości 1080p przy 30 klatkach na sekundę (choć dzięki strategii trenowania na zmiennej rozdzielczości, może generować wideo w różnych proporcjach ekranu), z maksymalną długością do 2 minut. Na stronie twórców możemy dowiedzieć się, że produkt wykorzystuje 3D spatiotemporal joint attention mechanism oraz architekturę Diffusion Transformer, co pozwala na realistyczne modelowanie ruchu i generowanie dynamicznych scen.

Na tę chwilę Kling jest dostępny w formie publicznej wersji demo w Chinach, niestety wymaga chińskiego numeru telefonu, po naszemu zatem – wymaga trochę kombinatorstwa.

W nawiązaniu do poprzedniego wpisu, Meta (pewnie przez moje powątpiewania – nie dziękujcie) potwierdziła, że wstrzyma swoje plany szkolenia systemów AI przy użyciu danych użytkowników z Unii Europejskiej i Wielkiej Brytanii. Decyzja ta nastąpiła po interwencji irlandzkiego Urzędu Ochrony Danych, głównego regulatora Meta w UE, działającego w imieniu innych organów ochrony danych w bloku oraz brytyjskiego Information Commissioner’s Office. Zapowiedziane zmiany w regulaminach usług wywołały reakcję organizacji NOYB, która złożyła 11 skarg w różnych krajach UE, argumentując, że Meta narusza przepisy RODO, zwłaszcza w kwestii zgody użytkowników, a uzasadniony interes nie jest przekonującym argumentem.

Stefano Fratta, globalny dyrektor ds. zaangażowania w politykę prywatności w Meta, wyraził rozczarowanie decyzją DPC, stwierdzając, że jest to krok wstecz dla innowacji w Europie oraz konkurencyjności w rozwoju AI. Fratta podkreślił, że jego firma jest oczywiście przekonana o zgodności swojego podejścia z europejskimi standardami.

Jako ostatnią wzmiankę o Starcie napomknąć mogę, iż ogłoszono pięć nowych modeli AI, w tym takie, które generują tekst i obrazy oraz wykrywają mowę wygenerowaną przez AI. Model Chameleon potrafi tworzyć złożone treści tekstowe i wizualne; JASCO oferuje zaawansowane możliwości generowania muzyki z różnorodnymi wejściami; AudioSeal natomiast to technika znakowania audio umożliwiająca lokalne wykrywanie mowy wygenerowanej przez AI.

Claude 3.5 Sonnet – aż ciarki przechodzą na ekscytację o modelu, który ma zgładzić GPT-4o i Gemini Pro. Jeżeli u Was nie, to w pełni zrozumiem, jestem tolerancyjny jak mogę. Natomiast warto wiedzieć, że, jak co kolejną iterację, model oferuje wyższą precyzję w generowaniu odpowiedzi, jest szybszy i bardziej efektywny, a w tym przypadku postawiono także na przestrzeganie wartości etycznych. Żadnym wyzwaniem nie powinny być złożone instrukcje, poczucie humoru, naturalny ton odpowiedzi i inne niuanse. Funkcji Artifacts pozwala użytkownikom poprosić chatbota o wygenerowanie dokumentu tekstowego lub kodu, a następnie otworzenie wyniku w dedykowanym oknie, co przełożyć ma się na pozytywne doświadczenia z pracą z systemem i lepsze workflow.

Ludzie mają wiele trudności, z moich obserwacji i badań wynika, że szczególnie problematyczne jest logiczne myślenie, empatia i hipokryzja; naukowcy z Uniwersytetu w San Diego uważają, że ludzie mają także trudności w odróżnieniu ChataGPT od innych ludzi. Eksperyment, który miał formę testu Turinga, polegał na tym, że uczestnicy rozmawiali ze świadkami (makymalnie 5 minut), którzy mogli być albo ludźmi, albo modelami (GPT-4, GPT-3.5 i ELIZA) i mieli za zadanie określić, z kim rozmawiają. Uczestnicy byli w stanie poprawnie rozpoznać GPT-4 jako impostora w około 50% przypadków, w stosunku do 67% rozmówców biologicznych. Różnica jest zatem zauważalna, choć nie powalająca.

Google Translate rozszerzyło swoje możliwości o znajomość 110 nowych języków (którymi posługuje się około 8% globalnej populacji), co jest największą aktualizacją w historii tego narzędzia. Aktualizacja jest możliwa dzięki modelowi PaLM 2, który umożliwia naukę języków powiązanych; obejmuje zarówno powszechnie używane języki, jak i dialekty ludów tubylczych oraz języki zagrożone wyginięciem; przykładowo Xhosa, Oromo, Quechua (pozdro Decathlon) czy Śląski!

U nas już po wyborach samorządowych, natomiast, jeśli nie macie jeszcze planów na najbliższe lata, to możecie zacząć lobbować za naszym wspólnym znajomym. Tak jak Vitor Miller, mieszkaniec Cheyenne, który to postanowił podjąć rękawice i uczynić swój spersonalizowany model – burmistrzem swojego miasta. Miller stworzył customową formę ChatGPT, nazwał VIC (Virtual Integrated Citizen) i zaprezentował swoją koncepcję na posiedzeniu rady miejskiej. Zachwalał jego cechy, przede wszystkim perfekcyjna znajomość prawa stanowego, dzięki czemu jego kandytat nie popełniałby błędnych decyzji. Zwracał także uwagę, że bot jest bardziej inteligentny od każdej jednej osoby wśród słuchaczy, wliczając jego samego. Podczas jednego z ostatnich posiedzień przedstawiono 422 strony dokumentów, które VIC byłby w stanie błyskawicznie przeanalizować i na ich podstawie podjąć dobrze uzasadnioną decyzję. Biuro sekretarza stanu Wyoming stwierdziło, że kandydatura jest nieważna, ponieważ na formularzu zgłoszeniowym użył skrótu VIC zamiast pełnego imienia Victor. Sekretarz stanu, Chuck Gray, wyjaśnił, że prawo stanowe Wyoming jasno stwierdza, że bot nie jest uprawniony do kandydowania w wyborach.

Naukowcy z University College London oraz University Medical Center Göttingen opracowali test krwi, wykorzystujący zaawansowane algorytmy sztucznej inteligencji do przewidywania choroby Parkinsona, będącej najszybciej rosnącym zaburzeniem neurodegeneracyjnym na świecie, aż do siedmiu lat przed wystapieniem pierwszych objawów. Według badaczy największą rolę odgrywa analiza ośmiu biomarkerów krwi, obejmujących różne białka i inne molekuły, mogące być wskaźnikami zmian zachodzących w mózgu i układzie nerwowym pacjentów z rozwijającą się chorobą. W badaniach wzięły udział 72 osoby z zaburzeniem snu REM, które to w 75-80% przypadków prowadzi do rozwoju synukleinopatii (w tym Parkinsona). W tym przypadkualgorytmy AI były w stanie przewidzieć rozwój choroby z dokładnością na poziomie 79% . Wyniki zostały potwierdzone w dziesięcioletnim okresie obserwacji, gdzie u 16 osób przewidziano rozwój Parkinsona z wyprzedzeniem siedmiu lat. Wcześniejsza diagnoza to naturalnie szansa na spowolnienie rozwoju bądź nawet całkowite jej zapobiegnięcie.

To wszystko na dziś. Powiedziałbym że ściskam was ciepło, ale chyba byście mnie za to zabili, patrząc na temperatury za oknem. Zatem ściskam was chłodno, pozdrawiam z meczu i do następnęgo!

The Data Game

Zobacz także:

News #28

Piotr Szymański

Kategoria:

News #27

Piotr Szymański

Kategoria:

Upscaling obrazu przy użyciu AI (feat. denoise&sharpen)

Piotr Szymański

Kategoria:

Zmiana tła Waszego zdjęcia

Piotr Szymański

Kategoria:

News #26

Piotr Szymański

Kategoria: