News #20

Cześć i czołem, AI nowotworem

Tak może uważać Kenijski rząd. Szybko przeszedłem do sedna, prawda? Ale teraz są wakacje, więc postanowiłem krótko i zwięźle, ew bd stos. sporo skrt.

Protesty antyrządowe w Kenii, zainicjowane głównie przez młodych obywateli zorganizowanych za pośrednictwem platform takich jak TikTok i X, zyskały na sile dzięki wykorzystaniu zaawansowanych narzędzi AI. Krwawe demonstracje rozpoczęte w połowie czerwca były reakcją na kontrowersyjny projekt ustawy finansowej na 2024 rok, który zakładał m.in. podniesienie podatków. Chociaż ustawa została ostatecznie wycofana, protesty nadal trwają; do tej pory zginęło nie mniej niż 39 osób, a setki zostały ranne. Uczestnicy wzywają do dymisji prezydenta Williama Ruto. 

W demonstracjach zastosowano narzędzia AI, takie jak chatbot „Corrupt Politicians GPT”, który ujawniają przypadki korupcji wśród polityków oraz „Finance Bill GPT”, analizujący wpływ proponowanych podwyżek podatków. Udostępniane są również numery telefonów polityków, umożliwiając obywatelom dosadne wyrażenie swoich opinii bezpośrednio do rządzących. Protestujący stworzyli także bazy danych firm należących do polityków, które były bojkotowane i atakowane.

Algorytm DenseAV to owoc pracy MIT i Google, który potrafi nauczyć się języka wyłącznie poprzez oglądanie filmów. DenseAV działa poprzez niezależne przetwarzanie danych audio i wideo, naśladując sposób, w jaki dzieci uczą się języka – czyli poprzez obserwację i słuchanie. Wykorzystuje technikę zwaną uczeniem kontrastywnym, polegającą na porównywaniu par sygnałów audio i wizualnych w celu określenia, które z nich pasują do siebie, bez potrzeby używania oznakowanych przykładów. Dzięki temu algorytm może zrozumieć i tworzyć szczegółowe oraz znaczące cechy z obu typów sygnałów.

Jednym z kluczowych aspektów jest jego zdolność do tworzenia szczegółowych połączeń między klipami audio, a poszczególnymi pikselami w obrazach. „Tradycyjne” metody (jeśli możemy użyć takiego stwierdzenia w branży AI) zazwyczaj dopasowywały całe klipy audio do pełnych obrazów, co uniemożliwiało określenie dokładnych powiązań.DenseAV analizuje każdy jeden piksel i każdą sekundę dźwięku, co znacząco zwiększa jego precyzję.

Algorytm został przeszkolony na AudioSet, zestawie danych składającym się z dwóch milionów filmów z YouTube, i wykazał się lepszą wydajnością w zadaniach takich jak identyfikacja obiektów na podstawie ich nazw i dźwięków. Zespół odpowiedzialny za DenseAV stworzył również nowe zestawy danych w celu bardziej precyzyjnej oceny możliwości modelu, używając adnotacji pixel-perfect, w celu zapewnienia szczegółowej oceny wydajności.

Potencjalne zastosowanie? Zrozumienie sposobu porozumiewania się zwierząt, takich jak np. delfiny i wieloryby. Na zrozumienie kotów pewnie nie zadziała… Celem ostatecznym jest użycie tej metody do odkrywania wzorców w innych typach par danych, takich jak dźwięki sejsmiczne i formacje geologiczne.

Ten rok, poza bardzo dynamicznym rozwojem generowanych treści multimedialnych, dominują także rozmowy na temat wykorzystania zasobów, czemu sprzyja na pewno obecna, także dynamiczna, sytuacja światowa. Rosnące zapotrzebowanie na energię przez całą branżę stanowi coraz większe wyzwanie dla infrastruktury energetycznej na całym świecie. Centra danych wymagają ogromnych ilości mocy obliczeniowej, co przekłada się na znaczne zużycie energii i wody.

W Stanach Zjednoczonych, gdzie zlokalizowana jest znaczna część globalnych centrów danych, przewiduje się, że do 2030 roku będą one odpowiadały za 8% całkowitego zapotrzebowania na energię kraju. To gigantyczny wzrost z obecnych 1 do 2%! Regiony, takie jak północna Wirginia, gdzie znajduje się wiele centrów danych, już doświadczają trudności z zapewnieniem wystarczającej ilości energii, co prowadzi do opóźnień w podłączaniu nowych centrów danych i do przywracania do pracy starych elektrowni węglowych. How dare you!

Zwiększone zużycie energii przez AI wpływa również na dostępność wody. Chłodzenie, które jest kluczowe dla utrzymania sprzętu w odpowiedniej temperaturze, wymaga dużych ilości wody. Dla przykładu, typowe centrum danych może zużywać do 360 tysięcy litrów wody dziennie. Eksperci podkreślają konieczność inwestowania w bardziej efektywne systemy chłodzenia oraz w odnawialne źródła energii, aby zminimalizować wpływ AI na środowisko.

Technologia od Cloudflare, nazwana Bot Management, wykorzystuje zaawansowane algorytmy uczenia maszynowego do identyfikacji i neutralizacji botów w czasie rzeczywistym. Narzędzie jest skierowane do firm i organizacji, które zmagają się z problemami związanymi z botami próbującymi przechwycić dane, generować fałszywy ruch na stronie lub zakłócać działanie serwisów online w inny sposób.

System działa poprzez analizę wzorców ruchu sieciowego, pozwalając na szybkie wykrywanie nietypowych aktywności. Używa technologii „behavioral analysis”, która bada, jak użytkownicy wchodzą w interakcje z witryną, aby odróżnić prawdziwych użytkowników od botów. W przypadku wykrycia botów, narzędzie automatycznie stosuje odpowiednie środki zaradcze, takie jak blokowanie ruchu lub wymuszanie dodatkowej weryfikacji użytkowników.

Bot Claude został wzbogacony o Prompt Playground – innowację umożliwiająca developerom eksperymentowanie z promptami w interaktywnym środowisku, co z kolei pozwala na optymalizację zachowania bota i szybsze osiąganie pożądanych wyników, między innymi poprzez integrację technik takich jak przypisywanie ról, gdzie model AI jest instruowany do przyjęcia określonych ról w celu poprawy trafności odpowiedzi, oraz użycie znaczników XML do jasnego strukturyzowania promptów.

Konsola Workbench pozwala na testowanie wielu poleceń jednocześnie oraz na dostęp do ustawień modelu w celu optymalizacji jego działania. Funkcja “tool use” umożliwia integrację Claude’a z istniejącymi procesami, produktami i API, co może obejmować wykorzystanie kalkulatora do złożonych równań, tłumaczenie języka naturalnego na zapytania API, korzystanie z API wyszukiwania internetowego, oraz dostęp do prywatnych API klientów 

Anthropic podkreśla, że ich nowa technologia może znacznie przyspieszyć proces tworzenia i testowania aplikacji AI, eliminując problem “pustej strony” poprzez automatyczne generowanie szablonów zgodnych z dobrymi praktykami. Te mogą być następnie dostosowywane i testowane przez użytkowników.

Wynikiem współpracy mądrych ludzi z Uniwersytetu Cambridge jest algorytm zdolny do identyfikacji bakterii opornych na antybiotyki; wnioskować ma on jedynie na podstawie obrazów mikroskopowych. Oporność na środki przeciwdrobnoustrojowe jest jednym z większych wyzwań stojących przed medycyną XXI wieku. Wzrost oporności na antybiotyki sprawia, że wiele infekcji już staje się trudnych do wyleczenia, a w perspektywie czasu – może być nawet niemożliwe.

W badaniu wykorzystano wysokowydajne obrazowanie do generowania głębokiej fenotypizacji izolatów Salmonella Typhimurium, narażonych na wzrastające stężenia cyprofloksacyny, czyli leku stosowanego powszechnie mimo znanej oporności patogenu. Cyprofloksacyna działa poprzez hamowanie aktywności enzymów bakteryjnych, kluczowych dla ich replikacji i naprawy DNA. Zastosowano algorytmy uczenia maszynowego do analizy danych obrazowych, w tym lasy losowe, naiwny klasyfikator bayesowski, K-najbliższych sąsiadów, maszyny wektorów nośnych (SVM), gradient boosting (CatBoost) oraz sieci neuronowe, i wykazano, że poszczególne izolaty wykazują unikalne cechy wzrostu i morfologiczne, które grupują się w zależności od punktu czasowego i wrażliwości na cyprofloksacynę, a niezależnie od ekspozycji na lek. Bakterie, a dokładnie dwa szczepy laboratoryjne i dwa klinicznie istotne izolaty S. Typhimurium, zostały poddane działaniu cyprofloksacyny w stężeniach 0, 1, 2 i 4 MIC przez 24 godziny, z próbkami pobieranymi co 2 godziny. Sieci neuronowe osiągnęły najwyższą skuteczność z dokładnością 87%, czułością 87%, specyficznością 89%, precyzją 90%, wskaźnikiem F1 87% i AUC 91%.

Miłego wieczoru!

Zobacz także:

  • Piotr Szymański

    Kategoria:

    Hejka! Zapraszam na skrót z minionych dwóch tygodni, który przyswoić możecie przy ciepłej herbatce w te mroczne, szare dni. W opublikowanym przez Google 14 listopada ostrzeżeniu wskazano kilka najważniejszych rodzajów oszustw internetowych. Uwagę zwrócono między na niebezpieczne techniki ataków typu cloaking, które nabierają nowego wymiaru dzięki wykorzystaniu sztucznej inteligencji. Cloaking polega na ukrywaniu przed użytkownikiem […]
  • Piotr Szymański

    Kategoria:

    Hejka po dłuższej przerwie! Zaczynamy świeżym tematem. Raptem kilkanaście godzin temu do użytkowników trafiła, zapowiedziana 25 lipca, funkcja SearchGPT od OpenAI, umożliwiająca, w przeciwieństwie do tradycyjnych modeli językowych, na integrację z internetem w czasie rzeczywistym. SearchGPT ma dostęp do aktualnych informacji z sieci, co pozwala na udzielanie odpowiedzi opartych na najnowszych danych. Ponadto SearchGPT dostarcza […]
  • Piotr Szymański

    Kategoria:

    Hejson! Dzisiejsza konsumpcja mediów ma to do siebie, że odbywa się na 5-6 calowym ekranie telefonu. Ma też to do siebie, że zanim zdjęcie dotrze do Ciebie, to przejdzie przez 6 konwersacji na jedynym słusznym messengerze, zatem zostanie 6-cio krotnie skompresowane. W międzyczasie, jak będziecie mieli pecha, to jakiś wujek zrobi screena, zamiast zapisać zdjęcie […]
  • Piotr Szymański

    Kategoria:

    Hej! Robimy bardzo dużo zdjęć, a co za tym idzie – wiele z nich jest niechlujnych, z zabałagnionym tłem. Możemy jednak chcieć wykorzystać je do pochwalenia się naszym ryjkiem na jakimś publicznym profilu, gdyż np. naturalne, miękkie światło korzystnie eksponuje naszą facjatę. Podejścia mogą być dwa – albo zdecydujemy się na blur bądź zupełne usunięcie […]
  • Piotr Szymański

    Kategoria:

    Strzałeczka. Nvidia przejęła OctoAI, startup specjalizujący się w optymalizacji modeli uczenia maszynowego. To już piąta akwizycja Nvidii w 2024 roku, co czyni aktualnie nam panujący rok rekordowym pod względem liczby przejęć. OctoAI, założone w 2019 roku przez Luisa Ceze, skupiło się na tworzeniu oprogramowania zwiększającego wydajność modeli uczenia maszynowego na różnych platformach sprzętowych. Oprogramowanie OctoAI […]