Apple marzy o wersji Siri, która będzie w stanie obsłużyć złożone polecenia, takie jak „Znajdź zdjęcie w sobotę, wytnij tło i wyślij je mamie” jednym poleceniem, bez konieczności odpowiadania na dodatkowe pytania lub ręcznego przełączania się między aplikacjami. Ta funkcja leży u podstaw gruntownej przebudowy Siri, która ma zostać zaprezentowana podczas konferencji WWDC 8 czerwca w ramach systemu iOS 27. Możliwość wydawania wielu poleceń w jednym zdaniu jest kluczową cechą tej aktualizacji, ale prawdziwym problemem jest to, że nie działa ona jeszcze niezawodnie.

Łańcuch wykonawczy składający się z trzech pętli

Podczas konferencji WWDC 2024 firma Apple przedstawiła ulepszenie Siri w trzech etapach: głębsze rozumienie języka, świadomość kontekstowa związana z danymi osobowymi oraz rozszerzone możliwości podejmowania działań w aplikacjach i między nimi. Pierwsze dwie warstwy umożliwiają Siri „rozumienie”, a trzecia stanowi prawdziwy test jej sukcesu lub porażki.
Rozumienie języka naturalnego oznacza, że Siri może analizować instrukcje nawet wtedy, gdy użytkownik się myli, co stanowi istotne odejście od starego systemu słów kluczowych. Z kolei rozumienie kontekstowe wymaga od Siri świadomości tego, co znajduje się na ekranie, oraz dostępu do treści osobistych, takich jak zdjęcia i wiadomości, aby zrozumieć znaczenie fraz takich jak „sobotnie zdjęcie”.
Jednak implementacja jest najsłabszym ogniwem; Siri musi wywoływać ustrukturyzowane akcje w odpowiedniej kolejności w aplikacjach, nad którymi nie zawsze ma kontrolę. Nie jest to problem modeli językowych, ale niezawodności samych systemów, ponieważ wersje beta systemu iOS 26.5 ujawniły, że Siri nadal źle rozumie żądania lub zawiesza się podczas wykonywania złożonych zadań.
Aplikacje innych firm i wyzwanie związane z frameworkiem App Intents

Dla każdego kroku w sekwencji Siri potrzebuje ustrukturyzowanej ścieżki w odpowiedniej aplikacji. Apple stworzyło ją za pomocą swojej struktury App Intents, która obejmuje setki działań. W aplikacjach Apple, takich jak Zdjęcia, Wiadomości i Poczta, integracja jest ścisła, ponieważ Apple kontroluje system od początku do końca.
Dla twojej informacji Intencje aplikacji Lub „intencje aplikacji”: technologia działająca jako „tłumacz” lub „most” między inteligencją systemu, taką jak Siri lub aplikacja Skróty, a funkcjami w aplikacjach.
Jednak w przypadku aplikacji firm trzecich funkcjonalność zależy wyłącznie od deweloperów wdrażających tę platformę. Różnica jest oczywista; żądanie takie jak „znajdź, przytnij i wyślij obraz” może działać za pośrednictwem aplikacji Apple, ale żądanie z wykorzystaniem aplikacji zewnętrznej, takiej jak Dropbox, może nie działać, jeśli deweloper nie wdrożył niezbędnych wymagań. Niepowodzenie w tym przypadku nie zawsze skutkuje wyraźnym błędem; wykonywanie może zostać przerwane w połowie, pozostawiając użytkownika w konsternacji.
Opóźnienia w starcie wskazują na trudność zadania.

Apple oficjalnie kilkukrotnie opóźniało wydanie „bardziej spersonalizowanej” wersji Siri, która miała się ukazać w poprzednich aktualizacjach, takich jak iOS 26.4, który został wydany bez nowych funkcji Siri. Ten schemat opóźnień wskazuje na problemy strukturalne systemu; sprawienie, by Siri zrozumiała złożone zdanie w środowisku testowym, to jedno, ale sprawienie, by poprawnie wykonała trzy kolejne zadania na milionach urządzeń z nieoczekiwanymi danymi wejściowymi, to zupełnie inna sprawa.
Doniesienia wskazują, że wdrożenie może nastąpić w rozłożeniu na iOS 26.5 i iOS 27, co sugeruje, że warstwa implementacji nie jest jeszcze wystarczająco spójna, aby udostępnić ją jako pojedynczą, zintegrowaną funkcję. Wygląda na to, że Apple udostępnia to, co jest pewne na razie, jednocześnie kontynuując prace nad wzmocnieniem pozostałych, wciąż nieco niespójnych, elementów.
Nadchodząca konferencja programistów

Apple z pewnością zachwyci nas swoją prezentacją Siri 8 czerwca, a wszystko będzie wyglądać idealnie, ponieważ prezentacja została przygotowana i przetestowana wcześniej. Ale sama prezentacja nie jest prawdziwym testem; prawdziwy test leży w tym, co Apple mówi o rzeczywistości. Kluczowe pytanie brzmi, które aplikacje Siri faktycznie będzie obsługiwać i jakie zadania będzie w stanie precyzyjnie wykonywać od pierwszego dnia. To właśnie różnica między zwykłą „prezentacją promocyjną” a autentyczną funkcją, z której korzystamy na co dzień.
Gdyby Siri mogła tłumaczyć naszą codzienną mowę na działania i liczne kroki w aplikacjach bez dotykania ekranu, byłaby to ogromna i rewolucyjna zmiana w sposobie korzystania z iPhone'a. Prawdziwym pytaniem nie jest teraz, czy Apple chce to osiągnąć, ale czy system jest wreszcie wystarczająco wydajny i gotowy do obsługi tych złożonych zadań oraz dotrzymania obietnic składanych przez firmę w ciągu ostatnich dwóch lat.
Źródło:



Zostawić odpowiedź