A Apple sonha com uma versão da Siri capaz de lidar com solicitações complexas como "Encontre uma foto no sábado, recorte o fundo e envie para a mamãe" em um único comando, sem exigir perguntas adicionais ou a troca manual entre aplicativos. Essa funcionalidade é o ponto central de uma grande reformulação da Siri, que será apresentada na WWDC em 8 de junho como parte do iOS 27. A capacidade de emitir vários comandos em uma única frase é o principal recurso dessa atualização, mas o verdadeiro problema é que ela ainda não funciona de forma confiável.

Cadeia de execução de três loops

Na WWDC 2024, a Apple apresentou a atualização da Siri em três partes: compreensão linguística mais profunda, reconhecimento contextual relacionado a dados pessoais e capacidade expandida de realizar ações dentro e entre aplicativos. As duas primeiras camadas permitem que a Siri "entenda", enquanto a terceira é o verdadeiro teste de seu sucesso ou fracasso.
A compreensão da linguagem natural significa que a Siri consegue analisar instruções mesmo quando o usuário se atrapalha com as palavras, uma verdadeira inovação em relação ao antigo sistema de palavras-chave. A compreensão contextual, por outro lado, exige que a Siri esteja ciente do que está na tela e acesse conteúdo pessoal, como fotos e mensagens, para entender o significado de frases como "foto de sábado".
Mas a implementação é o elo mais fraco; a Siri precisa invocar ações estruturadas na sequência correta em aplicativos que nem sempre controla. Isso não é um problema com os modelos de linguagem, mas com a confiabilidade dos próprios sistemas, já que as versões beta do iOS 26.5 revelaram que a Siri ainda interpreta mal as solicitações ou trava ao executar tarefas complexas.
Aplicativos de terceiros e o desafio da estrutura App Intents

Para cada etapa de uma sequência, a Siri precisa de um caminho estruturado dentro do aplicativo relevante. A Apple construiu isso por meio de sua estrutura de Intenções de Aplicativos, que abrange centenas de ações. Em aplicativos da Apple como Fotos, Mensagens e Mail, a integração é perfeita porque a Apple controla o sistema de ponta a ponta.
Para a sua informação Intenções do aplicativo Ou “intenções de aplicativo”: Esta é a tecnologia que atua como um “tradutor” ou “ponte” entre a inteligência do sistema, como a Siri ou o aplicativo Atalhos, e as funções dentro de seus aplicativos.
No entanto, para aplicativos de terceiros, a funcionalidade depende inteiramente da adoção dessa estrutura pelos desenvolvedores. A lacuna é evidente: uma solicitação como "encontrar, recortar e enviar a imagem" pode funcionar por meio de aplicativos da Apple, mas uma solicitação envolvendo um aplicativo externo como o Dropbox pode falhar se o desenvolvedor não tiver implementado os requisitos necessários. A falha nesse caso nem sempre resulta em um erro claro; a execução pode ser interrompida no meio do processo, deixando o usuário confuso.
Os atrasos no lançamento indicam a dificuldade da tarefa.

A Apple adiou oficialmente o lançamento da versão "mais personalizada" da Siri diversas vezes, e a previsão inicial era de que ela fosse lançada em atualizações anteriores, como o iOS 26.4, que acabou sendo lançado sem os novos recursos da Siri. Esse padrão de atrasos aponta para uma dificuldade estrutural no sistema; fazer a Siri entender uma frase complexa em um ambiente de testes é uma coisa, mas fazê-la executar três tarefas consecutivas com precisão em milhões de dispositivos com entradas inesperadas é outra bem diferente.
Relatórios indicam que a implementação pode ser distribuída entre o iOS 26.5 e o iOS 27, sugerindo que a camada de implementação ainda não está suficientemente consistente para ser lançada como um recurso único e integrado. Parece que a Apple está lançando aquilo em que confia agora, enquanto continua trabalhando para aprimorar as partes restantes, que ainda apresentam algumas inconsistências.
Próxima Conferência de Desenvolvedores

A Apple certamente nos impressionará com sua apresentação da Siri em 8 de junho, e tudo parecerá perfeito, já que a apresentação foi preparada e testada com antecedência. Mas a apresentação em si não é o verdadeiro teste; o verdadeiro teste está no que a Apple diz sobre a realidade. A questão crucial é quais aplicativos a Siri realmente suportará e quais tarefas ela poderá executar com precisão desde o primeiro dia. Essa é a diferença entre uma mera "demonstração promocional" e um recurso genuíno que usamos em nosso dia a dia.
Se a Siri pudesse traduzir nossa fala cotidiana em ações e diversas etapas dentro de aplicativos sem que tocássemos na tela, seria uma mudança drástica e revolucionária na forma como usamos o iPhone. A verdadeira questão agora não é se a Apple quer alcançar isso, mas se o sistema finalmente é poderoso o suficiente e está pronto para lidar com essas tarefas complexas e cumprir as promessas que ouvimos da empresa nos últimos dois anos.
Fonte:



um comentário