Uso minha voz principalmente para falar com a IA
O Wispr Flow me mostrou para onde a minha ditado realmente vai. 95 por cento são prompts para IA, não mensagens para pessoas. Notas sobre o que esse número significa.
O Wispr Flow, a ferramenta de ditado que uso o dia todo, me mostrou um relatório de como eu de fato a uso. Eu esperava os números de vaidade de sempre. Palavras ditadas, tempo economizado. O que recebi foi um soco no estômago, em silêncio.
Noventa e cinco por cento de tudo que eu falo no meu computador vai para uma IA.
Não para amigos. Não para colegas. Não para documentos. Para uma máquina, na forma de prompts. O relatório detalha para onde a minha voz vai, como eu soo para o software, e quando eu mais falo. Aqui está o que ele me disse.
Para onde vai a minha voz
A distribuição no desktop é desigual de um jeito que eu não previa.

De tudo que ditei, 1.629 entradas eram prompts de IA. Isso é 95 por cento. A categoria seguinte, outras tarefas, é 4 por cento. Mensagens pessoais são 1 por cento, quinze delas. E-mails, dois. Mensagens de trabalho, uma. Documentos, zero.
Ditei 174.101 palavras no total, em 26 aplicativos diferentes. A concentração é a história. Não estou espalhando a minha voz pela minha vida. Estou apontando quase toda ela para um tipo de alvo: uma caixa de prompt.
O número que deveria me incomodar é quinze mensagens pessoais contra mil e seiscentos prompts. Por voz, pelo menos, eu falo com software cem vezes mais do que falo com pessoas. A ferramenta que me venderam como um jeito mais rápido de escrever para humanos virou, em silêncio, um jeito mais rápido de instruir uma máquina.
O que a máquina acha que eu sou
A segunda aba traça um perfil da sua voz. A minha ganhou um nome.

Sanity Checker. A descrição: eu uso a voz com frequência para checar a sanidade de ideias e processos, garantindo que cada passo, do desenvolvimento de apps ao planejamento estratégico, seja avaliado antes de avançar. Meu bordão, tirado dos meus próprios ditados: “sanity check if this makes sense”.
É exatamente o que eu digo, dezenas de vezes por dia. Abro uma sessão, despejo um plano, e peço ao agente que me diga onde ele quebra antes de eu me comprometer.
Minha palavra mais usada é “i’m”. A mais corrigida é “and”. As duas batem. Eu narro o que estou fazendo enquanto faço, e emendo frases mais rápido do que o modelo consegue pontuar. É um retrato perturbadoramente preciso. O software esteve ouvindo, e construiu uma semelhança justa.
Por que eu falo em vez de digitar
A razão é velocidade, e a velocidade é real.

O relatório me cronometra em 139 palavras por minuto, top 0,3 por cento. Eu não digito tão rápido. Quase ninguém digita. Quando o método de entrada é quatro vezes mais rápido que o teclado, o teclado deixa de ser o padrão.
Meu horário de pico é segunda às 13h, no VS Code. Não é coincidência. O VS Code é onde o agente vive, e segunda à uma é quando eu carrego o trabalho da semana nele. A voz é o jeito mais rápido de tirar um plano bagunçado e meio formado da minha cabeça e colocá-lo na frente de algo que pode agir sobre ele.
Essa é a metade que faltava de como meu sistema de agentes realmente funciona. O invólucro, as regras, a memória, tudo isso pressupõe um jeito de alta largura de banda de falar com o agente. A voz é esse canal. Eu não estou escrevendo prompts. Estou pensando em voz alta diante de um processo com mãos.
O que o número significa
Então o relatório é um espelho, e o reflexo é claro. A coisa principal que faço com a minha voz agora é instruir uma máquina.
Não sei bem como me sinto sobre as quinze mensagens pessoais. Esse número é um empurrãozinho, e estou tomando como tal. Mas os noventa e cinco por cento não me soam como um problema. Soam como uma mudança. A interface para o meu trabalho costumava ser um teclado apontado para arquivos. Agora é um microfone apontado para um agente.
Se é para lá que isto vai para todo mundo, as pessoas que aprenderem a falar bem com a máquina terão uma vantagem real. Eu pratico todo dia, ao que parece. Top 0,3 por cento.
A ferramenta de ditado é o Wispr Flow. Se você quer tentar falar com os seus agentes em vez de digitar, é essa que aparece em cada captura de tela aqui.