Histórias do Ceará

IAcema: a inteligência artificial que lê 2,5 milhões de manchetes para quem pesquisa o Ceará

Pergunte sobre a seca de 1915 ou a chegada do bonde a Fortaleza e receba, em segundos, trechos reais de jornais da época — com a fonte de cada um. É isso que a IAcema faz.

Cabeçalho do jornal A República, de 1897, parte do acervo digitalizado do Portal da História do Ceará

Um pesquisador quer saber como os jornais de Fortaleza noticiaram a grande seca de 1915. No método tradicional, isso significa horas — às vezes dias — folheando edição por edição em um arquivo. Com a IAcema, ele digita a pergunta e, em segundos, recebe trechos reais publicados na época, cada um com a indicação de qual jornal e qual edição o trouxe. É essa troca de tempo por precisão que define a inteligência artificial do Portal da História do Ceará.

Por que "IAcema"

O nome junta duas ideias. IA é a sigla de inteligência artificial. Iracema é a heroína do romance que José de Alencar publicou em 1865 — a "virgem dos lábios de mel" que virou um dos grandes símbolos literários do Ceará. A escolha tem um sentido: assim como a personagem, a IAcema é uma ponte. Ela liga quem pesquisa hoje a um acervo de imprensa que, de outro modo, ficaria trancado no tempo.

O que ela realmente faz

A IAcema não "sabe" história de cabeça. Ela consulta o acervo a cada pergunta. Por baixo, há um conjunto de ferramentas de busca que vasculham mais de 2,5 milhões de manchetes de 133 jornais cearenses — de A República ao Correio do Ceará — concentrados sobretudo entre 1903 e 1982. Encontrados os trechos relevantes, ela os resume em linguagem direta e mostra de onde tirou cada afirmação.

Na prática, a conversa funciona como um diálogo com um arquivista incansável: você pergunta, ela procura no acervo, responde e aponta a fonte.

Busca de texto completo, explicada

O segredo técnico tem nome: busca de texto completo (em inglês, full-text search). Vale entender a diferença:

  • O Ctrl+F procura uma palavra dentro de uma página aberta.
  • O Google procura na internet pública — onde jornais cearenses de 1920 simplesmente não estão.
  • A busca de texto completo do acervo procura uma palavra dentro de todas as manchetes ao mesmo tempo, como se houvesse um índice gigante apontando em que edição cada termo aparece.

É por isso que a IAcema consegue cruzar décadas e dezenas de jornais numa única consulta.

Por que ela sempre cita a fonte

Modelos de inteligência artificial têm um risco conhecido: a alucinação — quando a máquina produz uma resposta que parece verdadeira, com datas e nomes convincentes, mas é inventada. Para trabalho histórico, isso é inaceitável.

A IAcema foi desenhada para o contrário disso. Cada informação relevante vem com uma referência numerada que aponta a manchete e a edição de origem. E quando o acervo não tem base para responder, ela diz que não sabe, em vez de preencher a lacuna com suposição. A resposta não é o ponto final: é o caminho até o documento, que o pesquisador pode então conferir e citar.

Para que serve, na pesquisa de verdade

Alguns usos concretos que a ferramenta destrava:

  • Rastrear um tema ao longo do tempo: ver como a palavra "seca" aparece nas manchetes década após década.
  • Achar a primeira menção: quando determinado assunto — o cinema, o automóvel, uma epidemia — estreou nas páginas dos jornais cearenses.
  • Comparar coberturas: como diferentes jornais noticiaram o mesmo acontecimento.
  • Conferir uma data ou um nome rapidamente, com a fonte primária à mão.

Uma aliada, não uma substituta

A IAcema acelera a etapa mais demorada da pesquisa — encontrar onde a informação está —, mas não faz o trabalho do historiador. Interpretar o contexto, cruzar versões e construir a narrativa continua sendo tarefa humana. E ela enxerga apenas o que já foi digitalizado: o acervo cresce a cada etapa de digitalização, e a ferramenta cresce junto.

Quer experimentar? Faça uma pesquisa no acervo, percorra a linha do tempo de fatos históricos do Ceará ou converse com a IAcema diretamente no portal.