UFSC e IJURIS criam sistema de garimpagem de texto

11/10/2002 10:00

A mesma equipe de pós-graduandos da Universidade Federal de Santa Catarina (UFSC), premiada por desenvolver um sistema de inteligência artificial para o Conselho de Segurança das Nações Unidas, acaba de apresentar um novo sistema de busca inteligente, que promete economizar milhares de horas de consulta nos tribunais. Trabalhando na pesquisa, há 6 anos, Hugo César Hoeschl, Tânia Cristina D´Agostini Bueno, André Bortolon, Eduardo da Silva Mattos e Marcelo Ribeiro desenvolveram o AlphaThemis, um sistema de “garimpagem de texto” (text mining), que usa inteligência artificial para buscar súmulas de tribunais, associando conceitos, ao invés de palavras, e permitindo a realização de estatísticas.

As súmulas são resumos da posição oficial de tribunais, editadas quando há muitos processos sobre uma mesma questão. Seus textos breves, de 2 a 3 linhas, são publicados no Diário da Justiça e utilizados sempre que há um novo processo sobre o mesmo tema. Até agora, a consulta dependia da memória de juízes ou da paciência de se folhear os diários com as súmulas publicadas ou, mais recentemente, da consulta pelos mecanismos usuais de busca da Internet. “Já cheguei a gastar uma semana procurando uma súmula, sem encontrar, para saber que ela existia apenas depois de ter escrito um texto de 20 páginas, que as 3 linhas da súmula substituíam”, comenta Hugo Hoeschl, da UFSC e do Instituto Jurídico de Inteligência e Sistemas (Ijuris), criado para promover, fomentar e apoiar atividades de inovação e desenvolvimento científico e tecnológico, no campo da informatização jurídica.

O grupo de pesquisa informatizou 40 anos de súmulas do Supremo Tribunal Federal (STF), do Superior Tribunal de Justiça (STJ) e dos Tribunais Regionais Federais (TRF), totalizando 1.300 decisões, desde 1963 até 2002. Daqui para frente, as atualizações serão constantes, sempre que uma nova súmula for oficialmente publicada. “Usamos o princípio do data mining (“garimpagem” de dados), mas aplicando o sistema de Raciocínio Baseado em Casos (RBC) para textos”, acrescenta Hoeschl. Isso quer dizer que a busca não considera apenas a palavra pedida, mas o conceito por trás da palavra, apresentando como resultado o texto de maior percentual de aproximação com os conceitos pedidos.

Traduzindo melhor: a busca inteligente não só identifica textos com as palavras-chave – carro, por exemplo – como os sinônimos e conceitos semelhantes – automóvel, veículo, tráfego… E a consulta também pode ser feita a partir de textos de até 270 linhas ou 15 mil caracteres. Neste caso, o resultado é a súmula que mais se aproxima do texto de consulta, permitindo adotar a solução passada (a posição genérica do tribunal) para a questão presente.

O AlphaThemis diferente dos chamados sistemas especialistas por não se basear em perguntas, que refinam a busca. Ele vai direto ao texto de maior percentual de semelhança, a partir de um cálculo global. E, de quebra, ainda possibilita saber quantas súmulas cada tribunal editou num determinado período, sobre que assunto, etc.

Um demonstrativo do novo sistema está disponível, para download gratuito, no site webis (http://www.webis.com.br), criado pela equipe para facilitar o acesso dos tribunais. Já existe uma versão comercial, vendida pelo Ijuris, que financiou a pesquisa, cujo custo total foi estimado em R$ 3 milhões, parcialmente cobertos por bolsas de pós-graduação do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq).

O AlphaThemis foi um dos 4 projetos da UFSC selecionados para apresentação num evento internacional – o Ideia/Iberamia – a se realizar em Sevilha, na Espanha, em novembro próximo. Um outro trabalho selecionado, do doutorando Alexandre Serra Barreto e de Tânia Cristina D´Agostini Bueno, Usa os mesmos princípios para consultas de decisões tributárias, feitas à Receita Federal.

Fonte: Agência Estado/Ciência e Meio Ambiente