As ferramentas que utilizam linguagem natural têm evoluído bastante. Alguns especialistas de ECM apostam que a maturidade destas ferramentas irá substituir a necessidade de classificação padronizada de informações e conteúdo digital. De acordo com estes gurus, já existe tecnologia suficientemente eficaz para analisar o conteúdo de um documento sem nenhum tipo de indexação e recuperá-lo rapidamente quando um usuário fizer uma simples pergunta. No Brasil já temos alguns exemplos de aplicações utilizando linguagem natural como Omneek e Looqbox .

Ao contrário da classificação tradicional, onde a recuperação se dá por metadados ou indexação padronizada do documento, a linguagem natural “entende” a pergunta do usuário e busca no repositório documentos endereçados a ela. Porém, para isto, é fundamental que o usuário saiba formular a pergunta e conheça a natureza do acervo que está pesquisando.

A linguagem natural tem bastante eficácia no e-commerce porque permite reunir uma série de produtos afins e/ou complementares. Mas o desafio é bem maior na busca de documentos. Principalmente porque os usuários corporativos apresentam um conjunto terminológico muito variado conforme o departamento, filial e nível hierárquico. Dependendo destas características a mesma pergunta pode ser feita de diversas formas.

Tenho a sensação que o custo de implantação e manutenção do léxico, utilizado para “interpretar” as perguntas e “ analisar” os documentos correspondentes, será tão alto que inviabilizará sua aplicação massiva.

Mas a tecnologia pode nos surpreender.