Java oferece um conjunto completo de funcionalidades para
manipulação de caracteres e este artigo mostra de forma concisa e
prática algumas dessas facilidades. Atualmente, Java e Python têm
sido bastante usadas para processamento de texto, quando tratamos
de cenários com um grande volume de dados.
Seguem alguns exemplos de projetos escritos em Java e que fazem
processamento de grande quantidade de dados, textuais ou não:
- Lucene
- Hadoop
- Mahout
- Storm
- OpenNLP
Introdução
O processamento de texto é uma área que vem crescendo,
principalmente impulsionado pelas redes sociais, onde os dados
não são estruturados como em um banco de dados relacional. Dados
não tabelados, que anteriormente eram ignorados, têm hoje uma
grande importância no mundo corporativo. O cruzamento de
informações está se mostrando uma área lucrativa, por exemplo, no …
[Leia mais]