Avenida O

¿Text mining? Y eso… ¿cómo se come?

Marian Bákit para El Observador A finales del año pasado, se estimó que cada día se enviaron 500 millones de…

Por Desde la Columna

Tiempo de Lectura: 2 minutos
¿Text mining? Y eso… ¿cómo se come?
Facebook Twitter Whatsapp Telegram

Marian Bákit para El Observador

A finales del año pasado, se estimó que cada día se enviaron 500 millones de mensajes en la plataforma Twitter, osea: 600 tuits por segundo. Solo en Facebook, cada minuto se generaron 510,000 comentarios, se actualizaron 293,000 estados, se dieron 4,000 millones de likes y se subieron 136,000 fotos. 

Los seres humanos somos unas máquinas para generar información, ¿pero, qué pasa con todas las opiniones que generamos en Trip Advisor, los comentarios en Facebook, los ratings que colocamos a los productos que consumimos con el fin de “ayudar” a otros posibles compradores? ¿Cómo aprovechan las empresas esta información?

Bienvenidos al mundo del “text mining”.

Al texto se le conoce como data no estructurada. Para poder ser procesadas, las bases de datos trabajan con números o con valores, categorías definidas y cerradas.  Pero la estructura del texto está diseñada para ser entendida por personas no por computadoras. Por lo que implica un grado de complejidad. Las frases y las palabras tienen distintos tamaños, las personas escriben con faltas de ortografía, juntan o acortan palabras, y usan los signos de puntuación a su gusto.

Además, el lenguaje está diseñado para la comunicación humana, por lo que el contexto, ya sea cultural o dado por una situación específica, es importante para la interpretación y comprensión. Una palabra o frase por sí sola puede significar distintas emociones; por ejemplo, la palabra “increíble” puede ser tanto negativa como positiva, todo depende de la frase en la que esté incluida.

Para ser usado en minería de datos, el texto debe de pasar por varios procesos: separar texto en palabras, eliminar mayúsculas, reemplazar las palabras que sean sinónimos, convertir las palabras a su raíz (“Corriendo” a “correr”), eliminar palabras vacías (artículos, preposiciones, etc); entre otros.

En el texto hay riqueza. Al final del proceso, nos quedamos con las palabras que mejor se relacionan con el sentimiento que las personas quieren expresar. Aquí es donde las computadoras nos ayudan.  El resultado es poder interpretar y extraer información de valor de miles de textos de forma automatizada, sin tener que recurrir a que un humano lea línea por línea e interprete según su juicio de valor.

Pensemos en una empresa que recibe comentarios en redes sociales y correos con: quejas, preguntas, solicitudes. ¿Cómo atender lo más importante?, ¿cómo jerarquizarlos y redirigirlos? Ahora, imagínese una línea aérea que recibe 5,000 comentarios por día. Poner a personas a leer uno por uno, a parte de suponer una inversión alta, es muy lento y está teñido de subjetividad. Para esto nos sirve el “text mining”.

Otro uso, propiamente en el área de mercadeo, es entender qué están diciendo de nuestra marca, cuales son las palabras con las que más nos asocian y así encontrar oportunidades para poder conectarnos con nuestros clientes.

“Text mining” se trata de cómo nos movemos más rápido para resolver un problema antes de que éste sea más grande.  De cómo entender mejor y más rápido los comentarios de nuestros clientes y de cómo ganar, aplicando la ciencia a los negocios.

Marian Bákit es Directora General de Ideas MCW
Email: [email protected]
Web: http://www.ideas.cr/