El día de hoy vamos a trabajar con esta herramienta que se llama Voyant Tools. Voyant Tools es una herramienta gratuita, de acceso abierto que se cita en la web, en la dirección voyant-tools.org. Fundamentalmente, lo que hace Voyant Tools es hacer una representación visual del texto, a partir de tomar las palabras dentro del texto como datos, contabilizarlos y luego, proyectarlos en una imagen. Para que veamos cómo opera y cuál es la mejor manera de llevar a cabo el funcionamiento de esta herramienta, vamos a comenzar con introducir un texto en donde dice "añadir texto". Para eso, yo he elegido "Trafalgar", de Benito Pérez Galdós, por distintas razones; entre ellas, que es un libro canónico y, por supuesto, que es un libro de fácil acceso digital porque tenemos que encontrar una versión digital que podamos ingresar fácilmente en el campo de texto de la herramienta. Para eso, voy a ir al Proyecto Gutenberg. En el Proyecto Gutenberg voy a buscar "Trafalgar". Una de las razones por lo que hago esto con el Proyecto Gutenberg es que, como pueden ver, nos ofrece publicaciones digitales, pero de una manera particular porque nos ofrece distintos formatos para esas ediciones digitales. Aquí, por ejemplo, tenemos la versión de "Trafalgar" en español y podemos ver aquí, los diferentes formatos que nos ofrece el Proyecto Gutenberg. Para efectos del ejercicio que vamos a hacer hoy, vamos a escoger "Plain Text UTF", que es el formato que carece de marcas y que es, digamos, el más fácil de manipular y trabajar porque no hay que limpiarlo. Lo copiamos todo, rápidamente, de manera que lo podamos trasladar después, sin mucho problema, a la herramienta. Lo hago de esta manera porque hacia la parte final del texto hay una serie de elementos que no queremos que pasen al texto, porque es la licencia de uso y entonces, nos vamos a quedar aquí, justamente donde dice "Trafalgar". Copiamos y pegamos en el recuadro de texto. Y solamente tenemos que ir al principio para eliminar algunos añadidos que tiene esta publicación; que son, sobre todo, los datos de publicación y otros elementos de codificación que usa el Proyecto Gutenberg. Ya está. Entonces, ahora damos clic en el botón "revelar", y es donde va a ocurrir la magia de esta herramienta. Como vemos, la herramienta ha transformado el texto en elementos visuales. Destacan, sobre todo, dos; en este lado, una nube de palabras; de este lado, unas frecuencias. Es decir, las tendencias de frecuencia de aparición de la palabra. Luego, en el centro, encontramos el texto completo que hemos ingresado; un sumario aquí abajo, a la izquierda, en donde está el resumen de la densidad del vocabulario, el número de palabras por una oración, las palabras más frecuentes. Y finalmente, los contextos. En un video posterior vamos a explicar cómo se utilizan y cómo se interpretan cada uno de estos elementos. Ahora, lo único que vamos a hacer es limpiar el poco nuestro corpus, haciéndolo de la siguiente manera. Si nos fijamos en la nube de palabras, la nube de palabras contiene palabras como "a", "me", "no", "mi", "había", que son muy notables por el tamaño que tienen, lo cual implica que son las palabras más frecuentes. Lo podemos ver aquí abajo, cómo "a", "no", "me", "mi", "más", son las palabras que parecer con mayor frecuencia. Sin embargo, estas palabras carecen de significado. Se suelen llamar "palabras vacías" o "stop words", en inglés; es decir, palabras que necesitan otras palabras para cobrar sentido. Para trabajar el texto nos conviene eliminarlas, de manera que lo que emerjan sean palabras que tengan sentido y que, por lo tanto, nosotros podamos analizar a partir de ellas, elementos dentro del texto. Para quitarlas, vamos a este lugar, junto a la interrogación, este botón que dice "definir opciones para esta herramienta", le damos clic ahí. Dice "palabras excluidas", "auto-detección", le decimos "editar lista" y ya tiene precargado un grupo de palabras. Pero he excluido, por ejemplo, "no". He excluido, "a", "me", "mi", "todos", "después", "qué", había", "le", "más", que es importante. Podemos salvar, ahora. Confirmamos, apretando el botón de "confirmar" y se va a redefinir nuestra nube de palabras, que era lo que buscábamos. Ahora, como vemos, aparecen otras palabras que a lo mejor podríamos prescindir de ellas, como "mí", "tan", "poco", "ni", etcétera. Pero, también aparecen algunas nuevas palabras que ya tienen algún sentido y que son importantes para nosotros, como "navío", "marcial", "combate", "ingleses", "Cádiz". De manera que, por supuesto, nosotros podemos comenzar a trabajar con algunas de estas palabras. Para ello conviene, todavía, sacar el mayor número de palabras vacías, de manera que nos quede, en términos de datos, datos mucho más significativos y mucho más importantes para trabajar sobre ellos. Para seguir utilizando la herramienta, tendríamos que seguir limpiando nuestras palabras vacías hasta que quedemos satisfechos o, al menos, hasta que las palabras que aparezcan de manera más destacada sean palabras que tengan significado para nosotros y que podamos utilizar para interpretar los resultados. Pero esta interpretación de resultados y cómo trasladar los resultados, analizar y utilizar las otras herramientas que nos ofrece Voyant Tools, lo veremos en un siguiente video.