Curso de Análisis de textos y Estilometría usando "R"

Curso
Distancia
6 créditos
Precio 240 €

Descripción

El objetivo del curso es dotar a los investigadores de humanidades de los conocimientos básicos para realizar investigaciones de minería de textos (text mining), problemas de atribución de autoría, lingüística forense, procesamiento de lenguaje natural, modelado de temas (Topic Modelling) por medio de un lenguaje de programación libre y gratuito ampliamente empleado por la comunidad científica en diversos campos y materias, desde la estadística a la lingüística forense pasando por la filogénesis, bioestadística, análisis político, marketing… Este sistema permite el procesamiento automatizado de grandes cantidades de texto por ordenador, arrojando interesantes datos, que pueden representarse visualmente sobre cuestiones tan relevantes como las distintas manos o autores que intervienen sobre una obra, o la frecuencia de un determinado tipo de palabras o recursos estilísticos para tratar determinados temas. Se trata, sin duda, de una revolucionaria aproximación con enormes perspectivas dentro de la investigación en el ámbito hispánico de las humanidades que no se había planteado hasta hoy como reto.

Temario

  • Introducción a R (instalación y primeros pasos)
  • Calcular la frecuencia de palabras de un texto
  • Análisis de la distribución de tokens en un texto
  • Análisis de correlación
  • Medir la variedad y riqueza léxica de un texto
  • Cálculo de hapax
  • Calidad del texto, variedad de textos y el XML
  • Análisis de grupos (clustering)
  • Clasificación
  • Modelado de temas (topic modelling)

Destinatarios

Está destinado principalmente a:
  • Estudiantes con formación en distintas áreas de Humanidades que deseen adquirir conocimientos tecnológicos para enfrentarse a los nuevos retos que ofrece el análisis digital automatizado del texto, abriendo nuevas perspectivas.
  • investigadores actualmente trabajando en proyectos de diferentes disciplinas humanísticas (filología, arte, historia, filosofía…) que deseen ponerse al día sobre las herramientas y perspectivas tecnológicas existentes con el fin de poder aplicarlas a sus proyectos reales de investigación.
  • Profesionales que trabajen en el campo de las humanidades(principalmente GLAM: Galerías, Bibliotecas/Libraries, Archivos y Museos) y que deseen aumentar sus competencias digitales en análisis textual para poder aplicarlas en su propio trabajo.
  • Personas pertenecientes a otras disciplinas que estén interesados por conocer las Humanidades Digitales y acercarse a un tipo de trabajo interdisciplinar y muy actual.
  • En especial, este curso está diseñado para aquellas personas que se dedican a la investigación y el trabajo con textos y quieran ir más allá de las posibilidades que ofrecen los programas del estilo de WordSmith, AntConc y Excel.
  • El curso está dirigido a cualquier licenciado o graduado de humanidades con unos conocimientos básicos de informática.

Requisitos

No es necesario cumplir con ningún requisito académico para acceder al curso.

Metodología

El curso será completamente online. Se trabajará sobre documentos digitalizados y se irá proponiendo realizar diferentes experimentos (minería, análisis de datos textuales, visualizaciones en distintos formatos, extracción de conclusiones, etc). El objetivo final es sentar las bases para la realización de análisis textuales cuantitativos en áreas de estudio que hasta ahora solo se han preocupado por los métodos cualitativos.

Duración

Del lunes 9 de enero del 2017 al miércoles 31 de mayo de 2017.

Tipo de evaluación

Al final de cada tema se le propondrá al estudiante que, basándose en lo que se ha expuesto en el tema, realice unas prácticas.
Curso de Análisis de textos y Estilometría usando "R"
Facultad de Filología (UNED)
Campus y sedes: Facultad de Filología (UNED)
Facultad de Filología (UNED)
Ed. Facultadesde Humanidades. C/ Senda del Rey, s/n 28040 Madrid
Cursos más populares
Temas relacionados
Solicita información
X