Skip to content

maximodleon/eswikinews

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Script para sacar el texto de las noticias de wikinews en español

Versión primera, sin parametrizar. Toma el archivo dump en formato xml y se parsea utilizando re (regex) de Python para eliminar el markup innecesario y dejar sólo el texto plano.

Requerimientos
  • Archivo de noticias de wikinews(en formato xml) para ser parseado por el script.
  • Python 2.x
Enlaces

Dumps de wikinews en español

Releases

No releases published

Packages

No packages published

Languages