GitHub - maximodleon/eswikinews: Parseador de dump de wikinews en español

Script para sacar el texto de las noticias de wikinews en español

Versión primera, sin parametrizar. Toma el archivo dump en formato xml y se parsea utilizando re (regex) de Python para eliminar el markup innecesario y dejar sólo el texto plano.

Requerimientos

Archivo de noticias de wikinews(en formato xml) para ser parseado por el script.
Python 2.x

Enlaces

Dumps de wikinews en español

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.idea		.idea
models		models
utils		utils
.gitignore		.gitignore
README.md		README.md
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Script para sacar el texto de las noticias de wikinews en español

Requerimientos

Enlaces

About

Releases

Packages

Languages

maximodleon/eswikinews

Folders and files

Latest commit

History

Repository files navigation

Script para sacar el texto de las noticias de wikinews en español

Requerimientos

Enlaces

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages