Versión primera, sin parametrizar. Toma el archivo dump en formato xml y se parsea utilizando re (regex) de Python para eliminar el markup innecesario y dejar sólo el texto plano.
- Archivo de noticias de wikinews(en formato xml) para ser parseado por el script.
- Python 2.x