El artículo presenta una forma de gestionar la información digital procedente de fuentes impresas (periódicos). Se presenta una breve evolución histórica del tratamiento de estas fuentes de datos. A continuación se describe el modelo lógico de desarrollo de un nuevo sistema de tratamiento de la información. Finalmente se presenta un prototipo que permitió resolver la relación de dos fuentes diferentes de forma totalmente automatizada y que además posibilitó el descubrimiento de nuevos patrones de información.