PT | EN | ES

Menú principal


Powered by <TEI:TOK>
Maarten Janssen, 2014-

Descargas

Los investigadores que prefieran trabajar con nuestros datos usando herramientas propias encontrarán en las tablas siguientes los archivos de texto apropiados.

Tabla 1: Distribución del corpus por lengua, siglo y formato:

Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica(1) ISLRN: 662-489-499-707-7
Portugués XVI PT1500_ORIG_TXT.ZIP PT1500_MOD_TXT.ZIP PT1500_POS.ZIP PT1500_PSD.ZIP
Portugués XVII PT1600_ORIG_TXT.ZIP PT1600_MOD_TXT.ZIP PT1600_POS.ZIP PT1600_PSD.ZIP
Portugués XVIII PT1700_ORIG_TXT.ZIP PT1700_MOD_TXT.ZIP PT1700_POS.ZIP PT1700_PSD.ZIP
Portugués XIX PT1800_ORIG_TXT.ZIP PT1800_MOD_TXT.ZIP PT1800_POS.ZIP PT1800_PSD.ZIP
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS(2) ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500_ORIG_TXT.ZIP ES1500_MOD_TXT.ZIP ES1500_POS.ZIP ES1500_PSD.ZIP
Español XVII ES1600_ORIG_TXT.ZIP ES1600_MOD_TXT.ZIP ES1600_POS.ZIP ES1600_PSD.ZIP
Español XVIII ES1700_ORIG_TXT.ZIP ES1700_MOD_TXT.ZIP ES1700_POS.ZIP ES1700_PSD.ZIP
Español XIX ES1800_ORIG_TXT.ZIP ES1800_MOD_TXT.ZIP ES1800_POS.ZIP ES1800_PSD.ZIP

(1) Las búsquedas en los archivos PSD se realizan con la herramienta Corpus Search. Las búsquedas en los archivos PSDX se realizan online en TEITOK.
(2) La anotación morfosintáctica del corpus español está en proceso de revisión.

Tabla 2: Distribución del corpus por sexo, lengua, siglo y formato:

Masculino
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500m_ORIG_TXT.ZIP PT1500m_MOD_TXT.ZIP PT1500m_POS.ZIP PT1500m_PSD.ZIP
Portugués XVII PT1600m_ORIG_TXT.ZIP PT1600m_MOD_TXT.ZIP PT1600m_POS.ZIP PT1600m_PSD.ZIP
Portugués XVIII PT1700m_ORIG_TXT.ZIP PT1700m_MOD_TXT.ZIP PT1700m_POS.ZIP PT1700m_PSD.ZIP
Portugués XIX PT1800m_ORIG_TXT.ZIP PT1800m_MOD_TXT.ZIP PT1800m_POS.ZIP PT1800m_PSD.ZIP
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500m_ORIG_TXT.ZIP ES1500m_MOD_TXT.ZIP ES1500m_POS.ZIP ES1500m_PSD.ZIP
Español XVII ES1600m_ORIG_TXT.ZIP ES1600m_MOD_TXT.ZIP ES1600m_POS.ZIP ES1600m_PSD.ZIP
Español XVIII ES1700m_ORIG_TXT.ZIP ES1700m_MOD_TXT.ZIP ES1700m_POS.ZIP ES1700m_PSD.ZIP
Español XIX ES1800m_ORIG_TXT.ZIP ES1800m_MOD_TXT.ZIP ES1800m_POS.ZIP ES1800m_PSD.ZIP
Femenino
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500f_ORIG_TXT.ZIP PT1500f_MOD_TXT.ZIP PT1500f_POS.ZIP PT1500f_PSD.ZIP
Portugués XVII PT1600f_ORIG_TXT.ZIP PT1600f_MOD_TXT.ZIP PT1600f_POS.ZIP PT1600f_PSD.ZIP
Portugués XVIII PT1700f_ORIG_TXT.ZIP PT1700f_MOD_TXT.ZIP PT1700f_POS.ZIP PT1700f_PSD.ZIP
Portugués XIX PT1800f_ORIG_TXT.ZIP PT1800f_MOD_TXT.ZIP PT1800f_POS.ZIP PT1800f_PSD.ZIP
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500f_ORIG_TXT.ZIP ES1500f_MOD_TXT.ZIP ES1500f_POS.ZIP ES1500f_PSD.ZIP
Español XVII ES1600f_ORIG_TXT.ZIP ES1600f_MOD_TXT.ZIP ES1600f_POS.ZIP ES1600f_PSD.ZIP
Español XVIII ES1700f_ORIG_TXT.ZIP ES1700f_MOD_TXT.ZIP ES1700f_POS.ZIP ES1700f_PSD.ZIP
Español XIX ES1800f_ORIG_TXT.ZIP ES1800f_MOD_TXT.ZIP ES1800f_POS.ZIP ES1800f_PSD.ZIP

Tabla 3: Distribución del corpus por estatus social3, lengua, siglo y formato:

Nobleza
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500nob_ORIG_TXT.ZIP PT1500nob_MOD_TXT.ZIP PT1500nob_POS.ZIP PT1500nob_PSD.ZIP
Portugués XVII PT1600nob_ORIG_TXT.ZIP PT1600nob_MOD_TXT.ZIP PT1600nob_POS.ZIP PT1600nob_PSD.ZIP
Portugués XVIII PT1700nob_ORIG_TXT.ZIP PT1700nob_MOD_TXT.ZIP PT1700nob_POS.ZIP PT1700nob_PSD.ZIP
Portugués XIX PT1800nob_ORIG_TXT.ZIP PT1800nob_MOD_TXT.ZIP PT1800nob_POS.ZIP No hay datos
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500nob_ORIG_TXT.ZIP ES1500nob_MOD_TXT.ZIP ES1500nob_POS.ZIP ES1500nob_PSD.ZIP
Español XVII ES1600nob_ORIG_TXT.ZIP ES1600nob_MOD_TXT.ZIP ES1600nob_POS.ZIP ES1600nob_PSD.ZIP
Español XVIII ES1700nob_ORIG_TXT.ZIP ES1700nob_MOD_TXT.ZIP ES1700nob_POS.ZIP ES1700nob_PSD.ZIP
Español XIX ES1800nob_ORIG_TXT.ZIP ES1800nob_MOD_TXT.ZIP ES1800nob_POS.ZIP ES1800nob_PSD.ZIP
Clero
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500ecc_ORIG_TXT.ZIP PT1500ecc_MOD_TXT.ZIP PT1500ecc_POS.ZIP PT1500ecc_PSD.ZIP
Portugués XVII PT1600ecc_ORIG_TXT.ZIP PT1600ecc_MOD_TXT.ZIP PT1600ecc_POS.ZIP PT1600ecc_PSD.ZIP
Portugués XVIII PT1700ecc_ORIG_TXT.ZIP PT1700ecc_MOD_TXT.ZIP PT1700ecc_POS.ZIP PT1700ecc_PSD.ZIP
Portugués XIX PT1800ecc_ORIG_TXT.ZIP PT1800ecc_MOD_TXT.ZIP PT1800ecc_POS.ZIP PT1800ecc_PSD.ZIP
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500ecc_ORIG_TXT.ZIP ES1500ecc_MOD_TXT.ZIP ES1500ecc_POS.ZIP ES1500ecc_PSD.ZIP
Español XVII ES1600ecc_ORIG_TXT.ZIP ES1600ecc_MOD_TXT.ZIP ES1600ecc_POS.ZIP ES1600ecc_PSD.ZIP
Español XVIII ES1700ecc_ORIG_TXT.ZIP ES1700ecc_MOD_TXT.ZIP ES1700ecc_POS.ZIP ES1700ecc_PSD.ZIP
Español XIX ES1800ecc_ORIG_TXT.ZIP ES1800ecc_MOD_TXT.ZIP ES1800ecc_POS.ZIP ES1800ecc_PSD.ZIP
Santo Oficio
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500inq_ORIG_TXT.ZIP PT1500inq_MOD_TXT.ZIP PT1500inq_POS.ZIP PT1500inq_PSD.ZIP
Portugués XVII PT1600inq_ORIG_TXT.ZIP PT1600inq_MOD_TXT.ZIP PT1600inq_POS.ZIP PT1600inq_PSD.ZIP
Portugués XVIII PT1700inq_ORIG_TXT.ZIP PT1700inq_MOD_TXT.ZIP PT1700inq_POS.ZIP PT1700inq_PSD.ZIP
Portugués XIX No hay datos No hay datos No hay datos No hay datos
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN:
Español XVI ES1500inq_ORIG_TXT.ZIP ES1500inq_MOD_TXT.ZIP ES1500inq_POS.ZIP ES1500inq_PSD.ZIP
Español XVII ES1600inq_ORIG_TXT.ZIP ES1600inq_MOD_TXT.ZIP ES1600inq_POS.ZIP ES1600inq_PSD.ZIP
Español XVIII ES1700inq_ORIG_TXT.ZIP ES1700inq_MOD_TXT.ZIP ES1700inq_POS.ZIP No hay datos
Español XIX No hay datos No hay datos No hay datos No hay datos
Militares
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500mil_ORIG_TXT.ZIP PT1500mil_MOD_TXT.ZIP PT1500mil_POS.ZIP PT1500mil_PSD.ZIP
Portugués XVII PT1600mil_ORIG_TXT.ZIP PT1600mil_MOD_TXT.ZIP PT1600mil_POS.ZIP PT1600mil_PSD.ZIP
Portugués XVIII PT1700mil_ORIG_TXT.ZIP PT1700mil_MOD_TXT.ZIP PT1700mil_POS.ZIP PT1700mil_PSD.ZIP
Portugués XIX PT1800mil_ORIG_TXT.ZIP PT1800mil_MOD_TXT.ZIP PT1800mil_POS.ZIP PT1800mil_PSD.ZIP
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500mil_ORIG_TXT.ZIP ES1500mil_MOD_TXT.ZIP ES1500mil_POS.ZIP ES1500mil_PSD.ZIP
Español XVII ES1600mil_ORIG_TXT.ZIP ES1600mil_MOD_TXT.ZIP ES1600mil_POS.ZIP No hay datos
Español XVIII ES1700mil_ORIG_TXT.ZIP ES1700mil_MOD_TXT.ZIP ES1700mil_POS.ZIP ES1700mil_PSD.ZIP
Español XIX ES1800mil_ORIG_TXT.ZIP ES1800mil_MOD_TXT.ZIP ES1800mil_POS.ZIP ES1800mil_PSD.ZIP
Caballeros de hábito
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500kni_ORIG_TXT.ZIP PT1500kni_MOD_TXT.ZIP PT1500kni_POS.ZIP PT1500kni_PSD.ZIP
Portugués XVII PT1600kni_ORIG_TXT.ZIP PT1600kni_MOD_TXT.ZIP PT1600kni_POS.ZIP PT1600kni_PSD.ZIP
Portugués XVIII PT1700kni_ORIG_TXT.ZIP PT1700kni_MOD_TXT.ZIP PT1700kni_POS.ZIP No hay datos
Portugués XIX PT1800kni_ORIG_TXT.ZIP PT1800kni_MOD_TXT.ZIP PT1800kni_POS.ZIP PT1800kni_PSD.ZIP
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI No hay datos No hay datos No hay datos No hay datos
Español XVII ES1600kni_ORIG_TXT.ZIP ES1600kni_MOD_TXT.ZIP ES1600kni_POS.ZIP ES1600kni_PSD.ZIP
Español XVIII ES1700kni_ORIG_TXT.ZIP ES1700kni_MOD_TXT.ZIP ES1700kni_POS.ZIP No hay datos
Español XIX No hay datos No hay datos No hay datos No hay datos
Universitarios
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500uni_ORIG_TXT.ZIP PT1500uni_MOD_TXT.ZIP PT1500uni_POS.ZIP PT1500uni_PSD.ZIP
Portugués XVII PT1600uni_ORIG_TXT.ZIP PT1600uni_MOD_TXT.ZIP PT1600uni_POS.ZIP No hay datos
Portugués XVIII PT1700uni_ORIG_TXT.ZIP PT1700uni_MOD_TXT.ZIP PT1700uni_POS.ZIP No hay datos
Portugués XIX PT1800uni_ORIG_TXT.ZIP PT1800uni_MOD_TXT.ZIP PT1800uni_POS.ZIP No hay datos
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500uni_ORIG_TXT.ZIP ES1500uni_MOD_TXT.ZIP ES1500uni_POS.ZIP ES1500uni_PSD.ZIP
Español XVII ES1600uni_ORIG_TXT.ZIP ES1600uni_MOD_TXT.ZIP ES1600uni_POS.ZIP ES1600uni_PSD.ZIP
Español XVIII ES1700uni_ORIG_TXT.ZIP ES1700uni_MOD_TXT.ZIP ES1700uni_POS.ZIP ES1700uni_PSD.ZIP
Español XIX ES1800uni_ORIG_TXT.ZIP ES1800uni_MOD_TXT.ZIP ES1800uni_POS.ZIP No hay datos
Estatus ordinario
Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500ord_ORIG_TXT.ZIP PT1500ord_MOD_TXT.ZIP PT1500ord_POS.ZIP PT1500ord_PSD.ZIP
Portugués XVII PT1600ord_ORIG_TXT.ZIP PT1600ord_MOD_TXT.ZIP PT1600ord_POS.ZIP PT1600ord_PSD.ZIP
Portugués XVIII PT1700ord_ORIG_TXT.ZIP PT1700ord_MOD_TXT.ZIP PT1700ord_POS.ZIP PT1700ord_PSD.ZIP
Portugués XIX PT1800ord_ORIG_TXT.ZIP PT1800ord_MOD_TXT.ZIP PT1800ord_POS.ZIP PT1800ord_PSD.ZIP
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500ord_ORIG_TXT.ZIP ES1500ord_MOD_TXT.ZIP ES1500ord_POS.ZIP ES1500ord_PSD.ZIP
Español XVII ES1600ord_ORIG_TXT.ZIP ES1600ord_MOD_TXT.ZIP ES1600ord_POS.ZIP ES1600ord_PSD.ZIP
Español XVIII ES1700ord_ORIG_TXT.ZIP ES1700ord_MOD_TXT.ZIP ES1700ord_POS.ZIP ES1700ord_PSD.ZIP
Español XIX ES1800ord_ORIG_TXT.ZIP ES1800ord_MOD_TXT.ZIP ES1800ord_POS.ZIP ES1800ord_PSD.ZIP

(3) Además de los siete tipos de estatus social recogidos en esta tabla, en el corpus se registra un octavo tipo, esclavos, asignado a una única autora (Teresa de Jesus Faria), que cuenta con una única carta (PSCR0620).

Tabla 4: Corpus equilibrado (una carta por autor) distribuido por lengua, siglo y formato:

Lengua Siglo Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotación POS ISLRN: 321-583-358-829-1 Anotación sintáctica ISLRN: 662-489-499-707-7
Portugués XVI PT1500bal_ORIG_TXT.ZIP PT1500bal_MOD_TXT.ZIP PT1500bal_POS.ZIP PT1500bal_PSD.ZIP
Portugués XVII PT1600bal_ORIG_TXT.ZIP PT1600bal_MOD_TXT.ZIP PT1600bal_POS.ZIP PT1600bal_PSD.ZIP
Portugués XVIII PT1700bal_ORIG_TXT.ZIP PT1700bal_MOD_TXT.ZIP PT1700bal_POS.ZIP PT1700bal_PSD.ZIP
Portugués XIX PT1800bal_ORIG_TXT.ZIP PT1800bal_MOD_TXT.ZIP PT1800bal_POS.ZIP PT1800bal_PSD.ZIP
Lengua Siglo Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotación POS ISLRN: 042-997-465-008-9 Anotación sintáctica ISLRN: 306-113-341-591-4
Español XVI ES1500bal_ORIG_TXT.ZIP ES1500bal_MOD_TXT.ZIP ES1500bal_POS.ZIP ES1500bal_PSD.ZIP
Español XVII ES1600bal_ORIG_TXT.ZIP ES1600bal_MOD_TXT.ZIP ES1600bal_POS.ZIP ES1600bal_PSD.ZIP
Español XVIII ES1700bal_ORIG_TXT.ZIP ES1700bal_MOD_TXT.ZIP ES1700bal_POS.ZIP ES1700bal_PSD.ZIP
Español XIX ES1800bal_ORIG_TXT.ZIP ES1800bal_MOD_TXT.ZIP ES1800bal_POS.ZIP ES1800bal_PSD.ZIP

Table 5: Acceso a los documentos en versión XML-TEI P5:

La tabla siguiente ofrece el archivo digital de Post Scriptum en versión XML-TEIP5, validable mediante la personalización del esquema TEI del citado proyecto. Este esquema de validación se puede obtener automáticamente a partir del archivo ODD de Post Scriptum (haciendo uso de la herramienta Roma, por ejemplo) o se puede obtener directamente en formato Relax NG pinchando en Esquema TEI de Post Scriptum. Por defecto, el esquema debe guardarse en el mismo directorio que los archivos XML. Además del archivo digital, este esquema también permite validar las versiones XML-TEIP5  de la Base de Datos Biográficos (accesible en cdd.xml ) y de la Clasificación sociohistórica (accesible en kw.xml ).

Para una información detallada de las versiones TEIP5 de Post Scriptum, véase  P.S. Post Scriptum: Archivo digital de escritura cotidiana. Personalización del esquema TEI y documentación

Lengua Siglo XML-TEI: P5. Corpus entero XML-TEI: P5. Corpus equilibrado(4)
Portugués XVI PT1500_XML-TEI_P5.ZIP PT1500bal_XML-TEI_P5.ZIP
Portugués XVII PT1600_XML-TEI_P5.ZIP PT1600bal_XML-TEI_P5.ZIP
Portugués XVIII PT1700_XML-TEI_P5.ZIP PT1700bal_XML-TEI_P5.ZIP
Portugués XIX PT1800_XML-TEI_P5.ZIP PT1800bal_XML-TEI_P5.ZIP
Lengua Siglo XML-TEI: P5. Corpus entero XML-TEI: P5. Corpus equilibrado
Español XVI ES1500_XML-TEI_P5.ZIP ES1500bal_XML-TEI_P5.ZIP
Español XVII ES1600_XML-TEI_P5.ZIP ES1600bal_XML-TEI_P5.ZIP
Español XVIII ES1700_XML-TEI_P5.ZIP ES1700bal_XML-TEI_P5.ZIP
Español XIX ES1800_XML-TEI_P5.ZIP ES1800bal_XML-TEI_P5.ZIP

(4) El corpus equilibrado es un subcorpus creado a partir de la selección automática de una única carta por autor, que generalmente es la que presenta un mayor número de tipos de palabras diferentes en la edición normalizada (cf. apartado 1.3.1.3. en Manual de Edición y Anotación en TEITOK de los Materiales de P.S. Post Scriptum).

 

VARIANTES GRÁFICAS

Las estadísticas sobre la versión normalizada de 478 cartas portuguesas, contrastada con la versión original, puede consultarse en la web de la herramienta DICER, de Alistair Baron, bajo el nombre Portuguese Post Scriptum by eDictor. Como su nombre indica, la estandarización manual se realizó con la herramienta eDictor.