









Proyecto PID2020-119308GB-I00financiado por
MCIN/AEI/10.13039/501100011033.
Presentación
El Corpus Histórico del Español Norteño (CORHEN) está formado por documentación privada (debida a escribanos locales) de las variedades castellanas del centro-norte peninsular, en concreto, de las actuales provincias de Burgos, Palencia y Valladolid, aunque no hemos excluido documentos sueltos de otras provincias limítrofes. En cuanto a la cronología, abarca desde los primeros testimonios conservados, del siglo X, hasta finales del siglo XIII, con textos en latín, en hibridismo latinorromance y en romance consistente.
CORHEN tiene como objetivo principal servir de base para el estudio y reconstrucción de la historia del castellano medieval, dialecto caracterizado por Menéndez Pidal como decididamente innovador y homogéneo. La posibilidad de analizar la variación intradialectal de un área geográfica tan pequeña nos devuelve una imagen mucho más compleja y rica de la realidad.
Los documentos se ofrecen en una doble presentación en paralelo, paleográfica y crítica, de acuerdo a los criterios de la red CHARTA y los propios desarrollados por el Grupo de Historia del Español Norteño (GHEN). Además de la lectura lineal e íntegra de los textos, pueden realizarse búsquedas lingüísticas simples o complejas, estas, mediante el uso de expresiones regulares. Tanto los metadatos como los documentos se pueden filtrar por los diferentes parámetros, aislados o combinados (fecha exacta o intervalo temporal, provincia, localidad, tipología, escribano, elementos de validación...). De los patrones buscados se presentan las concordancias, que pueden ordenarse por diferentes criterios, así como eliminar directamente los casos no deseados. Los resultados cuantitativos pueden visualizarse en forma de tabla, gráficos y mapas, fácilmente exportables para insertar en publicaciones.
Algunas claves de la documentación
Documentación privada: La documentación debida a escribanos locales es la única en la que podremos rastrear rasgos de la variedad lingüística de la zona, razón por la cual en CORHEN solo tienen cabida los documentos privados, entendiendo por tales los contratos entre particulares o entre instituciones y particulares, generalmente compraventas, intercambios, donaciones, avenencias, etc., cuyos participantes y escribano comparten el mismo ámbito geográfico. Se excluyen, en consecuencia, tanto los diplomas reales como los de contenido propiamente eclesiástico, por lo general redactados en un buen latín.
Originales y copias: Para la historia de la lengua, el documento de archivo cuenta con la ventaja de su datación cronológica explícita. Incluso los textos interpolados, los falsos diplomáticos o las copias temporalmente cercanas al original son lingüísticamente tan representativas como un original. Una parte importante de los documentos editados carecen de elementos de validación, lo que en el caso de la documentación privada en absoluto implica su falta de autenticidad. Esto supone una dificultad para determinar el carácter original o no de los diplomas y para su datación, cuestión esta a la que hemos dedicado importantes esfuerzos.
Lugar de emisión: Mayores si cabe han sido los esfuerzos para la datación tópica, de la que carece la generalidad de los documentos privados medievales. Lejos de identificar, como con frecuencia sucede, el fondo archivístico con el centro de emisión, hemos hecho una propuesta de reconstrucción del lugar de emisión de cada documento y, en el caso de haber indicios de que la escrituración se realizó en una institución eclesiástica, lo hemos señalado. Aun a riesgo de cometer errores, la adscripción acrítica del diploma al monasterio o catedral entre cuyos fondos se conserva nos parece un desacierto mayor, que puede conducir a caracterizaciones dialectales equivocadas.
La lengua de los documentos: La cronología del corpus, con documentos fechados desde el siglo X, permite analizar la contienda entre los códigos latino y romance antes del definitivo triunfo de este último. El surgimiento del romance en la escritura no puede valorarse en su justa medida sin el estudio de la tradición latina precedente y coetánea, y el hibridismo latinorromance característico de buena parte de esta documentación es clave para aquilatar la representatividad lingüística de estos textos.
Los fondos: El corpus está compuesto principalmente por fondos monásticos de las órdenes benedictina, cisterciense y premonstratense, a los que hay que añadir las catedrales y los concejos. La representatividad de los distintos fondos es necesariamente irregular, con significativas diferencias cuantitativas que el usuario de CORHEN deberá tener presente. No obstante, preservar la identidad de los fondos, más allá de su obligada identificación archivística, es en sí una importante información y fuente para la reconstrucción de la historia de estos monasterios y sus territorios.





