Palabras que nunca faltan

Los 4.812 vocablos más usados en el país integran el Léxico básico del español de Chile, diccionario estadístico inédito en Sudamérica, producto de una investigación de la lingüista y lexicógrafa Natalia Castillo. Spoiler: los 10 primeros de la lista son monosílabos.




Una indagatoria acotada y no especialmente rigurosa, previa a la redacción de este artículo, ha refrendado lo extendido de una creencia de larga data: las palabras más usadas por los chilenos tendrían raíces en las gónadas masculinas (“huevear”, “huevón”, “huevada”, como sea que se les pronuncie y se les escriba). Una creencia que muchos asumen como un saber, aun si no hay evidencia contundente del peso de estas expresiones en el lenguaje hablado ni, para el caso, en RR.SS. o en medios de comunicación. Tampoco la hay de que otras palabras tengan preeminencia en el uso por el solo hecho de resultarnos familiares o cercanas, como “camisa” o “tenedor” (¿cuántas veces las ocupamos, comparadas con las de más arriba?). Por ahí no va la mano si se quiere determinar cuáles son las más usadas. O si, acto seguido, se va a preguntar por qué esto último habría de importar y qué criterios hay para determinar lo que deba determinarse.

Menos evanescentes que las palabras habladas, las escritas e impresas son más dadas a asentar las estructuras estables del idioma, sin perjuicio de que den cuenta de las otras, y a mucha honra. Por eso, y contando con metodología adecuada, hay mejores posibilidades de que unas pocas miles de esas palabras nos iluminen respecto de una serie de ítems, incluidas las políticas educativas. Y si luego esa metodología deriva en un diccionario, el primero de su especie en Chile y en América del Sur, tanto mejor.

A mediados de julio, según estimaciones de la editorial Liberalia, estará disponible la versión física del Léxico básico del español de Chile, creado por la lingüista y lexicógrafa Natalia Castillo Fadic y prologado por Humberto López Morales, exsecretario general de la Asociación de Academias de la Lengua Española. Al margen de sus valores científicos intrínsecos, dice este último, la obra “tiene múltiples aplicaciones prácticas, especialmente en los trabajos científicos orientados a la programación de la adquisición del léxico materno”.

Este diccionario léxicoestadístico -no ofrece definiciones- da cuenta de un barrido a 26 años (1981-2006, “sin sesgo ético ni estético”) de periódicos, ensayos, obras para teatro, narrativas y técnico-científicas, de autores chilenos, a partir de los cuales se obtuvieron más de 500 mil vocablos (vocablo, para estos efectos, es “tener”, mientras formas verbales como “tendrían” o “tuve” ofician como palabras).

Con ese corpus de referencia, creado ex profeso para la investigación, se estableció más tarde la frecuencia y la dispersión con que los vocablos aparecen en las cinco categorías mencionadas, lo que permitió más tarde determinar su uso. Y así fue como se obtuvieron los 4.812 vocablos de mayor uso en el país. No las palabras del momento ni chilenismos bien o malsonantes, sino las unidades lexicales que ponen y mantienen en movimiento la máquina del idioma. Y no sólo en Chile, por lo cual el diccionario se entiende bien en principio con las variantes idiomáticas de la mayor parte de Hispanoamérica.

De vuelta al primer párrafo, puede entenderse ahora por qué ni “huevón” ni los vocablos afines calificaron entre los 4.812 principales, pese a sus reiteradas apariciones en nuestras vidas: para estar, deben tener buena y pareja presencia en las cinco categorías señaladas, y por lo pronto, cuesta imaginar que un texto técnico-científico los incluya. Así las cosas, el top 10 del léxico básico chileno es el siguiente:

1. “el” (el artículo, como en “llegó el día”, no el pronombre personal)

2. “de”

3. “y”

4. “a”

5. “en”

6. “un”

7. “que” (pronombre relativo, como en “Ana, que es atleta”)

8. “ser”

9. “que” (conjunción subordinada, como en “quiero que estudies”)

10. “se”

Aunque entre los primeros 50 hay varios verbos con sus formas verbales (“estar”, 20; “tener”, 21; “poder”, 23; “decir”, 30, entre otros), claramente mandan los artículos, las preposiciones, las conjunciones y los pronombres, esas partes poco estelares de la oración sin las cuales, eso sí, mal podríamos batírnoslas con el idioma: intente el lector escribir una línea de texto sin considerar los vocablos del top 10, y a ver cómo le va.

Se trata, ante todo, como en otros léxicos básicos, de palabras monosilábicas (la primera bisilábica en este caso es la 15: la preposición “para”) y atemáticas, es decir, que no tienen relación con ningún tema. Que están ahí para ayudar a que la lengua se articule.

De ahí que esta obra tan singular se vea a sí misma como “una herramienta en la que pueden apoyarse las políticas públicas relativas a la educación en nuestro país, de modo de uniformar criterios en torno al léxico que conviene enseñar en las escuelas y al orden en que es preferible presentarlo. (…) Al servicio de educadores y estudiantes, se ofrece como un recurso para mejorar los índices de alfabetización funcional, tanto en comprensión como en producción de textos, de niños y adultos, aprendientes de español como primera o como segunda lengua”.

Macroinvestigación

Este libro pertenece a la categoría de diccionarios estadísticos. No porque tenga como tema la estadística ni porque esté dirigido a expertos matemáticos, se nos aclara en la introducción, “sino porque se basa en cálculos estadísticos y presenta, en vez de las definiciones que solemos encontrar en la mayoría de los diccionarios, índices estadísticos”.

Igualmente, se explica a los usuarios que los vocablos que ingresan a un léxico básico, al tener alto uso, requieren también de una dispersión adecuada. Esto significa que los vocablos contenidos en esta obra “no sólo son frecuentes, sino que también se emplean con bastante independencia del contexto y del tema del que se esté hablando o escribiendo”. He ahí el mencionado carácter atemático de los mismos. Por eso, los vocablos que conforman los léxicos básicos “deberían ser objeto de estudio preferente de los aprendientes de una lengua. Si no conozco el léxico básico de mi comunidad, ¿qué sentido tiene que aprenda términos restringidos sólo a ciertos temas o a ciertas situaciones?”.

“Todo léxico permite aventurarse en la identidad de una comunidad”, plantea en tanto la directora de Liberalia, Berta Concha. Más aún si se trata de uno con las singularidades que ofrece el de Natalia Castillo, que supo despertar el interés de la editorial ñuñoína. Desde la perspectiva de Concha, “un ‘catálogo chileno’ no puede seguir omitiendo el corpus referencial contenido en sus libros, diarios, revistas, leyes, usos, creaciones artísticas e intelectuales”.

Académica de la Facultad de Letras de la UC, Castillo ha presentado, por su parte, el diccionario como fruto de una “macroinvestigación lexicoestadística” cuyos principales antecedentes son el Frequency Dictionary of Spanish Words, The Roman Languages and their Structures (1964), de A. Juilland y E. Chang-Rodríguez, y el Léxico básico del español de Puerto Rico (1986), de Amparo Morales. Para mayor abundamiento, informa que la investigación usó herramientas de lingüística de corpus, lingüística computacional y estadística inferencial, al tiempo que consideró aspectos lexicológicos, semánticos y gramaticales.

El objetivo general fue obtener el léxico que da su título al libro, mientras los específicos fueron: “Precisar los índices estadísticos de las unidades léxicas del corpus; determinar los vocablos de mayor frecuencia, dispersión y uso en el español de Chile; analizar los resultados, contrastando los índices de frecuencia de cada mundo entre sí y con los de dispersión y uso”.

Más distendidamente, hablando con La Tercera, la investigadora hace una analogía con el vestuario: tal vez lo que alguien más precie de su vestuario sea un esmoquin o cierto vestido de noche. Pero, ¿cada cuánto se lo pone? ¿Y cada cuanto se pone calcetines o ropa interior? Piense ahora el lector en los vocablos que usa y verá que la analogía vestimentaria no está tan descaminada: una camisa blanca (tal preposición, tal pronombre) sirve todo el año, en cualquier situación, mientras una guayabera naranja con puntos amarillos (tal o cual nombre del reino animal que usamos muy a lo lejos, por ejemplo) tiene rara vez una oportunidad de ser empleada.

No todo el mundo engancha con esa lógica, reconoce Castillo, quien aún recuerda que un ingeniero le preguntó para qué perdía el tiempo investigando “si la palabra que más usamos los chilenos es ‘huevón’ y, además, apenas hablamos como con 100 palabras. Que yo sepa, no se ha hecho una investigación sobre si hablamos en Chile con 100 o 300 palabras, pero hay gente que repite esas cosas”.

Nuevamente expresándose desde su disciplina, Castillo afirma que el Léxico básico “espera contribuir al estudio del español de Chile y sentar las bases para seleccionar las unidades léxicas pertinentes para elaborar diccionarios” en la variante local del castellano. Los resultados de la investigación, agrega, “pueden aplicarse a la enseñanza-aprendizaje del español y pueden contribuir también al desarrollo de aplicaciones de lingüística computacional en esta lengua”.

El anterior es uno de los puntos en los cuales esta obra tan especializada -el primer estudio de frecuencia léxica desarrollado en el país- exuda necesidad y hasta urgencia. En la sección 3.6, por ejemplo, se destacan los 100 vocablos de mayor uso, ordenados por rango de uso, de mayor a menor. Pero no es el ranking por el ranking: lo que se pretende es “facilitar la tarea de los educadores que, si lo desean, podrán programar los objetivos de aprendizaje de sus estudiantes respecto del español de Chile, comenzando por los vocablos más usados”. Y en esto es vital que, a diferencia de los léxicos provistos actualmente a los colegios chilenos, los del futuro se sostengan en palabras/vocablos encontrados localmente por alguien que los andaba buscando.

¿Y el presentismo? ¿Y las redes sociales? Ahí la autora se ve obligada a aclarar, ni por primera ni por última vez, según parece: “Este no es un léxico actual. Si estuviera haciendo un diccionario actual del español de Chile, sería otra cosa. Si estuviera haciendo un diccionario de neologismos o del léxico de un grupo, sería otra cosa. Hay muchos tipos posibles de diccionarios: en el mío no puedo poner todo y no sirve para todas las finalidades. ¿Y por qué lo hice con muestras de 26 años? Porque estás buscando el núcleo, y para encontrar el núcleo tienes que buscar lo que es estable, lo que se mantiene en el tiempo”.

Comenta

Por favor, inicia sesión en La Tercera para acceder a los comentarios.