martes, 24 de junio de 2025

 

SEGMENTACIÓN DE FRASES EN PALABRAS

LA PALABRA CONECTADA


Las palabras, en su forma oral, no se perciben de manera aislada. Esto nos lleva a cuestionar: si no escuchamos las palabras como unidades independientes, ¿qué percibimos exactamente al hablar o escuchar?
Para comprender este fenómeno, realizaremos un ejercicio práctico. Observa el Cuadro 7, que contiene un fragmento del poema "A Margarita Debayle" del escritor modernista nicaragüense Rubén Darío (1867-1916). En lugar de leerlo de la manera habitual, léelo en voz alta, haciendo una pausa de medio segundo entre cada palabra. Presta atención al resultado.

Cuadro 7

Margarita está linda la mar,
y el viento,
lleva esencia sutil de azahar;
yo siento
en el alma una alondra cantar;
tu acento:
Margarita, te voy a contar
un cuento:
Esto era un rey que tenía
un palacio de diamantes,
una tienda hecha de día
y un rebaño de elefantes,
un kiosko de malaquita,
un gran manto de tisú,

Si realizaste el ejercicio con atención, habrás notado que esta forma de lectura distorsiona la belleza y naturalidad del texto. Nadie se comunica de esta manera; las palabras se entrelazan en un continuo sonoro, sin pausas que las separen como unidades individuales. Desde una perspectiva acústica, las palabras rara vez se perciben como elementos discretos.

Para ilustrar aún más este fenómeno, considera una conversación en un idioma poco familiar para los hispanohablantes, como el shona. Esta lengua bantú, hablada principalmente en Zimbabue y el sur de Zambia por unos diez o quince millones de personas (Eberhard, Simons & Fennig, 2025), utiliza el alfabeto latino con modificaciones específicas para sus sonidos distintivos. Su escasa presencia en los medios de comunicación y contextos culturales hispanos la hace particularmente ajena a los hispanohablantes. Intenta escuchar una grabación en shona: ¿puedes distinguir y contar las palabras individuales? Probablemente te resultará muy complejo, ya que, en la comunicación oral, las palabras están más asociadas al significado que transmiten que a los límites sonoros que las separan, lo que dificulta su segmentación auditiva (Cutler, 2012).

No obstante, al examinar el texto escrito en el Cuadro 8, se identifica fácilmente que contiene 32 palabras en shona. Esto se debe a que, en la mayoría de las lenguas con escritura alfabética, las palabras están delimitadas por espacios, una convención gráfica que facilita su reconocimiento visual. Sin embargo, en lenguas con escritura continua (scriptio continua), como el tailandés, el lao y el jemer, las palabras se escriben sin espacios. En estos casos, su segmentación depende del contexto lingüístico y del conocimiento del lector (Winskel & Padakannaya, 2014). Por ejemplo, al traducir el texto del Cuadro 8 al tailandés, como se muestra en el Cuadro 9, las 40 palabras que lo componen no son inmediatamente distinguibles debido a la ausencia de espacios. Esto se asemeja a la continuidad del lenguaje oral, donde los límites entre palabras no están marcados por pausas (Norris & McQueen, 2008).

Esta analogía entre la escritura continua y la oralidad subraya cómo las convenciones gráficas influyen en la percepción lingüística. En contraste, en el lenguaje oral, las palabras rara vez se separan mediante silencios, como demuestran los estudios sobre segmentación del habla (Christophe, 2015; Norris & McQueen, 2008). Esta discrepancia entre oralidad y escritura resalta la importancia de las convenciones ortográficas artificiales en la comprensión lingüística.


Cuadro 8

Mhuri yangu inogara mumusha wakadini zvake. Tinorima minda yedu uye tinopfuya zvipfuyo zvakaita semombe nehuku. Pazuva rega rega, ndinofamba ndichienda kuchikoro chiri kure, asi ndinofarira kudzidza nokuti ndinoda kuva chiremba mune ramangwana.


Cuadro 9

ครอบครัวของฉันอาศัยอยู่ในหมู่บ้านเล็กๆเราเพาะปลูกในนาของเราและเลี้ยงสัตว์เช่นวัวและไก่ทุกวันฉันเดินไปโรงเรียนที่อยู่ไกลแต่ฉันชอบเรียนเพราะฉันอยากเป็นหมอในอนาคต

(Transcripción aproximada: Khrôp-khrua khŏng phŏm à-sài yù nai mù-bàn lêk-lêk. Rao phôet-plùk nai ná khŏng rao láe lîang sàt chên wua láe kài. Thúk-wan phŏm doem pài roeng-riang thîi yù klai tàe phŏm chôp riang phrô phŏm yàak pèn mŏ nai à-ná-khót.)

(Traducción: Mi familia vive en un pueblo pequeño. Nosotros cultivamos en nuestros campos y criamos animales como vacas y gallinas. Cada día, yo camino a la escuela que está lejos, pero me gusta estudiar porque quiero ser médico en el futuro.)


Referencias

  • Christophe, A. (2015). Prosodic cues in speech segmentation. In The Oxford Handbook of Language Acquisition (pp. 347-362). Oxford University Press.
  • Cutler, A. (2012). Native Listening: Language Experience and the Recognition of Spoken Words. MIT Press.
  • Eberhard, D. M., Simons, G. F., & Fennig, C. D. (Eds.). (2025). Ethnologue: Languages of the World (28th ed.). SIL International.
  • Norris, D., & McQueen, J. M. (2008). Shortlist B: A Bayesian model of continuous speech recognition. Psychological Review, 115(2), 357-395.
  • Winskel, H., & Padakannaya, P. (2014). Reading and writing in Thai and other syllabic scripts. In Handbook of Orthography and Literacy (pp. 351-366). Routledge.

No hay comentarios:

Publicar un comentario