Otras dificultades


No todas las palabras están separadas por espacios, sino que hay algunas que están separadas por guiones. También se da el caso, en ciertos idiomas como el chino mandarín, el japonés o el tailandés de que las palabras no están separadas entre sí.


Otra dificultad a la hora de procesar el lenguaje natural proviene del uso de símbolos de acentuación singulares de cada lenguaje. La omisión de una tilde por error podría cambiar el significado de una frase por completo.


Además, hay que tener en cuenta la inclusión de números o caracteres especiales en el texto, así como el uso de mayúsculas o minúsculas, que podrían cambiar el significado de una palabra. Por ejemplo, no sería lo mismo buscar por "rosa" que por "Rosa". La mayoría de los buscadores web no realizan esta distinción.


Finalmente, hay que destacar que el contexto y el trasfondo de las frases son muy importantes para la comunicación mediante lenguaje natural. Por ejemplo, si en el curso anterior no se hubiese impartido la asignatura de "Recuperación y acceso a la información", y un alumno preguntase hoy acerca de cuántos alumnos la cursaron, la respuesta "Ninguno" es peor que la respuesta "El año pasado no se impartió esa asignatura". Se puede intuir ya que el procesamiento del lenguaje natural no es una tarea trivial en el campo de la recuperación de información.