Oficina de Vinculación

Científicos del INAOE ganan concurso con proyecto de lingüística forense

 

Santa María Tonantzintla, Puebla, a 27 de noviembre.- El Laboratorio de Lingüística Forense de la Universidad Pompeu Fabra de Barcelona, España, otorgó un premio al equipo integrado por los doctores Manuel Montes, Luis Villaseñor y Hugo Escalante, investigadores del Instituto Nacional de Astrofísica, Óptica y Electrónica, y por Adrián Pastor López Monroy, estudiante de doctorado del Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE), por un proyecto de inteligencia artificial para determinar el perfil de los usuarios de una red social.

Lo anterior, en el marco de la CLEF 2013 (Conference and Labs of the Evaluation Forum) que se realizó en Valencia hace algunas semanas. El premio otorgado por la Universidad Pompeu Fabra es en memoria de la Dra. M. Teresa Turell i Julia, fundadora y directora de su Laboratorio de Lingüística Forense.

En breve entrevista, el Dr. Manuel Montes y Gómez comentó que este Laboratorio, fundado en 2002, se dedica a la investigación y al desarrollo de métodos que manipulen el lenguaje humano en su forma escrita u oral para distintas aplicaciones, como sistemas de resúmenes automáticos y de búsqueda de información Google es un ejemplo de ello y aplicaciones forenses como el profiling: "En el Laboratorio trabajamos cuatro investigadores: Luis Villaseñor, Aurelio López, Hugo Escalante y yo; y con el paso de los años hemos graduado a 11 doctores y alrededor de 20 estudiantes de maestría. Ahora, Adrián Pastor, uno de nuestros estudiantes de doctorado, recibió el reconocimiento. Entre 2004 y 2008 el Laboratorio trabajó arduamente en el desarrollo de sistemas de información que dan respuesta a preguntas muy puntuales de los usuarios, distinto a lo que hace Google, y desde hace tres años sus miembros se han dedicado a resolver problemas de clasificación no temática".  

La idea aclaró el investigador de la Coordinación de Ciencias Computacionales del INAOE es clasificar documentos no por su tema, sino por su estilo. "Con esto podemos saber el sexo del autor o podemos construir los perfiles de los usuarios de una red social. Un trabajo que hicimos hace un año en colaboración con la UAM fue la detección de acosadores sexuales en chats y nuestro sistema ganó en una competencia internacional porque arrojó los mejores resultados a la hora de detectar posibles pederastas en redes sociales. Fue una tarea motivadora e interesante porque busca resolver un problema de gran relevancia social al detectar de forma temprana a este tipo de personas. De ese caso particular nos movimos con Adrián Pastor a trabajar en algo más general que se conoce como la creación de perfiles de usuarios. La idea es determinar a partir de lo que escribe una persona en la red su edad, sexo, nacionalidad, e incluso nivel de estudios. Nosotros lo trabajamos en Twitter. Esto es importante para detectar personas que pueden tener malas intenciones o incluso puede ayudar a las empresas para efectos de publicidad".

También se puede utilizar para filtrar opiniones en el monitoreo de campañas políticas. A su vez, Adrián Pastor López Monroy, explicó que el Premio que se recibió en septiembre fue en el marco de una conferencia donde participan universidades de todo el mundo: "En esta competencia se da una tarea que consiste en determinar, dado un conjunto de datos de usuarios, si son hombres o mujeres, y su rango de edad, que iba de los 10 a 17, los 20s y de 30 y mayores. Se hace procesamiento de texto, se limpian documentos y se extraen las características textuales que se pueden utilizar como atributos que después son reconocidos como patrones por un algoritmo de computación. Estas características son principalmente de estilo. Por ejemplo, el uso de pronombres personales y preposiciones, la riqueza del vocabulario y la longitud, complejidad y construcción sintáctica de las oraciones delatan a las personas. Lo primero fue definir algunas características que podían ser útiles, y luego hacer métodos de cómo medirlas y después usamos algunos métodos probabilistas basados en el Teorema de Bayes, que calculaban un valor para decir de qué tipo era una persona. También detectamos el uso del lenguaje más nuevo, como el slang o los emoticones que usan los más jóvenes, como LOL".

Por su parte, el Dr. Hugo Jair Escalante comentó: "En esta competencia hay expertos en la temática de plagio y atribución de autoría. Ellos formulan un problema, en este caso fue identificación de perfiles, y reúnen datos, lo cual se hizo con una empresa que se dedica realizar este tipo de cosas. Esa información la publican en la red libremente y cualquier persona en el mundo que esté interesada puede participar para resolver el problema. Uno sube el software y ellos lo evalúan. En este caso se inscribieron más de 60 equipos y sólo 20 completaron el reto. Los equipos finalistas escriben un artículo y lo presentan en la conferencia, donde se discuten los distintos métodos utilizados para resolver el problema planteado originalmente. Finalmente, el Dr. Hugo Jair Escalante añadió que el Laboratorio de Tecnologías del INAOE también tiene algunos proyectos con la industria: Incluso un estudiante en años pasados ganó un concurso de la empresa Telefónica y fundó su propia compañía a raíz de un proyecto para el análisis de emociones en voz".

Última actualización:
08-09-2021 a las 19:11 por

 

Adress: Luis Enrique Erro # 1, Tonantzintla, Puebla, Mexico / Postcode 72840 / Tel: (222) 266.31.00 / Contact: difusion@inaoep.mx


This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.5 Mexico License.

Creative Commons License