Combinados con información sobre cada barrio, los investigadores pudieron determinar con un 70% de eficacia qué zonas de la ciudad sufrirían actos criminales el mes siguiente Artículo en EL PAIS. ¿Cuánto daría un buen alcalde o su jefe de policía por saber en qué barrio de la ciudad se va a producir un crimen? Pues un grupo de investigadores sólo ha necesitado un perfil sociodemográfico de la zona y la actividad de sus antenas de móviles para predecir, con hasta un 70% de grado de acierto, en qué zona se cometerá un robo o un asesinato en las calles de Londres. Todo un ejemplo de que el Big Data también sirve para el bien común. En los últimos años se creado un gran negocio alrededor de la predicción del crimen. Apoyadas en las estadísticas policiales, empresas como IBM han desarrollado herramientas de análisis predictivo que dan pistas de dónde se va a cometer un asalto o el robo de un coche. Ya son muchas las policías, en especial en Estados Unidos, que usan estos complejos y caros sistemas de minería de datos. Pero, ¿Hay alguna forma más económica, asequible y eficaz de mejorar sus predicciones? Sí, con los datos de los móviles y sin saber nada de la identidad de sus usuarios, sólo con la actividad recogida en las antenas de telefonía móvil. Durante la Campus Party de 2013 celebrada en Londres, el Instituto Tecnológico de Massachussets (MIT), el británico Instituto de Datos Abiertos y Telefónica retaron a varios equipos de investigadores a sacarle el mayor jugo posible a grandes cantidades de datos. Una de esas bases de datos es Smart Steps, un producto de la operadora española (por ahora sólo disponible en Reino Unido), que usa los datos móviles de red anónimos y agregados para calcular cuánta gente hay en una zona determinada. “Usando los datos conocidos del barrio [variables como su demografía, su perfil étnico, clase social, tipo de casas...] se puede predecir en un 62% si habrá un crimen, con Smart Steps, el porcentaje se eleva hasta el 68% y combinado ambos tipos de datos aún más”, asegura la directora científica de Telefónica Research y coautora de un estudio sobre la predicción del crimen en Londres, Nuria Oliver. Con Smart Steps, de Telefónica, se registra la actividad de los móviles de forma anonimizada y agregada sobre una zona determinada. TELEFÓNICA RESEARCH. Los investigadores dividieron Londres en 124.119 cuadrículas. Con los datos del Open Data Institute pudieron hacer un perfil exacto de cada celda con 68 variables, desde su historial de crímenes hasta el el tiempo, pasando por el régimen de propiedad típico de los inmuebles de la zona. Y, sobre esa capa, añadieron los datos del tráfico recogido durante tres semanas por las antenas de telefonía móvil de O2 (la filial de Telefónica en el Reino Unido) previamente anonimizados y agregados. A pesar de esta salvaguarda de la privacidad, los investigadores pudieron hacer una estimación de la edad, sexo y si el tráfico procedía de los móviles de residentes del barrio, trabajadores o personas que iban de paso. “Para cada localización, computamos una respuesta a la variable alta criminalidad-baja criminalidad basada en la base de datos con los casos criminales geolocalizados facilitada por la policía de Londres, explica el investigador de la Universidad de Trento (Italia) y principal autor de la investigación publicada en Arxiv, Andrey Bogomolov. Por desgracia y por razones de privacidad, las autoridades habían eliminado de los registros la fecha exacta en que se había producido cada crimen y sólo estaban catalogados por meses. Por eso, su modelo sólo era capaz de señalar qué cuadrícula en la que habían dividido el Gran Londres había caería en la categoría alta criminalidad (o baja) en el siguiente mes. Aún así el mapa generado gracias a sus algoritmos coincidía casi en un 70% con la distribución geográfica de los crímenes en el mes estudiado. “Creo que, con los datos diarios, las métricas de predicción serían mucho mejores”, asegura Bogomolov. Y dice aún más. Aunque no era el objetivo de su estudio, con los datos inferidos del tráfico de los móviles, hay crímenes que se pueden predecir mejor que otros. “Desafortunadamente, no teníamos todos los datos sobre los crímenes durante el tiempo que duró el reto”, reconoce el investigador. Sin embargo, ya sí los tienen y están trabajando en la publicación de sus resultados, que presentarán en el congreso ICMI 2014. “La gran ventaja de los datos móviles es que se pueden hacer estimaciones casi en tiempo real”, recuerda la investigadora española. A diferencia de las estadísticas oficiales, de los censos, que se elaboran y publican en lapsos de tiempo muy grandes, la información ofrecida por las redes de telefonía móvil está disponible al instante. Además, inferir la conducta humana de este tipo de datos es más barato que hacerlo desde las herramientas que usan el Big Data para hacer análisis predictivo. Productos como el SPSS de IBM necesitan un mar de datos de todo tipo, un gran centro de datos para almacenarlos y muchos ingenieros para analizarlos. ”Somos los primeros que ha resuelto este problema del Big Data con los datos de telecomunicaciones, que son muy accesibles y baratos de recoger. Redes GSM hay en todas la megápolis del mundo”, recuerda Bogomolov. Referencia a la misma investigación publicado en: EL MUNDO Entre la selva que supone para muchas empresas el big data, hay quien sabe extraer el mineral más precioso: la información. Es el caso de Telefónica, cuyo departamento de I+D en Barcelona -concretamente su directora científica, Nuria Oliver- ha colaborado en el proyecto Crime Hot Spots junto a Alex Pentland, del MIT, y un equipo de la italiana Fondazione Bruno Kessler (FBK) para lograr un modelo de predicción de crimen mejor al existente hoy en día gracias a la utilización de datos móviles. La prueba se hizo en la ciudad de Londres y para ello contaron con expertos en data science, big data analytics, inteligencia artificial y machine learning pero también, claro, con datos aportados por el Open Data Institute británico, que compartía The London boroughs profile datasets, datos del censo de cada vecindario. «Éste da mucha información del volumen de inmigrantes, amas de casa o personas en paro, entre otros», resume Oliver, quien explica que además el instituto compartía otro dataset de la policía donde decía el nivel de criminalidad que había habido en los últimos tiempos. Con esos datos, el grupo logró superar una primera barrera: «Logramos un primer reto que era ver si usando sólo los datos del censo era posible predecir para zonas concretas si iba a haber crímenes o no, y conseguimos una predicción del 62%». Sin embargo, la telefonía tiene mucho que decir para afinar los resultados. «Usando los datos de la dinámica de la ciudad basados en la actividad de las torres celulares, obtuvimos más precisión». Concretamente, consiguieron cerca de un 70% de acierto. Han logrado un 70% de acierto gracias al minado de datos para la ciudad de Londres Y eso a pesar de que, como reconoce Oliver, «el censo es mucho más detallado porque tiene muchas variables pero se calcula cada cinco o diez años porque es muy caro». Telefónica participó en Crime Hot Spots y ha podido comprobar cómo «la dinámica de la ciudad que muestran las antenas, que reflejan la actividad, es muy importante para determinar si una zona tendrá violencia o crímenes». Se trata de una primera aproximación a la predicción del crimen gracias al urban computing con unos resultados que podrían interesar a los gobiernos y las fuerzas de seguridad. «Con estos datos, pueden tomar mejores decisiones», considera la directora científica de Telefónica I+D Barcelona. Sin embargo, Oliver declina comparar su sistema de minado de datos con lo que reflejaba una ficción como la de la película Minority Report. «Eso queda bien en el titular de una noticia pero el trabajo no tiene nada que ver», asegura. Y sigue: «Antes, había muchas teorías centradas en la persona, intentar predecir si por su perfil un individuo puede cometer un crimen, que es lo que sucede en la película. Pero ahora se ha transicionado a modelos centrados en el lugar, que intentan predecir si en una zona de la urbe va a haber crímenes o no». Oliver insiste en el realismo, también, al reflexionar sobre las limitaciones del modelo. Cada ciudad o país es diferente así que ahora querrían comprobar si estos resultados se pueden replicar en otros lugares. «Por ahora no podemos hacer muchas generalizaciones como si fuera un modelo universal, es importante validar el modelo en otras geografías para ver qué características son culturales, por ejemplo». También sería bueno afinar más en qué se considera criminalidad -ahora barajan dos opciones: que haya o que no, pero no se distingue por delitos- o horas del día más propicias para el crimen. En cualquier caso, ése momento se acerca. « datos que parecen burdos pueden aportar mucho valor. Y encima son anónimos», remarca Oliver. Descargar PAPER. Andrey Bogomolov , Bruno Lepri , Jacopo Staiano , Nuria Oliver , Fabio Pianesi , Alex Pentland (2014) "Once Upon a Crime: Towards Crime Prediction from Demographics and Mobile Data" WEB NURIA OLIVER
0 Comentarios
|
José Manuel Rábade RocaPh.D. Ciudadano crítico. Trabajando e investigando en seguridad, pero ante todo abierto al cambio. Archivos
Noviembre 2023
|