What is this? From this page you can use the Social Web links to save Pensando radicalmente sobre datos no estructurados: Entrevista con Ron Carrière, director ejecutivo de Cirilab to a social bookmarking site, or the E-mail form to send a link via e-mail.

Social Web

E-mail

E-mail It
Noviembre 02, 2011

Pensando radicalmente sobre datos no estructurados: Entrevista con Ron Carrière, director ejecutivo de Cirilab

Posted in: TI, BI

Poder manipular textos sin estructura no es mas una opción que “sería bueno tener”,  en la medida en que las empresas e individuos deben trabajar con cantidades crecientes de texto no-estructurado y adquirir conocimiento por su interpretación. Cirilab es una empresa que provee productos de software para buscar, categorizar y obtener conocimiento de diversas fuentes de información que contienen texto sin estructura. Lea esta interesante entrevista con Ron Carrière, director ejecutivo de Cirilab, y sus opiniones respecto al rol de Cirilab en la industria del software, además de la perspectiva de la empresa en cuanto al área de la gestión de contenidos no-estructurados.
Le doy la bienvenida a sus comentarios y responderé en cuanto me sea posible.
ron_carrierecirilab120.png

Ron Carrière, director ejecutivo, Cirilab

La carrera del señor Carrière incluye responsabilidades como ingeniero en posiciones ejecutivas tanto a nivel técnico como administrativo para organizaciones públicas y privadas. Cuenta con gran experiencia en el lanzamiento de empresas de alta tecnología. Fue director ejecutivo fundador de ACDS Graphic Systems Inc. de 1983 hasta 1988, donde lideró una oferta pública inicial y  llevó a ACDS Software a lograr ingresos superiores a los $20 millones de dólares, antes de convertirse en una empresa pública. En 1990, fundó Nucor  Hyper Technologies Inc. y en 1995 Le Centre International de Recherche en Infographie siendo además presidente de ambas organizaciones. En 2001, fue uno de los cofundadores de Cirilab Inc., donde tenía el rol de presidente y director ejecutivo.

Buenos días señor Carrière. ¿Podría contarnos sobre su experiencia en el trabajo con datos no estructurados?

Trabajando como ingeniero geodesta desde 1973 hasta 1978, participé en la conversión de una plataforma de navegación inercial (para un misil de crucero) hacia una plataforma de reconocimiento por inercia, una gran máquina de interpretación de de datos en tiempo real.

Desde 1978 hasta 1983, trabaje con un proveedor de servicios de Internet (ISP, por sus siglas en inglés) y un sistema de posicionamiento global (GPS) para la primera firma privada en utilizar un sistema CPS, recuperando cantidades masivas de datos para determinar la posición exacta de un objeto.

De 1983 a 1989, fui el director ejecutivo de una empresa de sistemas de información geográfica (GIS) y diseño asistido por computador (CAD), donde teníamos varios sistemas complejos de indexación involucrados, pero con un grupo de 70 programadores, resolví los principales problemas de la gestión de datos para los clientes en servicios públicos y gobierno.

De 1990 a 1997, trabajé en el procesamiento de imágenes satelitales y reconocimiento de patrones por sonar de masivos datos no estructurados que contienen inteligencia.  Fui capaz de hallar esa inteligencia y crear un motor para inteligencia semántica (SI).

Luego reuní varios científicos de datos para crear nuestro motor de generación de conocimiento para aplicarlo a textos, la pieza mas subestimada de información desestructurada de todas nuestras bases de datos. Me asocié con Mark Hurst, el director tecnológico de Cirilab, quien tiene experiencia en ciencia e inteligencia artificial. Mark en la actualidad esta enfocado en el análisis de textos; modelado asociativo, contextual y analógico; análisis colaborativo; y organización y descubrimiento.

¿Cuál cree usted es el origen de la necesidad de la gestión y análisis de datos sin estructura?

A nivel de empresa (la gestión del riesgo) para la gobernabilidad y la creencia de que el análisis ayudará, a pesar del bajo retorno de la inversión y la asociación del análisis con grandes gastos.

Para el consumidor, allí descansa el “grano de oro del conocimiento”. La pregunta es, “¿cómo lo encuentro?” Después de su búsqueda, el cliente espera y merece encontrar información relevante.

¿Qué ofrece Cirilab a los clientes que necesitan gestionar datos sin estructura?

Tenemos una serie de productos (herramientas semánticas) y servicios que proveen los medios para “fuentes auto descriptivas”, un afirma de conocimiento (Knowledge signature, Ksig) de un documento, o un mapa de conocimiento (Knowledge map, Kmap) para varios documentos. Estas herramientas le permiten llegar a un nivel recoger “meta conocimientos”, y poder realizar gestión de conocimientos. Luego es posible utilizar ese meta conocimiento para alcanzar la “meta cognición” y crear una infraestructura inteligente. (No se preocupe, volveré a la realidad en las próximas preguntas.)

¿Cuál es la diferencia de enfoque entre sus productos para empresas y consumidores?

El enfoque para el consumidor es el de ahorrar tiempo, asistirle en la gestión de una base de conocimientos y llenar los vacios de conocimientos. Para las empresas, todo se reduce a beneficiarse de aquellos individuos utilizando el sistema. Hay un enfoque en el valor de una “memoria corporativa” obtenida del análisis de una base de conocimientos. El objetivo es poder utilizar los esfuerzos colaborativos (Kmap de entradas a blogs, chats, correos electrónicos, documentos, etc.) para facilitar el acceso a conocimientos en cuestión de minutos y poder luego guardar y compartir dicho conocimiento.

¿Cuál es la diferencia entre Cirilab y otras aplicaciones similares?

La principal diferencia es el enfoque en las herramientas SI -para un usuario individual y su retorno de la inversión, un tema muy apreciado para la mayoría de trabajadores del conocimiento (diferente de la gestión de información [IM] y tecnología de la información-  y en los datos sin estructura, el lugar donde cada documento puede auto expresarse. ¡El documento es un algoritmo!

¿Cuál es el problema mas común que estan tratando de resolver sus clientes cuando le buscan?

Ellos deben organizar y analizar grandes cantidades de datos en poco tiempo. Esto puede ser algo como 10 documentos de 100 páginas cada uno para mañana a primera hora, 108.000 chats para la próxima semana, o el perfil 1.500.000 documentos para una ronda de litigios. Con el modelo de software como servicio (SaaS), los clientes se registran, pero solo pagan cuando utilizan el sistema.

A comienzos de los años 90, apostamos, ganamos y entregamos la gestión de datos sin estructura y la ingeniería de grandes volúmenes.  Yo lideraba un arrollador grupo de científicos de datos para entregar ese proyecto con el 20% del presupuesto y el 25% del tiempo asignado. La solución y los ahorros se dieron por un índice multidimensional (del tipo de GIS) y de procesar solo el 10% de los datos, además de modelar todos los conocimientos basados en nuggets en una foto antena. Los resultados fueron mas que adecuados con grandes ahorros.

Las tendencias actuales en inteligencia empresarial (BI) y SI son similares, además de prometedoras con tantos datos que estamos produciendo hoy en día.

¿Cuál es su opinión en sobre lo que llamamos grandes datos? ¿Cómo cree que las organizaciones deben resolver el tema de la gestión de grandes cantidades de datos, especialmente cuando no tienen estructura?

Deberá ser un usuario, un archivo al tiempo, siendo los principales parámetros de diseño la “relevancia” y las “fechas límite”.  La claves para el índice semántico es la de identificar lo que puede ser útil en un futuro descubrimiento. Usted podrá satisfacer el 80% de las necesidades actuales con el 20% del costo, además tendrá aún la habilidad de desglosar la información para satisfacer mas detalles si decide procesar mas información.

Siempre habrá alguna discusión sobre cómo medir el retorno de la inversión de una aplicación, especialmente en el área de la gestión de datos. ¿Cuál es su opinión? ¿cuál es el valor real de una aplicación como la suya?

El ahorro en tiempo para lograr una decisión valiosa, tanto para el individuo como para la empresa. Una función tan simple como la lectura rápida resume 40 páginas en segundos y genera una ‘memoria corporativa’, una etiqueta de conocimiento de las cosas que estan sucediendo.

¿Cuál es su película favorita?

Star Trek. Creo que DATA tenia nuestro software en su cabeza.

¿Prefiere los gatos o los perros?

Teníamos un establo lleno de ambos en una finca que solía tener. ¡Pero amo a mis nietos!


Return to: Pensando radicalmente sobre datos no estructurados: Entrevista con Ron Carrière, director ejecutivo de Cirilab