Truffle Pig: Knwl.JS Finds Data Snippets Automatically

Truffle Pig: Knwl.JS encuentra fragmentos de datos automáticamente

¿Qué pasa si la información importante, como la hora o la ubicación, las direcciones de correo electrónico, los números de teléfono, los enlaces y otros fragmentos de datos, están ocultos en texto sin formato? Si desea extraer estos valiosos fragmentos, sería necesario mucho trabajo manual. Esperar. Ya no. La biblioteca de JavaScript Knwl.JS puede encontrar automáticamente esta información, filtrarla y ponerla a disposición para su uso posterior. Con un poco de creatividad, son posibles soluciones muy flexibles. El uso no es complicado, así que vamos a darle una vuelta.

Knwl.JS: complementos para el reconocimiento de diferentes contenidos

Para empezar, Knwl.js primero debe implementarse en el encabezado HTML. Luego, puede buscar cualquier pasaje de texto para contenido particular. Para ello, el texto se asigna al método. KnwlInstance.init() ya sea directamente o como una variable. Luego, debe elegir un complemento que busque en el texto ciertos patrones. Uno de los complementos es date que busca, bueno, información de fechas.

KnwlInstant.init("Today is December 23rd 2015.");
var output = KnwlInstance.get("date");

En este ejemplo, el complemento date se accede a través de KnwlInstance.get(). Examina la cadena de caracteres transferida previamente, busca información de fecha y devuelve todos los resultados en formato JSON.

var output = [
  {
    "year": 2015,
    "month": 12,
    "day": 23,
    "preview": "Today is December 23rd 2015.","found": 2
  }
]

La cadena de caracteres JSON contiene diferentes valores según el complemento. Al buscar una fecha, el año, el mes y el día se devuelven de forma detallada. Además, la sentencia en la que se encontró el valor respectivo se transfiere a través de preview por todos los complementos. Vía found extraerá la información en qué lugar del texto se encontró la información.

Truffle Pig: Knwl.JS encuentra fragmentos de datos automáticamente

Cuando se encuentra más información, Knwl.js la muestra como objetos JSON individuales.

Información de fecha, hora y ubicación solo en inglés

Knwl.js solo reconoce la información de fecha y hora cuando esta información está disponible en inglés. Al menos por ahora, no se admiten otros idiomas. Lo mismo se aplica para el place complemento, que reconoce nombres de países en textos.

var output = [
  {
    "place": "Germany",
    "preview": "This is Germany.","found": 2
  }
]

Reconocer números de teléfono en diferentes idiomas plantea un problema igualmente difícil. Aquí, solo se admite la ortografía en inglés.

Enlaces y direcciones de correo electrónico posibles en cualquier idioma

Aunque solo se admite el idioma inglés, aún es posible usar Kwnl.js en textos en otros idiomas, al menos en lo que respecta a enlaces y direcciones de correo electrónico.

var output = [
  {
    "link": "http://www.drweb.de/",
    "preview": "At the German site http://www.drweb.de/ you can find daily news.","found": 1
  }
]

Al buscar enlaces es importante que se proporcione el protocolo respectivo: „HTTP://“, „HTTPS://“ o „FTP://“. Las direcciones de correo electrónico también se reconocen de forma fiable.

Desarrolle su complemento

Cuando desee respaldar el reconocimiento de la información de hora y ubicación en otros idiomas, deberá ensuciarse las manos y desarrollar un complemento personalizado para Knwl.js. En la documentación de la biblioteca, hay una sección adicional sobre ese tema. Cada complemento se deposita como su propio archivo JavaScript.

De esta manera, puede crear complementos con relativa rapidez. Por supuesto, no solo es posible admitir otros idiomas. También puede desarrollar complementos que, por ejemplo, busquen unidades métricas, monedas o colores en un texto.

Se pueden encontrar algunos complementos experimentales junto con la documentación de Knwl.js.

Conclusión

Knwl.js ofrece muchas formas de filtrar datos estructurados de textos. Si bien es necesario realizar ajustes al intentar usarlo en textos en otros idiomas además del inglés, le permite crear soluciones flexibles cuando lo aborda con un poco de fantasía.

knwljs2
Demostración para probarlo

Además de la documentación, también hay una demostración en la que puede ingresar cualquier texto deseado y hacer que Knwl.js lo explore.

(dpe)

#Truffle #Pig #KnwlJS #encuentra #fragmentos #datos #automáticamente

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *