Más

    Video Breakdown, el servicio de vídeo de Microsoft Garage que demuestra el poder de Azure

    Los empleados de Microsoft nos siguen sorprendiendo con sus proyectos durante su tiempo libre. En este caso, Microsoft Garage nos presenta Video Breakdown, una herramienta de subida, búsqueda y reproducción de vídeo que utiliza todo el potencial de Azure. Por si en los últimos años no había quedado patente la evolución de los servicios en la nube de Microsoft, este artículo sorprenderá a todos aquellos que piensan que Azure no es más que un proveedor de servidores con muchas opciones.

    Cuando subimos a YouTube, el servicio simplemente se encarga de procesarlo para su posterior publicación. Video Breakdown, tras la subida del vídeo, inicia una serie de procesos y análisis sobre el archivo que tienen como consecuencia una búsqueda más contextualizada del contenido. Es decir, al buscar un vídeo en el servicio de Microsoft Garage, no solo utilizará el título y la descripción del clip para mostrarnos los resultados.

    Resultados de búsqueda

    Microsoft Cognitive Services, un gran potencial por explotar

    Microsoft viene haciendo gala en muchos de sus ejemplos de los Cognitive Services, algunos de los cuales se hicieron virales. Muchos recordaréis, por ejemplo, la web how-old.net, que intentaba adivinar la edad de las personas que se encontraban en una fotografía. Todo hay que decirlo, con más o menos acierto en función de la imagen, pero sirvió como prueba piloto para que los de Redmond pudiesen mejorar estas herramientas.

    Video Breakdown ejecuta una serie de análisis sobre el vídeo que va desde los Microsoft Cognitive Services hasta Azure Media Analytics, pasando por una gran multitud de otros servicios que también se encuentran en la nube: Azure Websites, Azure Blob Storage, Azure Search y Azure Media Services. El proceso produce una transcripción de audio; una identificación, agrupación y seguimiento de los hablantes; reconocimiento óptico de caracteres; y la extracción de temas y sentimientos.

    Transcripción del vídeo

    Como resultado, al buscar un vídeo, no solo tendremos resultados basados en el título, la descripción o los metadatos; sino que también aquellos en los que la palabra buscada era mencionada de forma hablada o escrita en el clip, por la vestimenta de las personas que aparecen en el vídeo, por los sentimientos mostrados… En definitiva, las características clave de Video Breakdown son:

    • Transcripción lingüística. Convierte el audio en texto basándose modelos acústicos del lenguaje.
    • Detección de caras. Encuentra cuando aparece cada personaje en el vídeo.
    • Reconocimiento del hablante. Distingue entre las voces de cada persona.
    • OCR. Extrae texto que aparece en el vídeo como capas, diapositivas o fondos.
    • Identificación de caras. Asocia cada cara con una persona.
    • Detección de actividad de voz. Distingue el ruido de fondo de la voz.
    • Búsqueda contextual. Entiende el contexto de los resultados de búsqueda.
    • Análisis de sentimientos. Entiende el nivel de positividad o negatividad de lo hablado o escrito.

    Aunque la herramienta está disponible en inglés, os animamos a probarla para que descubráis el potencial que tienen todas estas herramientas de Azure. El inicio de sesión es realmente sencillo y se realiza con vuestra cuenta de Microsoft, Google, Facebook o LinkedIn. Podéis acceder al servicio desde la web videobreakdown.com.

    Comentarios

    En directo: Picacódigo

    Te puede interesar

    Picacódigo

    Mas leídas

    Otros temas de interés