Cómo la IA de Microsoft me convenció de cambiarme a Edge, y dónde el navegador aún se queda corto – GeekWire

El navegador Edge de Microsoft viene con una función integrada de «Leer en voz alta». (Ilustración GeekWire)

Finalmente me derrumbé y cambié al navegador Edge de Microsoft esta semana en mi PC con Windows, después de muchos años de usar Google Chrome.

No, no fueron las incesantes y molestas indicaciones en Windows 11, instándome a hacer de Edge mi opción predeterminada, aunque las molestias mantuvieron el navegador de Microsoft en mente.

Para mí, el punto de inflexión fue la función «Leer en voz alta» integrada de Edge, y lo que a mis oídos suenan como grandes avances en alguno de las voces sintetizadas de Microsoft, hasta el punto de que son casi indistinguibles de los narradores humanos.

Durante mucho tiempo he sido fanático de la conversión de texto a voz para escuchar artículos y correos electrónicos extensos.

  • Combinado con auriculares o auriculares inalámbricos, es una excelente manera de levantarse de su escritorio y hacer otra cosa (limpiar la habitación, estirarse, cepillarse los dientes, etc.), mientras se lee el texto.
  • Cuando escribo o edito, el paso adicional de escuchar el audio me ayuda a detectar palabras faltantes o errantes, o a notar oraciones incómodas que de otro modo podría perderme.
  • En un mundo de distracciones, seguir el texto mientras se lee es una forma de mejorar el enfoque.

He usado varias aplicaciones y complementos de navegador a lo largo de los años, algunos de ellos más fluidos que otros.

  • Pocket es una buena herramienta para guardar historias de la web para escucharlas en un teléfono, pero descubrí que también había muchos casos en los que quería escucharlas directamente desde el navegador de mi computadora.
  • Hay un montón de extensiones de navegador de texto a voz, pero he encontrado que las experiencias son algo inconexas. Me gusta la extensión del navegador «Leer en voz alta» para Chrome, Edge y Firefox, por ejemplo, pero puedes controlarla e interactuar con ella usando una versión alternativa del texto que aparece en la barra de herramientas, no el texto nativo en una página web.

La función «Leer en voz alta» de Microsoft Edge se puede controlar directamente desde una página web, después de activarla desde un menú accesible bajo los tres puntos en la parte superior derecha del marco del navegador, o haciendo clic con el botón derecho en el texto.

A medida que se lee, puede hacer clic en el texto real de la página para ir a una sección en particular.

Al igual que con la mayoría de las tecnologías automatizadas de conversión de texto a voz, a veces tiene que soportar algunas molestias menores, como la voz que lee la letra pequeña, los elementos del menú o los descargos de responsabilidad en un sitio. La capacidad de seleccionar el texto que se va a leer, o saltar haciendo clic en el texto, ayuda a superar eso cuando se escucha a través del navegador.

Mejora significativa en la calidad de la voz: Pero lo que más me llamó la atención es la creciente autenticidad de algunas de las voces de Microsoft: las inflexiones, las pausas, la falta de la reveladora voz robótica. Por ejemplo, aquí está «Microsoft Michelle Online (Natural)» leyendo este párrafo.

no es perfecto La IA todavía puede sonar brevemente robótica. Los nombres inusuales también pueden causar problemas. Leyendo esta historia hoy sobre Geocaching por mi colega Kurt Schlosser, por ejemplo, «Michelle» lo pronuncia «Geo-coshing».

Aún así, la calidad es mucho mejor que las voces de drones que hicieron que mis amigos y colegas se burlaran de mis intentos de usar herramientas de texto a voz en el pasado.

Las funciones de Microsoft Edge para importar datos y contraseñas, estándar en los navegadores en estos días, hicieron que el cambio fuera relativamente fácil. El uso de Edge de Chromium, el motor de código abierto subyacente que impulsa a Chrome, también ayudó a facilitar la transición. Edge debutó en 2015 y la compañía retiró oficialmente Internet Explorer este año.

Beneficios y errores de la sincronización móvil: La función también está disponible en el navegador Edge para teléfonos inteligentes y funciona bien allí. Puede acceder a «leer en voz alta» haciendo clic en los tres puntos en la parte inferior de la aplicación móvil Edge.

Pero esto también muestra dónde se está quedando corto Microsoft. Se supone que la función «Colecciones» de Edge para guardar páginas web se sincroniza entre PC y dispositivos móviles cuando se inicia sesión a través de una cuenta de Microsoft. Configuré una colección «Leer más tarde» donde, en teoría, puedo guardar artículos en el navegador de mi PC para que la IA los lea en voz alta más tarde en la aplicación Edge de mi teléfono Android.

Los artículos se guardan en el navegador de mi PC, pero mis Edge Collections no se sincronizan con mi teléfono. Revisé todas las configuraciones, pasé por todos los pasos de solución de problemas, sin suerte. Todos mis otros datos se están sincronizando. Esto también parece ser un problema para muchos otros.

Seguiré tratando de encontrar una solución y actualizaré esta historia si lo hago. Incluso si se trata de un caso de error del usuario, no debería ser tan difícil.

Amazon Alexa y audiolibros: Este es probablemente un tema para otra publicación, pero también soy un fanático de la función de Amazon Alexa para leer libros Kindle en dispositivos Echo, pero la implementación en mi experiencia es menos que ideal, olvidando con frecuencia dónde estabas cuando dejó de leer Alexa para ti.

Será fascinante ver el impacto que la creciente autenticidad de las voces sintéticas tiene en la subsidiaria de audiolibros Audible de Amazon en los próximos años.

Mientras tanto, si alguien tiene comentarios, ideas o enfoques diferentes para aprovechar al máximo la tecnología de texto a voz en su trabajo diario, hágamelo saber a través de GorjeoLinkedIn o mi dirección de correo electrónico a continuación.

Deja un comentario