En el mercado de aplicaciones afortunadamente cada vez existen más herramientas diseñadas para ayudarnos a explorar e interactuar con el mundo que nos rodea. Contamos desde opciones muy especializadas que suelen ser de pago como Cash Reader, de la cual les platiqué hace tiempo— hasta herramientas multifuncionales y completamente gratuitas, como es el caso de Seeing AI, la plataforma de la que hablaremos en esta ocasión.
Una reflexión constructiva: El valor de la autonomía
Recordando la entrada donde analizamos CashReader, un lector me dejó un comentario que me hizo reflexionar bastante. Decía algo como: ¿Por qué habríamos de pagar por una aplicación si existen herramientas que hacen lo mismo de manera gratuita? En ese momento me quedé pensando en tres puntos clave que me gustaría compartir con ustedes, no con el afán de polemizar, sino de poner sobre la mesa la realidad del desarrollo accesible:
- La libertad de elegir: Nadie está obligado a adquirir una aplicación de pago. El mercado es libre y cada plataforma debe verse simplemente como una alternativa más en nuestro catálogo de herramientas para construir autonomía. Entre más opciones tengamos, mejor.
- Apoyo a la especialización: Qué gran noticia es que cada vez más desarrolladores decidan emprender y crear soluciones enfocadas en resolver problemas reales de la comunidad con ceguera total o baja visión. Esto genera una competencia sana y nos brinda una mayor variedad de aplicaciones adaptadas a distintas necesidades.
- Incentivo para la innovación: Diseñar tecnología de asistencia requiere tiempo, esfuerzo y recursos. Si está dentro de nuestras posibilidades económicas, apoyar los proyectos de pago es una forma directa de motivar a los desarrolladores a seguir innovando y creando soluciones que nos brinden una mayor independencia.
Por supuesto, este es mi punto de vista personal y es completamente válido que no todos lo compartan. Sin embargo, considero fundamental aprovechar y respaldar a quienes dedican su talento a la inclusión digital, ya sea que hablemos de un desarrollador independiente o, como en este caso, de un gigante tecnológico. Pero vayamos por partes.
¿Qué es Seeing AI?
Seeing AI nació como un proyecto de investigación de vanguardia dentro de Microsoft Research y Microsoft Garage, liderado por Saqib Shaikh, un brillante desarrollador de la compañía que perdió la vista a los 7 años.
Se trata de una aplicación totalmente gratuita diseñada especialmente para usuarios ciegos o con baja visión. Actualmente se encuentra disponible de forma oficial tanto para el sistema operativo iOS como para Android.
¿Cómo funciona su motor de Inteligencia Artificial?
El corazón de Seeing AI es, sin duda, la cámara de nuestro dispositivo móvil. La aplicación utiliza modelos avanzados de inteligencia artificial para procesar lo que captura el lente y convertirlo en descripciones de audio en tiempo real. Su versatilidad es enorme, organizada ahora de forma muy limpia en sus tres pestañas principales:
- Pestaña de Lectura: Es la pantalla de inicio de la app. Aquí se procesa el texto breve (para leer carteles, letreros o etiquetas al instante) y los documentos impresos o libros enteros a través de una guía por voz.
- Pestaña de Descripciones: Diseñada para describir escenas completas a nuestro alrededor, reconocer personas (rostros, expresiones y edad estimada) y procesar imágenes o videos de nuestra galería o redes sociales.
- Pestaña Más: Aquí se agrupan las demás herramientas útiles de la aplicación, como la identificación de productos (mediante el escaneo de códigos de barras), el reconocimiento de divisas (billetes), así como los detectores de color y de luz.
Descripción de la imagen:
Una captura de pantalla real de la aplicación Seeing AI en un iPhone, mostrando la interfaz moderna con fondo negro de la pestaña "Más", la cual aparece seleccionada en color azul en la esquina inferior derecha. En la parte inferior también se aprecian las pestañas de "Lectura" y "Descripción". En la mitad inferior de la pantalla se despliega una cuadrícula limpia con siete iconos cuadrados y grises que representan las herramientas secundarias de la app: un código de barras para productos, una silueta humana para personas, un billete con el signo de pesos para divisas, una lupa para escenas, un cubo enfocado para objetos, una paleta de pintor para colores y un sol para el detector de luz. En la esquina superior izquierda se ubica el botón de Menú (tres líneas horizontales) y en la esquina derecha un botón de ayuda rápida con un signo de interrogación.
Cabe destacar que los ajustes y la configuración de la app no están escondidos en estas pestañas; se encuentran de forma muy accesible en el botón de Menú, ubicado en la parte superior izquierda de la pestaña principal de Lectura. Al abrirlo, tenemos acceso rápido a la sección de "Acerca de", "Ayuda" y a toda la configuración de la plataforma.
Es de destacar cómo ha evolucionado esta herramienta. Cuando recién se lanzó al mercado, su enfoque principal era el reconocimiento de textos y documentos impresos; sin embargo, con el avance de la inteligencia artificial y esta nueva organización de su interfaz, se ha transformado en una de las suites de accesibilidad más completas del mundo.
Ejemplos prácticos en mi día a día
La integración con el ecosistema móvil es sumamente cómoda. Por ejemplo, basta con activar el asistente de voz diciendo: "Oye Siri, abre Seeing AI". En cuanto la aplicación se ejecuta en su pestaña principal de Lectura, empieza a leer de forma automática cualquier escrito que tenga delante en su modo de texto breve.
Si dentro de esta misma pestaña pasamos a la opción de Documentos, la experiencia es fantástica. La app cuenta con una guía por voz que te ayuda a orientar la cámara, indicándote si debes mover el teléfono a la izquierda, arriba o abajo, hasta que detecta los bordes de la página. En ese momento toma la foto por sí sola y procesa el texto. Una vez terminada la lectura, podemos navegar por el documento con los comandos habituales de VoiceOver, ya sea explorando por caracteres, palabras o líneas.
Otro de sus puntos más fuertes está en la descripción de archivos externos dentro de la pestaña de Descripciones. Si estamos navegando por redes sociales o tenemos una foto o video en nuestra galería, basta con usar el menú de compartir y enviarlo a Seeing AI. En el caso de los videos es una maravilla tecnológica: la app es capaz de procesar clips de hasta 10 minutos. Al reproducirlo, el sistema hace pausas estratégicas cada cierto tiempo para describir detalladamente mediante voz lo que está ocurriendo en la escena visual, permitiéndonos seguir el hilo de la acción.
Para quienes se animen a probarla por primera vez, su interfaz dividida en estas tres grandes secciones es sumamente limpia, intuitiva y fácil de dominar. Además, un detalle muy amigable es que dentro de cada apartado cuenta con un botón de ayuda rápida incorporado, donde se explica su funcionamiento exacto y te ofrece consejos prácticos para obtener el mejor encuadre.
Conclusión
Seeing AI es una herramienta sumamente completa y, en lo personal, es una de las aplicaciones que más utilizo y que siempre recomiendo tener instalada en el teléfono. Desde luego, como toda tecnología basada en inteligencia artificial, no es perfecta y puede llegar a tener un margen de error (en mi experiencia, por ejemplo, ha tenido pequeños fallos puntuales al identificar ciertas divisas), pero el nivel de independencia y asistencia que aporta en las tareas cotidianas del día a día es sencillamente invaluable.
También te podría interesar:
- Cash Reader: Cómo identificar billetes con tu iPhone o Android
- ¿Qué es el Rotor de VoiceOver y cuáles son sus ventajas?
- Mi experiencia con Bitso: ¿Qué tan accesible es su app con VoiceOver?
No hay comentarios.:
Publicar un comentario