LLMs con visión

LLMs capaces de trabajar con imágenes, capturas y entradas multimodales además de texto.

23 herramientas en esta categoría.

Herramientas en esta categoría

ChatGPT

Escritura, reescritura y lluvia de ideas diarias · Investigación rápida y resúmenes desde archivos subidos

Freemium
Para solopreneurs
Para pequeñas empresas

Claude

Redacción de propuestas y comunicación con clientes · Edición de formato largo y refinamiento narrativo

Freemium
Para solopreneurs
Para pequeñas empresas

DeepSeek-VL2

Análisis privado de documentos visuales · Comprensión multimodal de documentos

Gratis
Para solopreneurs
Para pequeñas empresas

Gemini

Briefs de investigación y escaneos competitivos · Resumen de formato largo y generación de esquemas

Freemium
Para solopreneurs
Para pequeñas empresas

Gemma 3

Asistentes locales con procesos de cumplimiento manejables · Resumen y extracción multimodal

Gratis
Para solopreneurs
Para pequeñas empresas

Gemma 3n

Workflows locales de asistentes multimodales · Tareas de asistente visual sensibles a la privacidad

Gratis
Para solopreneurs
Para pequeñas empresas

Gemma 4

Workflows locales de asistentes multimodales · Comprensión multimodal de documentos

Gratis
Para solopreneurs
Para pequeñas empresas

GLM (Z.AI)

Acceso alojado a GLM para cargas de texto y visión · Asistentes de programación en la nube y redacción técnica

Freemium
Para solopreneurs
Para pequeñas empresas

GLM-5V-Turbo

Ayuda de programación basada en capturas de pantalla · Workflows de agentes para GUI y navegador

Freemium
Para solopreneurs
Para pequeñas empresas

InternVL 3.5

Workflows internos de análisis multimodal · Builders experimentando con tareas visión-lenguaje

Gratis
Para solopreneurs
Para pequeñas empresas

Kimi K2.6

Workflows locales de programación agéntica · Construcción local de asistentes multimodales

Gratis
Para solopreneurs
Para pequeñas empresas

Le Chat

Redacción y edición multilingüe · Equipos que requieren controles explícitos para excluir entrenamiento

Freemium
Para solopreneurs
Para pequeñas empresas

Llama 3.2 Vision

Workflows locales de análisis de imagen + texto · Comprensión multimodal de documentos

Gratis
Para solopreneurs
Para pequeñas empresas

Llama 4

Pipelines de resumen de múltiples documentos grandes · Workflows internos de análisis multimodal

Gratis
Para solopreneurs
Para pequeñas empresas

MiniCPM-V 2.6

Análisis privado de documentos visuales · Workflows locales de asistentes multimodales

Gratis
Para solopreneurs
Para pequeñas empresas

Mistral Small 4

Workflows locales de asistentes multimodales · Comprensión multimodal de documentos

Gratis
Para solopreneurs
Para pequeñas empresas

Molmo

Comprensión multimodal de documentos · Análisis privado de documentos visuales

Gratis
Para solopreneurs
Para pequeñas empresas

Phi-3.5 Vision Instruct

Comprensión multimodal de documentos · Análisis privado de documentos visuales

Gratis
Para solopreneurs
Para pequeñas empresas

Qwen Chat

Redacción y reescritura multilingüe · Operaciones de asistentes en la nube con costos controlados

Freemium
Para solopreneurs
Para pequeñas empresas

Qwen2.5 VL

Workflows locales de asistentes multimodales · Análisis privado de documentos visuales

Gratis
Para solopreneurs
Para pequeñas empresas

Qwen3.5

Workflows locales de asistentes multimodales · Análisis privado de documentos visuales

Gratis
Para solopreneurs
Para pequeñas empresas

Qwen3.6

Equipos que eligen entre Qwen alojado y Qwen local · Workflows de programación agéntica

Gratis
Para solopreneurs
Para pequeñas empresas

Qwen3.6-35B-A3B

Workflows locales de programación agéntica · Construcción local de asistentes multimodales

Gratis
Para solopreneurs
Para pequeñas empresas

Categorías relacionadas

Ver todas las categorías · Ver todas las herramientas

LLMs con visión

Herramientas en esta categoría

Categorías relacionadas

Share This Page