LLMs con visión

LLMs capaces de trabajar con imágenes, capturas y entradas multimodales además de texto.

23 herramientas en esta categoría.

Herramientas en esta categoría

Logo de ChatGPT ChatGPT

Escritura, reescritura y lluvia de ideas diarias · Investigación rápida y resúmenes desde archivos subidos

  • Freemium
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Claude Claude

Redacción de propuestas y comunicación con clientes · Edición de formato largo y refinamiento narrativo

  • Freemium
  • Para solopreneurs
  • Para pequeñas empresas
Logo de DeepSeek-VL2 DeepSeek-VL2

Análisis privado de documentos visuales · Comprensión multimodal de documentos

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Gemini Gemini

Briefs de investigación y escaneos competitivos · Resumen de formato largo y generación de esquemas

  • Freemium
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Gemma 3 Gemma 3

Asistentes locales con procesos de cumplimiento manejables · Resumen y extracción multimodal

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Gemma 3n Gemma 3n

Workflows locales de asistentes multimodales · Tareas de asistente visual sensibles a la privacidad

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Gemma 4 Gemma 4

Workflows locales de asistentes multimodales · Comprensión multimodal de documentos

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de GLM (Z.AI) GLM (Z.AI)

Acceso alojado a GLM para cargas de texto y visión · Asistentes de programación en la nube y redacción técnica

  • Freemium
  • Para solopreneurs
  • Para pequeñas empresas
Logo de GLM-5V-Turbo GLM-5V-Turbo

Ayuda de programación basada en capturas de pantalla · Workflows de agentes para GUI y navegador

  • Freemium
  • Para solopreneurs
  • Para pequeñas empresas
Logo de InternVL 3.5 InternVL 3.5

Workflows internos de análisis multimodal · Builders experimentando con tareas visión-lenguaje

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Kimi K2.6 Kimi K2.6

Workflows locales de programación agéntica · Construcción local de asistentes multimodales

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Le Chat Le Chat

Redacción y edición multilingüe · Equipos que requieren controles explícitos para excluir entrenamiento

  • Freemium
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Llama 3.2 Vision Llama 3.2 Vision

Workflows locales de análisis de imagen + texto · Comprensión multimodal de documentos

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Llama 4 Llama 4

Pipelines de resumen de múltiples documentos grandes · Workflows internos de análisis multimodal

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de MiniCPM-V 2.6 MiniCPM-V 2.6

Análisis privado de documentos visuales · Workflows locales de asistentes multimodales

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Mistral Small 4 Mistral Small 4

Workflows locales de asistentes multimodales · Comprensión multimodal de documentos

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Molmo Molmo

Comprensión multimodal de documentos · Análisis privado de documentos visuales

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Phi-3.5 Vision Instruct Phi-3.5 Vision Instruct

Comprensión multimodal de documentos · Análisis privado de documentos visuales

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Qwen Chat Qwen Chat

Redacción y reescritura multilingüe · Operaciones de asistentes en la nube con costos controlados

  • Freemium
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Qwen2.5 VL Qwen2.5 VL

Workflows locales de asistentes multimodales · Análisis privado de documentos visuales

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Qwen3.5 Qwen3.5

Workflows locales de asistentes multimodales · Análisis privado de documentos visuales

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Qwen3.6 Qwen3.6

Equipos que eligen entre Qwen alojado y Qwen local · Workflows de programación agéntica

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas
Logo de Qwen3.6-35B-A3B Qwen3.6-35B-A3B

Workflows locales de programación agéntica · Construcción local de asistentes multimodales

  • Gratis
  • Para solopreneurs
  • Para pequeñas empresas

Categorías relacionadas

Ver todas las categorías · Ver todas las herramientas

Share This Page