LLMs con visión

LLMs capaces de trabajar con imágenes, capturas y entradas multimodales además de texto.

15 herramientas en esta categoría.

Herramientas en esta categoría

Logo de ChatGPT ChatGPT

Escritura, reescritura y lluvia de ideas diarias · Investigación rápida y resúmenes desde archivos subidos

  • Freemium
  • cloud-llm
  • chat-assistant
  • multimodal
Logo de Claude Claude

Redacción de propuestas y comunicación con clientes · Edición de formato largo y refinamiento narrativo

  • Freemium
  • cloud-llm
  • chat-assistant
  • multimodal
Logo de DeepSeek-VL2 DeepSeek-VL2

Análisis privado de documentos visuales · Comprensión multimodal de documentos

  • Gratis
  • local-inference
  • open-weights
  • self-hosted
Logo de Gemini Gemini

Briefs de investigación y escaneos competitivos · Resumen de formato largo y generación de esquemas

  • Freemium
  • cloud-llm
  • chat-assistant
  • multimodal
Logo de Gemma 3 Gemma 3

Asistentes locales con procesos de cumplimiento manejables · Resumen y extracción multimodal

  • Gratis
  • local-inference
  • open-weights
  • on-device
Logo de GLM (Z.AI) GLM (Z.AI)

Asistentes de programación en la nube y redacción técnica · Soporte multilingüe para operaciones de negocio

  • Freemium
  • cloud-llm
  • chat-assistant
  • multimodal
Logo de InternVL 3.5 InternVL 3.5

Workflows internos de análisis multimodal · Builders experimentando con tareas visión-lenguaje

  • Gratis
  • local-inference
  • open-weights
  • self-hosted
Logo de Le Chat Le Chat

Redacción y edición multilingüe · Equipos que requieren controles explícitos para excluir entrenamiento

  • Freemium
  • cloud-llm
  • chat-assistant
  • multimodal
Logo de Llama 3.2 Vision Llama 3.2 Vision

Workflows locales de análisis de imagen + texto · Comprensión multimodal de documentos

  • Gratis
  • local-inference
  • open-weights
  • self-hosted
Logo de Llama 4 Llama 4

Pipelines de resumen de múltiples documentos grandes · Workflows internos de análisis multimodal

  • Gratis
  • local-inference
  • open-weights
  • multimodal
Logo de MiniCPM-V 2.6 MiniCPM-V 2.6

Análisis privado de documentos visuales · Workflows locales de asistentes multimodales

  • Gratis
  • local-inference
  • open-weights
  • self-hosted
Logo de Molmo Molmo

Comprensión multimodal de documentos · Análisis privado de documentos visuales

  • Gratis
  • local-inference
  • open-weights
  • self-hosted
Logo de Phi-3.5 Vision Instruct Phi-3.5 Vision Instruct

Comprensión multimodal de documentos · Análisis privado de documentos visuales

  • Gratis
  • local-inference
  • open-weights
  • on-device
Logo de Qwen Chat Qwen Chat

Redacción y reescritura multilingüe · Operaciones de asistentes en la nube con costos controlados

  • Freemium
  • cloud-llm
  • chat-assistant
  • multimodal
Logo de Qwen2.5 VL Qwen2.5 VL

Workflows locales de asistentes multimodales · Análisis privado de documentos visuales

  • Gratis
  • local-inference
  • open-weights
  • self-hosted

Categorías relacionadas

Ver todas las categorías · Ver todas las herramientas

Share This Page