Tecnologia

La piattaforma tecnologica DocZoom
per AI on-premises

Un'architettura pronta per produzione che unisce ingestion, ricerca ibrida e agenti AI su stack open-source. Tutto nel tuo perimetro infrastrutturale.

< 500 ms
Query semantica
< 10 ms
Ricerca full-text
1000+ doc/min
Throughput
99.9%
Uptime

ARCHITETTURA

6 Layer Modulari

Architettura completamente on-premises che garantisce modularità, scalabilità e manutenibilità.

FRONTEND LAYER

React + TypeScript

PWA-ready con Chat Interface, Document Viewer, Semantic Search

API GATEWAY

FastAPI + LangChain

REST API OpenAPI 3.0, JWT/SSO/SAML/MFA, LangGraph Search Agent

DOCUMENT PROCESSING

Rust Engine

Async ad alte prestazioni, 20+ formati, Chunking semantico, Queue Manager

AI ENGINE

PyTorch + vLLM

LLM, Embeddings, OCR, Reranker, NER - tutto locale su GPU

DATA LAYER

pgvector + PostgreSQL

Vector DB, MeiliSearch full-text, Redis cache, Object Storage NFS

INFRASTRUCTURE

Docker + NVIDIA Runtime

GPU Passthrough CUDA, DGX Spark / ZGX con GB10 Superchip

AI ENGINE

Modelli AI Integrati

Esclusivamente modelli open-source eseguiti localmente. Indipendenza da API esterne, pieno controllo sui dati.

LLM Chat & Reasoning

Nemotron-3-Nano-30B

30B (A3B)NVIDIA License

Embeddings

BGE-M3

568MMIT License

OCR

Surya

-Apache 2.0

Reranker & NER

Llama-3.1-Nemotron-Nano-VL-8B

8BNVIDIA License

RAG ARCHITECTURE

Retrieval-Augmented Generation

Architettura RAG ibrida che combina ricerca semantica vettoriale e full-text per massimizzare precision e recall.

Retrieval Pipeline

1

Query Embedding

BGE-M3 genera embedding multilingue della query utente

2

Hybrid Search

Ricerca parallela su pgvector (semantica) e MeiliSearch (full-text)

3

Reranking

Llama-3.1-Nemotron-8B riordina i risultati per rilevanza contestuale

4

Context Assembly

Top-K chunks assemblati con metadati (file, pagina, score)

Generation Pipeline

1

Prompt Engineering

System prompt + context chunks + query utente con chain-of-thought

2

LLM Inference

Nemotron-3-Nano-30B via vLLM con GPU acceleration CUDA

3

Citation Extraction

NER per identificare citazioni e collegare ai documenti sorgente

4

Response Streaming

Output in streaming con token-by-token delivery via WebSocket

Multi-RAG Collections

Ogni collection è un namespace isolato con proprio indice vettoriale. Supporta tenant isolation per ambienti multi-cliente.

Collections

HNSW

Index Algorithm

1536

Vector Dimensions

SICUREZZA & COMPLIANCE

Progettato per ambienti critici

AES-256 at rest, TLS 1.3 in transit. SSO/SAML, LDAP/AD, MFA. Audit trail completo per GDPR, SOC2, ISO 27001.

Data Sovereignty

I dati restano fisicamente nella sede del cliente, mai su server esterni.

GDPR Nativo

Nessun trasferimento dati extra-UE. Conformità automatica alle normative.

Air-Gap Ready

Funziona completamente offline. Ideale per ambienti ad alta sicurezza.

Zero Vendor Lock-in

Stack 100% open-source con piena portabilità e indipendenza.

PER CHI È

Tre profili che ne ottengono valore subito

La stessa base tecnologica, percorsi di adozione diversi in base all'obiettivo.

CTO / IT Manager

Vuoi integrare AI documentale ed email senza dipendere da API esterne e mantenendo governance completa.

Outcome: rollout tecnico controllato con stack portabile.

Compliance / Legal

Hai requisiti stringenti su data residency, audit trail e segregazione degli accessi per team e cliente.

Outcome: percorso di conformità più semplice e verificabile.

Operations / Customer Care

Devi ridurre il tempo perso tra documenti ed email e standardizzare risposte su knowledge base reali.

Outcome: processi più rapidi con meno escalation manuali.

PROOF & BENCHMARK

Numeri utili, non solo promesse

Metriche orientative su workload reali enterprise, utili per una prima valutazione tecnica.

< 500 ms

Latenza query semantica

Top-20 risultati su corpus fino a 1M chunk

1000+ doc/min

Throughput indicizzazione

Pipeline parallela su documenti misti (testo + OCR)

99.9%

Disponibilità servizio

Target con deployment ridondato on-premises

Le metriche dipendono da hardware, qualità dei documenti e policy di sicurezza. Durante la demo condividiamo metodologia, dataset di test e configurazione.

DOWNLOAD TECNICI

Scarica materiali tecnici

Lascia la tua email per sbloccare risorse operative per team IT, architettura e compliance.

Con l'invio accetti di essere ricontattato dal team DocZoom.

One-Pager Architettura Verticale

Sintesi tecnica in singola slide per sessioni di review architetturale.

Disponibile dopo lo sblocco dei download.

Deep-Dive Tecnologico

Materiale architetturale dettagliato per CTO, team platform e sicurezza.

Disponibile dopo lo sblocco dei download.

Overview Prodotto & Piattaforma

Panoramica end-to-end da ingestion a risposte AI grounded con tracciabilità fonti.

Disponibile dopo lo sblocco dei download.

Pronto per una valutazione tecnica?

Il nostro team può organizzare un deep-dive sull'architettura e un POC nel tuo ambiente.