Tecnologia
La piattaforma tecnologica DocZoom
per AI on-premises
Un'architettura pronta per produzione che unisce ingestion, ricerca ibrida e agenti AI su stack open-source. Tutto nel tuo perimetro infrastrutturale.
ARCHITETTURA
6 Layer Modulari
Architettura completamente on-premises che garantisce modularità, scalabilità e manutenibilità.
FRONTEND LAYER
React + TypeScript
PWA-ready con Chat Interface, Document Viewer, Semantic Search
API GATEWAY
FastAPI + LangChain
REST API OpenAPI 3.0, JWT/SSO/SAML/MFA, LangGraph Search Agent
DOCUMENT PROCESSING
Rust Engine
Async ad alte prestazioni, 20+ formati, Chunking semantico, Queue Manager
AI ENGINE
PyTorch + vLLM
LLM, Embeddings, OCR, Reranker, NER - tutto locale su GPU
DATA LAYER
pgvector + PostgreSQL
Vector DB, MeiliSearch full-text, Redis cache, Object Storage NFS
INFRASTRUCTURE
Docker + NVIDIA Runtime
GPU Passthrough CUDA, DGX Spark / ZGX con GB10 Superchip
AI ENGINE
Modelli AI Integrati
Esclusivamente modelli open-source eseguiti localmente. Indipendenza da API esterne, pieno controllo sui dati.
LLM Chat & Reasoning
Nemotron-3-Nano-30B
Embeddings
BGE-M3
OCR
Surya
Reranker & NER
Llama-3.1-Nemotron-Nano-VL-8B
RAG ARCHITECTURE
Retrieval-Augmented Generation
Architettura RAG ibrida che combina ricerca semantica vettoriale e full-text per massimizzare precision e recall.
Retrieval Pipeline
Query Embedding
BGE-M3 genera embedding multilingue della query utente
Hybrid Search
Ricerca parallela su pgvector (semantica) e MeiliSearch (full-text)
Reranking
Llama-3.1-Nemotron-8B riordina i risultati per rilevanza contestuale
Context Assembly
Top-K chunks assemblati con metadati (file, pagina, score)
Generation Pipeline
Prompt Engineering
System prompt + context chunks + query utente con chain-of-thought
LLM Inference
Nemotron-3-Nano-30B via vLLM con GPU acceleration CUDA
Citation Extraction
NER per identificare citazioni e collegare ai documenti sorgente
Response Streaming
Output in streaming con token-by-token delivery via WebSocket
Multi-RAG Collections
Ogni collection è un namespace isolato con proprio indice vettoriale. Supporta tenant isolation per ambienti multi-cliente.
∞
Collections
HNSW
Index Algorithm
1536
Vector Dimensions
SICUREZZA & COMPLIANCE
Progettato per ambienti critici
AES-256 at rest, TLS 1.3 in transit. SSO/SAML, LDAP/AD, MFA. Audit trail completo per GDPR, SOC2, ISO 27001.
Data Sovereignty
I dati restano fisicamente nella sede del cliente, mai su server esterni.
GDPR Nativo
Nessun trasferimento dati extra-UE. Conformità automatica alle normative.
Air-Gap Ready
Funziona completamente offline. Ideale per ambienti ad alta sicurezza.
Zero Vendor Lock-in
Stack 100% open-source con piena portabilità e indipendenza.
PER CHI È
Tre profili che ne ottengono valore subito
La stessa base tecnologica, percorsi di adozione diversi in base all'obiettivo.
CTO / IT Manager
Vuoi integrare AI documentale ed email senza dipendere da API esterne e mantenendo governance completa.
Outcome: rollout tecnico controllato con stack portabile.
Compliance / Legal
Hai requisiti stringenti su data residency, audit trail e segregazione degli accessi per team e cliente.
Outcome: percorso di conformità più semplice e verificabile.
Operations / Customer Care
Devi ridurre il tempo perso tra documenti ed email e standardizzare risposte su knowledge base reali.
Outcome: processi più rapidi con meno escalation manuali.
PROOF & BENCHMARK
Numeri utili, non solo promesse
Metriche orientative su workload reali enterprise, utili per una prima valutazione tecnica.
< 500 ms
Latenza query semantica
Top-20 risultati su corpus fino a 1M chunk
1000+ doc/min
Throughput indicizzazione
Pipeline parallela su documenti misti (testo + OCR)
99.9%
Disponibilità servizio
Target con deployment ridondato on-premises
Le metriche dipendono da hardware, qualità dei documenti e policy di sicurezza. Durante la demo condividiamo metodologia, dataset di test e configurazione.
DOWNLOAD TECNICI
Scarica materiali tecnici
Lascia la tua email per sbloccare risorse operative per team IT, architettura e compliance.
One-Pager Architettura Verticale
Sintesi tecnica in singola slide per sessioni di review architetturale.
Disponibile dopo lo sblocco dei download.
Deep-Dive Tecnologico
Materiale architetturale dettagliato per CTO, team platform e sicurezza.
Disponibile dopo lo sblocco dei download.
Overview Prodotto & Piattaforma
Panoramica end-to-end da ingestion a risposte AI grounded con tracciabilità fonti.
Disponibile dopo lo sblocco dei download.
Pronto per una valutazione tecnica?
Il nostro team può organizzare un deep-dive sull'architettura e un POC nel tuo ambiente.