Question 1

Quelle différence entre IA on-premise et IA cloud suisse ?

Accepted Answer

Un hébergement IA Suisse chez un cloud provider local (ex : Exoscale, infomaniak) réduit le risque géographique mais le fournisseur a techniquement accès aux données et aux modèles. Un déploiement on-premise signifie que les serveurs sont physiquement dans vos locaux ou dans un datacenter sous votre contrat direct : vous seul avez accès aux données, aux logs et aux modèles. Pour les entreprises soumises au secret bancaire, médical ou professionnel, c'est souvent la seule option acceptable.

Question 2

Les modèles open-weights sont-ils aussi performants que GPT-4 ou Claude ?

Accepted Answer

Sur des tâches métier bien délimitées — extraction d'information, classification, génération de texte structuré, Q&R sur corpus — les modèles comme DeepSeek V4, Mistral Medium 3.5 ou Qwen 3.6 sont aujourd'hui au coude-à-coude avec les modèles propriétaires sur les benchmarks publics 2026. Sur certaines tâches de raisonnement complexe ou de programmation très spécialisée, les modèles propriétaires gardent un léger avantage situationnel. Notre rôle est d'évaluer objectivement les deux options sur votre cas d'usage réel, avec des métriques concrètes, avant de recommander.

Question 3

Quel matériel faut-il prévoir pour un LLM local entreprise ?

Accepted Answer

Un llm local entreprise de 7 milliards de paramètres quantifié tient sur une seule carte GPU NVIDIA A10G (24 Go VRAM) avec une latence de 50 à 150 ms par requête. Un modèle de 70 milliards demande 2 à 4 GPU A100 (80 Go) en tensor parallelism. Pour les entreprises sans infrastructure GPU existante, nous pouvons dimensionner et sourcer le matériel, le configurer et le maintenir. Le coût d'un serveur GPU dédié est amorti en 12 à 24 mois comparé aux coûts d'API cloud sur des volumes élevés.

Question 4

Comment assurer la conformité LPD avec une IA interne ?

Accepted Answer

La LPD (Loi sur la Protection des Données) impose notamment la transparence sur le traitement, la minimisation des données et la sécurité technique. Un déploiement on-premise répond structurellement aux exigences de localisation et de contrôle d'accès. Nous aidons à documenter le registre des traitements, à configurer les droits d'accès et les logs d'audit, et à rédiger les notices d'information si l'IA traite des données personnelles.

Question 5

Peut-on combiner modèles locaux et APIs cloud selon le type de requête ?

Accepted Answer

Oui — c'est souvent l'architecture optimale. Les requêtes sensibles (données clients, documents confidentiels) restent traitées en local par un modèle ia open source ou ia locale. Les requêtes génériques ou moins sensibles peuvent passer par une API cloud pour bénéficier de modèles plus puissants. Un routeur de requêtes basé sur la classification du contenu et des métadonnées permet d'automatiser ce dispatching. Nous appelons cette architecture 'hybrid sovereign' et c'est aujourd'hui notre recommandation par défaut pour la plupart des entreprises.

IA souveraine en Suisse — déploiements on-premise

Quatre piliers de la souveraineté.
Une même architecture.

Données qui ne sortent pas

Modèles libres performants

Conformité structurelle

Hybrid sovereign · routeur de requêtes

Cadrage, benchmark, déploiement souverain.
Conformité native, pas contractuelle.

Cadrage souverain

Benchmark sur vos données

Déploiement & gouvernance

Nos modèles open-weights
et l'infra on-premise.

Questions fréquentes.

Services connexes.

Un cas d'usage en tête ?
On en parle.

Quatre piliers de la souveraineté.Une même architecture.