CertiSigma

AI · Governance

Documenta dataset, policy e decisioni senza esporre il dataset

I workflow di AI governance richiedono evidenze sulla composizione dei dataset, sulle esclusioni, sulle decisioni di policy, sui riferimenti di licenza e sulla storia delle versioni. Spesso questi materiali sono sensibili o non condivisibili: dataset proprietari, output di model training, log decisionali che non possono uscire dal perimetro.

Per chi è pensato

  • AI governance team
  • Compliance e GRC
  • Legal team su modelli AI
  • Data scientist con responsabilità di documentazione
  • Organizzazioni che usano dataset proprietari o sensibili in training o tuning
  • Auditor interni su processi AI / ML

Input tipici

  • Dataset manifest (hash, conteggi, sezioni)
  • Policy report
  • Decision log
  • Training run metadata
  • Exclusion list
  • License references
  • Version history
  • Documentazione di governance del modello

Output CertiSigma

  • Dataset manifest evidence (hash sul manifest, NON sul dataset)
  • Policy report evidence
  • Decision log evidence
  • Version history evidence
  • Training run evidence
  • Exclusion evidence
  • Bundle verificabile da terzi senza accesso al dataset

Evidenza, non giudizio sul dataset

CertiSigma non giudica la liceità, la qualità o l'adeguatezza del dataset. Aiuta a preservare evidenze verificabili su ciò che l'organizzazione dichiara di aver incluso, escluso o documentato, senza richiedere alla controparte di accedere al dataset originale.

Il modello è content-blind: CertiSigma riceve solo digest e manifest, mai contenuti grezzi. Questo permette di mantenere il dataset proprietario o sensibile fuori da terze parti, preservando comunque una traccia datata di policy, decisioni e perimetro del training.

Cosa CertiSigma NON prova qui

  • Che il dataset sia lecito, eticamente accettabile o conforme a specifiche normative AI
  • Che le esclusioni dichiarate siano state effettivamente applicate durante il training
  • Che il modello derivato dal dataset non incorpori bias o output problematici
  • Che la licenza dichiarata sui dati di terze parti sia valida o sufficiente per il caso d'uso
  • Che il manifest descriva fedelmente il dataset (se il manifest è errato, CertiSigma attesta l'errore datato, non lo corregge)