L'option skip_build permet un meilleur contrôle du Block Factor (niveau d'agrégation).
Elle permet de diminuer le temps de construction du Modèle et également de diminuer la taille du Modèle.
Les Dimensions candidates à la fonction sont les suivantes :
- Distribution en "L" des données de la Dimension
Num input records = 7762131
Key Credit Type, num values = 6, max clump = (7379802)""
Key Refusal Code ID, num values = 29, max clump = (7379802)"0"
- Les valeurs de Dimension sur lesquelles on ne plongera pas fréquemment
CHAIN - _Independent
DRG - n.a.
skip_build={"dimension:value",…}
- spécifie le jeu de valeurs de Dimension à ignorer lors de l'agrégation des données en phase 6
- quand Builder agrège les données pour une valeur de Dimension donnée, il va utiliser un large Block Factor, optionnellement donné par skip_block_factor
- réduit la quantité de traitement effectué par Builder pour ces valeurs. Les plongées dans ces valeurs seront plus lentes.
Voici quelques exemples :
- skip_build={"*:"}, toutes les Dimensions, valeurs vides
- skip_build={"*:"},
skip_block_factor=10000000, - skip_build={"CHAIN:_Independent"},
- skip_build={ "DRG:n.a.",
"CPT:_Missing" },
Options d'optimisation (tunning) dans Visual Integrator
L'option skip_build est également paramétrable dans Visual Integrator au niveau de l'objet de sortie Builder.
Exemple :
Skip_build = {"*:",
"Delta Procedure:0 –",
"Dependent Type:Unknown",
"Remark 1 - Denial Reason:- Other" }
- Nombre d'enregistrements en entrée = 371 977
- 20 Dimensions, 9 champs Somme, 27 Champs Infos
- 41 Dimensions de détail , 9 champs Somme de détail, 0 champ Infos de détail
- Block Factor : 75 000
Avant | Après | |
Taille du Modèle | 3.2 Go | 2.1Go |
Temps de construction | 0:48:33 | 0:07:19 |